AI Infra Dao

AI Infra Brief|主权 AI 基建、Agent 基础设施与边缘优先(2026.04.02)

2026 年 4 月 2 日,主权 AI 基建迎来巨额资本注入,Agent 编排和身份层成为基础设施核心,边缘优先和开源工具正在降低 AI 部署门槛。

🧭 核心速览

🇪🇺 Mistral €830M 部署 13,800 块 GB300,巴黎数据中心 Q2 上线

💵 Microsoft $55B 投资新加坡 AI 与云算力

🤝 NVIDIA $20B 入股 Marvell,对齐定制 XPU 与 NVLink Fusion 网络

🦘 Sharon AI $12.5B 协议部署澳洲 8K B300 集群

🚀 AMD MI355X 突破百万 token/秒,MLPerf 6.0 性能提升 3.1 倍

🔧 Cloudflare 发布 EmDash 无服务器 TypeScript CMS

🧠 Claude Code 泄露揭示生产 Agent 编排模式

算力与云基础设施

🇪🇺 Mistral €830M 部署 13,800 块 GB300,巴黎数据中心 Q2 上线

根据 IOplus 分析,Mistral AI 获得 8.3 亿欧元债务融资,采购 13,800 块 NVIDIA GB300 GPU,在巴黎地区建设数据中心,预计 2026 年 Q2 上线,目标 44 MW 电力容量,推进欧洲算力主权。

13,800 块 GB300 是当前规模最大的欧洲独立 GPU 集群之一,标志着欧洲从模型竞争转向基础设施竞争。44 MW 电力容量为后续扩容预留了空间。

💵 Microsoft $55B 投资新加坡 AI 与云算力

根据 Microsoft News 公告,Microsoft 承诺到 2029 年投入 55 亿美元扩展新加坡 AI 和云算力,同时推出 Elevate 项目覆盖学生、教育者和非营利组织。

东南亚是 AI 基础设施的关键增长市场。Microsoft 的大规模投资反映了亚太地区在全球 AI 算力布局中的战略地位。

🤝 NVIDIA $20B 入股 Marvell,对齐定制 XPU 与网络栈

根据 TelecomTV 报道,NVIDIA 向 Marvell 投资 20 亿美元,以对齐定制 XPU 和 NVLink Fusion 兼容网络,匹配其 AI 工厂和 AI-RAN 技术栈。

NVIDIA 通过投资 Marvell 加固定制芯片生态,NVLink Fusion 的兼容性将影响未来数据中心互连架构的选择。

🦘 Sharon AI $12.5B 协议部署澳洲 8K B300 集群

根据 BusinessWire 报道,Sharon AI 签署五年 12.5 亿美元协议,在澳大利亚部署 8,000 块 B300 集群,预计 Q3 2026 开始产生收入。

南半球的大规模 GPU 集群将改善全球 AI 算力的地理分布,为亚太用户提供更低延迟的推理服务。

模型推理与优化

🚀 AMD MI355X 突破百万 token/秒,MLPerf 6.0 性能提升 3.1 倍

根据 TechPowerUp 报道,AMD Instinct MI355X 在 MLPerf Inference 6.0 中超过 100 万 token/秒(如 Llama 2 70B 上 1,042,110 tok/s),相比 MI325X 吞吐提升 3.1 倍。

百万 token/秒的吞吐标志着推理硬件进入新量级。AMD 的追赶步伐加快,GPU 推理市场的竞争将进一步降低单位推理成本。

Agent 基础设施

🧠 Claude Code 泄露揭示生产 Agent 编排模式

根据 Hacker NewsReddit 讨论,Claude Code 的泄露揭示了生产级 Agent 的编排模式,强调协调、记忆和状态管理而非模型选择才是驱动能力的关键。

Agent 的核心竞争力不在模型本身,而在编排层的工程质量。记忆管理、状态持久化和多步骤协调是区分实验原型和生产系统的关键。

🔐 Alien 融资 710 万美元构建人与 Agent 身份基础设施

根据 SiliconANGLE 报道,Alien 融资 710 万美元,通过 Alien ID 和 Agent ID 构建人类和 AI Agent 的身份基础设施。

随着 Agent 在企业中普及,身份认证和权限管理成为必需的基础设施层。统一的人/Agent 身份体系将简化访问控制和安全治理。

💼 Coder 完成 9000 万美元 C 轮,扩展安全企业 AI 开发

根据 TradingView 报道,Coder 完成 9000 万美元 C 轮融资(KKR 领投),旨在扩展安全的企业 AI 开发环境。

企业 AI 开发的安全沙箱需求正在增长,Coder 的方案将代码环境与 AI 工具链整合在受控的基础设施中运行。

开源生态

🔧 Hugging Face 发布 TRL v1.0,统一后训练配置

根据 StartupFortune 报道,Hugging Face 发布 TRL v1.0,提供统一配置和 CLI 工具,将标准化的大规模后训练从"艺术"变为"工程"。

后训练流程的标准化是降低微调门槛的关键。统一配置意味着不同团队可以复用最佳实践,加速模型迭代。

⚡ Training Hub v0.4.0 集成 Unsloth,单 24GB GPU 可微调 7B 模型

根据 GitHub 项目,Training Hub v0.4.0 集成 Unsloth 进行 LoRA/QLoRA 训练,VRAM 降低 70%,训练速度提升 2 倍,实现在单块 24GB GPU 上微调 7B 模型。

在消费级 GPU 上微调大模型大大降低了中小企业和研究者的参与门槛,加速了开源生态的创新速度。

🤖 OpenClaw v2026.4.1 新增多 Agent 路由和语音支持

根据 GitHub 项目,OpenClaw v2026.4.1 增加多 Agent 路由、语音交互、Live Canvas 和 Windows 支持。

多 Agent 路由是复杂工作流的基础能力。OpenClaw 的快速迭代显示开源 Agent 框架正在快速吸收生产需求。

🐍 Claw Code Agent 用 Python 重现 Claude Code Agent 架构

根据 GitHub 项目,Claw Code Agent 用 Python 重新实现 Claude Code 的 Agent 架构,支持本地模型运行。

将 Claude Code 的架构模式开源化有助于社区理解生产级 Agent 的设计模式,推动本地化部署。

👁️ OpenEyes 在 Jetson Orin Nano 上实现边缘端 VLA 视觉

根据 GitHub 项目,OpenEyes 在 Jetson Orin Nano 上完全在边缘端运行基于 VLA 的视觉系统。

边缘端部署对低延迟和隐私敏感场景至关重要。在消费级边缘设备上运行视觉 - 语言 - 动作模型标志着嵌入式 AI 的新阶段。

企业级 AI 部署

🔧 Cloudflare 发布 EmDash 无服务器 CMS

根据 Cloudflare Blog 报道,Cloudflare 推出 EmDash,一个无服务器 TypeScript CMS,支持 Dynamic Workers 沙箱、内置 MCP 服务器和 x402 变现机制。

EmDash 将 CMS 从传统 LAMP 架构迁移到无服务器边缘平台,内置 MCP 服务器使 AI Agent 可以原生接入内容管理流程。

📊 Oracle NL2SQL Agent 通过 MCP 实现自然语言数据库查询

根据 Oracle Blogs 报道,Oracle 的 NL2SQL Agent 使用 MCP 服务器暴露 schema 和执行工具,实现受治理的自然语言数据库访问。

将自然语言查询通过 MCP 协议与数据库治理结合,是 AI 辅助数据分析在企业场景中的重要落地路径。

合作与转型

🔄 Bitfarms 更名为 Keel Infrastructure,总部迁至美国转型 AI

根据 TipRanks 报道,Bitfarms 更名为 Keel Infrastructure,将总部迁至美国,转向 AI 基础设施方向。

加密矿业公司向 AI 基础设施转型已成为趋势,电力和场地资源可以从挖矿无缝迁移到 GPU 计算。

🛡️ SentinelOne 与 Google Cloud 达成多年 AI 安全合作

根据 TechAfricaNews 报道,SentinelOne 和 Google Cloud 宣布多年 AI 安全合作,支持区域数据主权选项。

AI 安全需要结合威胁情报和云基础设施的深度集成。区域数据主权支持对合规要求高的企业至关重要。

硬件与挑战

💾 DRAM 价格上涨挤压爱好者 SBC 市场

根据 Jeff Geerling 博客,DRAM 价格上涨正在挤压爱好者单板计算机市场,16GB Raspberry Pi 5 售价达 $299.99,推动用户转向旧硬件和微控制器。

内存成本直接影响边缘 AI 设备的可及性。AI 推理向边缘迁移的进程可能因硬件成本而放缓。

🚀 SpaceX 传闻提交 IPO 申请,目标估值 $500-750 亿

根据 NYT 报道,SpaceX 据报提交 IPO 申请,目标估值 500-750 亿美元,部分资金将用于建设最多百万颗卫星的轨道 AI 数据中心。

SpaceX 的 IPO 如果成行,将为轨道 AI 基础设施注入前所未有的资本,卫星网络与 GPU 计算的结合将重新定义"边缘"的含义。

🔍 Infra Insights

本日核心趋势:主权 AI 基建进入百亿美元级别竞赛Agent 编排层成为基础设施核心边缘优先策略从概念走向实际部署

本周资本流动的规模和方向清晰表明:AI 基础设施建设已进入全球竞赛阶段。Mistral 的 8.3 亿欧元、Microsoft 的 55 亿美元、NVIDIA 对 Marvell 的 20 亿美元投资、Sharon AI 的 12.5 亿美元协议——这些数字不再是单一事件,而是系统性趋势。欧洲、亚太、澳洲正在同步建设 GPU 集群,主权算力的地理分布正在从"集中"转向"多极"。AMD MI355X 突破百万 token/秒则提醒我们,推理硬件的性能竞赛远未结束。在软件层面,Claude Code 泄露揭示的编排模式、Cloudflare EmDash 的无服务器 CMS、Oracle 的 NL2SQL Agent 都指向同一个方向:Agent 的竞争力不在模型本身,而在编排、治理和工具链的工程质量。开源生态方面,TRL v1.0、Training Hub、OpenClaw、Claw Code Agent 和 OpenEyes 的快速迭代显示社区正在从"能不能用"转向"生产级可用"。DRAM 价格上涨和 SpaceX IPO 则从正反两面揭示了硬件基础设施的现实约束和未来潜力——边缘 AI 的普及既受限于硬件成本,也可能被卫星网络重新定义。