AI Infra Brief｜主权 AI 基建、Agent 基础设施与边缘优先（2026.04.02）

2026 年 4 月 2 日，主权 AI 基建迎来巨额资本注入，Agent 编排和身份层成为基础设施核心，边缘优先和开源工具正在降低 AI 部署门槛。

🧭 核心速览

🇪🇺 Mistral €830M 部署 13,800 块 GB300，巴黎数据中心 Q2 上线

💵 Microsoft $55B 投资新加坡 AI 与云算力

🤝 NVIDIA $20B 入股 Marvell，对齐定制 XPU 与 NVLink Fusion 网络

🦘 Sharon AI $12.5B 协议部署澳洲 8K B300 集群

🚀 AMD MI355X 突破百万 token/秒，MLPerf 6.0 性能提升 3.1 倍

🔧 Cloudflare 发布 EmDash 无服务器 TypeScript CMS

🧠 Claude Code 泄露揭示生产 Agent 编排模式

算力与云基础设施

🇪🇺 Mistral €830M 部署 13,800 块 GB300，巴黎数据中心 Q2 上线

根据 IOplus 分析，Mistral AI 获得 8.3 亿欧元债务融资，采购 13,800 块 NVIDIA GB300 GPU，在巴黎地区建设数据中心，预计 2026 年 Q2 上线，目标 44 MW 电力容量，推进欧洲算力主权。

13,800 块 GB300 是当前规模最大的欧洲独立 GPU 集群之一，标志着欧洲从模型竞争转向基础设施竞争。44 MW 电力容量为后续扩容预留了空间。

💵 Microsoft $55B 投资新加坡 AI 与云算力

根据 Microsoft News 公告，Microsoft 承诺到 2029 年投入 55 亿美元扩展新加坡 AI 和云算力，同时推出 Elevate 项目覆盖学生、教育者和非营利组织。

东南亚是 AI 基础设施的关键增长市场。Microsoft 的大规模投资反映了亚太地区在全球 AI 算力布局中的战略地位。

🤝 NVIDIA $20B 入股 Marvell，对齐定制 XPU 与网络栈

根据 TelecomTV 报道，NVIDIA 向 Marvell 投资 20 亿美元，以对齐定制 XPU 和 NVLink Fusion 兼容网络，匹配其 AI 工厂和 AI-RAN 技术栈。

NVIDIA 通过投资 Marvell 加固定制芯片生态，NVLink Fusion 的兼容性将影响未来数据中心互连架构的选择。

🦘 Sharon AI $12.5B 协议部署澳洲 8K B300 集群

根据 BusinessWire 报道，Sharon AI 签署五年 12.5 亿美元协议，在澳大利亚部署 8,000 块 B300 集群，预计 Q3 2026 开始产生收入。

南半球的大规模 GPU 集群将改善全球 AI 算力的地理分布，为亚太用户提供更低延迟的推理服务。

模型推理与优化

🚀 AMD MI355X 突破百万 token/秒，MLPerf 6.0 性能提升 3.1 倍

根据 TechPowerUp 报道，AMD Instinct MI355X 在 MLPerf Inference 6.0 中超过 100 万 token/秒（如 Llama 2 70B 上 1,042,110 tok/s），相比 MI325X 吞吐提升 3.1 倍。

百万 token/秒的吞吐标志着推理硬件进入新量级。AMD 的追赶步伐加快，GPU 推理市场的竞争将进一步降低单位推理成本。

Agent 基础设施

🧠 Claude Code 泄露揭示生产 Agent 编排模式

根据 Hacker News 和 Reddit 讨论，Claude Code 的泄露揭示了生产级 Agent 的编排模式，强调协调、记忆和状态管理而非模型选择才是驱动能力的关键。

Agent 的核心竞争力不在模型本身，而在编排层的工程质量。记忆管理、状态持久化和多步骤协调是区分实验原型和生产系统的关键。

🔐 Alien 融资 710 万美元构建人与 Agent 身份基础设施

根据 SiliconANGLE 报道，Alien 融资 710 万美元，通过 Alien ID 和 Agent ID 构建人类和 AI Agent 的身份基础设施。

随着 Agent 在企业中普及，身份认证和权限管理成为必需的基础设施层。统一的人/Agent 身份体系将简化访问控制和安全治理。

💼 Coder 完成 9000 万美元 C 轮，扩展安全企业 AI 开发

根据 TradingView 报道，Coder 完成 9000 万美元 C 轮融资（KKR 领投），旨在扩展安全的企业 AI 开发环境。

企业 AI 开发的安全沙箱需求正在增长，Coder 的方案将代码环境与 AI 工具链整合在受控的基础设施中运行。

开源生态

🔧 Hugging Face 发布 TRL v1.0，统一后训练配置

根据 StartupFortune 报道，Hugging Face 发布 TRL v1.0，提供统一配置和 CLI 工具，将标准化的大规模后训练从"艺术"变为"工程"。

后训练流程的标准化是降低微调门槛的关键。统一配置意味着不同团队可以复用最佳实践，加速模型迭代。

⚡ Training Hub v0.4.0 集成 Unsloth，单 24GB GPU 可微调 7B 模型

根据 GitHub 项目，Training Hub v0.4.0 集成 Unsloth 进行 LoRA/QLoRA 训练，VRAM 降低 70%，训练速度提升 2 倍，实现在单块 24GB GPU 上微调 7B 模型。

在消费级 GPU 上微调大模型大大降低了中小企业和研究者的参与门槛，加速了开源生态的创新速度。

🤖 OpenClaw v2026.4.1 新增多 Agent 路由和语音支持

根据 GitHub 项目，OpenClaw v2026.4.1 增加多 Agent 路由、语音交互、Live Canvas 和 Windows 支持。

多 Agent 路由是复杂工作流的基础能力。OpenClaw 的快速迭代显示开源 Agent 框架正在快速吸收生产需求。

🐍 Claw Code Agent 用 Python 重现 Claude Code Agent 架构

根据 GitHub 项目，Claw Code Agent 用 Python 重新实现 Claude Code 的 Agent 架构，支持本地模型运行。

将 Claude Code 的架构模式开源化有助于社区理解生产级 Agent 的设计模式，推动本地化部署。

👁️ OpenEyes 在 Jetson Orin Nano 上实现边缘端 VLA 视觉

根据 GitHub 项目，OpenEyes 在 Jetson Orin Nano 上完全在边缘端运行基于 VLA 的视觉系统。

边缘端部署对低延迟和隐私敏感场景至关重要。在消费级边缘设备上运行视觉 - 语言 - 动作模型标志着嵌入式 AI 的新阶段。

企业级 AI 部署

🔧 Cloudflare 发布 EmDash 无服务器 CMS

根据 Cloudflare Blog 报道，Cloudflare 推出 EmDash，一个无服务器 TypeScript CMS，支持 Dynamic Workers 沙箱、内置 MCP 服务器和 x402 变现机制。

EmDash 将 CMS 从传统 LAMP 架构迁移到无服务器边缘平台，内置 MCP 服务器使 AI Agent 可以原生接入内容管理流程。

📊 Oracle NL2SQL Agent 通过 MCP 实现自然语言数据库查询

根据 Oracle Blogs 报道，Oracle 的 NL2SQL Agent 使用 MCP 服务器暴露 schema 和执行工具，实现受治理的自然语言数据库访问。

将自然语言查询通过 MCP 协议与数据库治理结合，是 AI 辅助数据分析在企业场景中的重要落地路径。

合作与转型

🔄 Bitfarms 更名为 Keel Infrastructure，总部迁至美国转型 AI

根据 TipRanks 报道，Bitfarms 更名为 Keel Infrastructure，将总部迁至美国，转向 AI 基础设施方向。

加密矿业公司向 AI 基础设施转型已成为趋势，电力和场地资源可以从挖矿无缝迁移到 GPU 计算。

🛡️ SentinelOne 与 Google Cloud 达成多年 AI 安全合作

根据 TechAfricaNews 报道，SentinelOne 和 Google Cloud 宣布多年 AI 安全合作，支持区域数据主权选项。

AI 安全需要结合威胁情报和云基础设施的深度集成。区域数据主权支持对合规要求高的企业至关重要。

硬件与挑战

💾 DRAM 价格上涨挤压爱好者 SBC 市场

根据 Jeff Geerling 博客，DRAM 价格上涨正在挤压爱好者单板计算机市场，16GB Raspberry Pi 5 售价达 $299.99，推动用户转向旧硬件和微控制器。

内存成本直接影响边缘 AI 设备的可及性。AI 推理向边缘迁移的进程可能因硬件成本而放缓。

🚀 SpaceX 传闻提交 IPO 申请，目标估值 $500-750 亿

根据 NYT 报道，SpaceX 据报提交 IPO 申请，目标估值 500-750 亿美元，部分资金将用于建设最多百万颗卫星的轨道 AI 数据中心。

SpaceX 的 IPO 如果成行，将为轨道 AI 基础设施注入前所未有的资本，卫星网络与 GPU 计算的结合将重新定义"边缘"的含义。

🔍 Infra Insights

本日核心趋势：主权 AI 基建进入百亿美元级别竞赛、Agent 编排层成为基础设施核心、边缘优先策略从概念走向实际部署。

本周资本流动的规模和方向清晰表明：AI 基础设施建设已进入全球竞赛阶段。Mistral 的 8.3 亿欧元、Microsoft 的 55 亿美元、NVIDIA 对 Marvell 的 20 亿美元投资、Sharon AI 的 12.5 亿美元协议——这些数字不再是单一事件，而是系统性趋势。欧洲、亚太、澳洲正在同步建设 GPU 集群，主权算力的地理分布正在从"集中"转向"多极"。AMD MI355X 突破百万 token/秒则提醒我们，推理硬件的性能竞赛远未结束。在软件层面，Claude Code 泄露揭示的编排模式、Cloudflare EmDash 的无服务器 CMS、Oracle 的 NL2SQL Agent 都指向同一个方向：Agent 的竞争力不在模型本身，而在编排、治理和工具链的工程质量。开源生态方面，TRL v1.0、Training Hub、OpenClaw、Claw Code Agent 和 OpenEyes 的快速迭代显示社区正在从"能不能用"转向"生产级可用"。DRAM 价格上涨和 SpaceX IPO 则从正反两面揭示了硬件基础设施的现实约束和未来潜力——边缘 AI 的普及既受限于硬件成本，也可能被卫星网络重新定义。