AI Infra Dao

AI Infra Brief|多厂商 AI 堆栈与智能体网络时代(2026.02.26)

2026 年 2 月 26 日,AI 基础设施进入"多厂商与离线主权"时代。Meta 与 AMD 的 600 亿美元协议、VAST Data 的 Polaris 控制平面,以及 Microsoft 的离线主权云,标志着企业正在摆脱单一供应商依赖,构建多样化、可治理的 AI 基础设施。同时,OpenAI 揭示了支撑 8 亿 ChatGPT 用户的技术架构,展示了"刻意简单"的工程哲学。

🧭 核心速览

💰 Meta 与 AMD 签署 600 亿美元芯片供应协议

🌐 VAST Data 推出 Polaris AI 基础设施控制平面

🔒 Microsoft 扩展离线主权云能力

📡 Nokia 与 AWS 展示智能体 5G 网络切片

🗄️ OpenAI 揭示 8 亿用户的 PostgreSQL 架构

🛡️ 研究揭示开源 LLM 的 Prefill 攻击漏洞

计算多元化与供应链

💰 Meta:600 亿美元 AMD 芯片供应协议

根据 Techwire Asia 报道,Meta 与 AMD 签署五年期芯片供应协议,潜在价值达 600 亿美元,包括下一代推理优化硅芯片和基于性能的认股权证。这是 Meta 明确摆脱单一供应商依赖的战略举措。

核心本质:从单一供应商依赖 → 多厂商风险对冲,计算能力正在成为战略资产。

🏢 AMD 与 Nutanix:2.5 亿美元开放 AI 堆栈

根据 IT Brief 报道,AMD 和 Nutanix 推出 2.5 亿美元合作伙伴关系,交付供应商中立平台,整合 EPYC、Instinct、Nutanix Cloud Platform 和 ROCm,首个版本预计 2026 年底发布。

战略含义:企业级 AI 基础设施正在形成"非 NVIDIA"替代路径,开放标准(如 ROCm)正在获得生态吸引力。

AI 控制平面与编排

🌐 VAST Data:Polaris AI 基础设施控制平面

根据 TipRanks 报道,VAST Data 推出 Polaris,一个基于 Kubernetes 的意图驱动编排系统,跨越本地、云和新型云(neocloud),旨在集中管理异构 AI 集群运营。

核心本质:从手动运维 → 意图驱动编排,AI 基础设施正在获得自己的"Kubernetes 时刻"。

📊 Supermicro 与 VAST Data:CNode-X 企业 AI 数据平台

根据 HPCwire 报道,Supermicro 和 VAST Data 推出 CNode-X,集成 GPU/存储、VAST 的 AI OS 和 NVIDIA,为生成式 AI 和视频分析保持 GPU 供给。

🔧 HPE:AI 原生网络与计算

根据 TechEDT 报道,HPE 推出 AI 原生网络/计算,包括智能体就绪路由和 ProLiant Compute EL9000。

智能体网络与边缘 AI

📡 Nokia 与 AWS:智能体 AI 驱动 5G 切片

根据 HPCwire 报道,Nokia 和 AWS 在 du 和 Orange 网络上实时演示了智能体 AI 驱动的 5G-Advanced 切片,使用 Bedrock 和 Claude 根据实时 KPI 和上下文优化策略。

核心本质:网络运营从规则驱动 → 意图驱动,AI Agent 正在成为电信基础设施的"大脑"。

🏪 Vusion 与 Qualcomm:AI 原生商店架构

根据 PR Newswire 报道,Vusion 和 Qualcomm 概述了 AI 原生商店架构,使用 BLE 硬件和设备端 AI 进行定价、货架监控和库存管理。预计货架效率提升两位数,每班节省 60-90 分钟,利润率提升 1.5-2 个百分点。

离线主权与治理

🔒 Microsoft:离线主权云扩展

根据 Incrypted 报道,Microsoft 将 Sovereign Cloud 扩展到完全离线环境,通过 Foundry Local 运行高级模型和 Microsoft 365,适用于物理隔离(air-gapped)环境。

核心本质:主权 AI 从"数据驻留" → “完全离线自治”,满足政府和高度监管行业的严苛要求。

🔬 DataJoint:受管智能体 AI 控制层

根据 PR Newswire 报道,DataJoint 推出针对科学工作流的受管智能体 AI 层,在受监管研发中实现可辩护和可复现的 AI。

OpenAI 基础设施揭秘

🗄️ OpenAI:支撑 8 亿用户的 PostgreSQL 架构

根据 OpenAI 工程师 Bohan Zhang 的分享,OpenAI 通过刻意简单的架构——单一 PostgreSQL 写入器——支撑 8 亿 ChatGPT 用户。核心观点包括:

  • 反过度工程:在加入 OpenAI 之前,他深刻体会到创业公司经常过度工程化。在这里,通过适当的优化和纪律,刻意简单的设置可以规模化到令人惊讶的程度
  • PostgreSQL 优化:通过适当的索引、连接池和查询优化,单一写入器架构可以支撑海量用户
  • 工程哲学:“简单架构 + 正确优化 > 复杂分布式系统”

关键启示:AI 基础设施不一定需要复杂的分布式系统,正确的数据库优化和工程纪律可能比过度设计更有效。

🤖 OpenAI:Codex 在智能体优先世界中的应用

根据 OpenAI 工程师 Ryan Lopopolo 的分享,OpenAI 团队在 Codex 工程中采用"智能体优先"方法:

  • 编码最佳实践:当团队将"良好的标准"编码到仓库中时,每次运行都会一致地应用这些标准,收益会不断复合
  • 知识融合:团队成员经验各异,人类无法完全思维融合。Codex 可以通过编码仓库实现知识的持续传承
  • 一致性优势:Agent 可以确保每次运行都遵循相同的最佳实践,避免人为不一致

🔍 OpenAI:AI 编码 Agent 内部机制解析

根据 OpenAI 工程师 Michael Bolin 的深度分析,OpenAI 揭示了 AI 编码 Agent 的工作原理:

  • 工具调用链:Agent 通过多轮工具调用实现复杂任务
  • 上下文管理:如何保持长期上下文而不丢失关键信息
  • 错误恢复:Agent 如何从失败中学习和恢复
  • 状态追踪:维护 Agent 执行状态的最佳实践

安全研究与社会影响

🛡️ Prefill 攻击:开源 LLM 普遍漏洞

根据 RedditarXiv 报道,针对开源权重 LLM 的 Prefill 攻击显示,主要模型家族普遍存在漏洞。

关键发现

  • 跨模型家族的系统性漏洞
  • Prefill 阶段缺乏充分验证
  • 需要加强输入验证和 sanitization

👤 LLM 去匿名化:跨平台隐私风险

根据 RedditarXiv 报道,研究表明 LLM 可实现跨 Web 平台的大规模去匿名化,凸显 AI 隐私保护的紧迫性。

生态发展与融资

💡 Cernel:470 万美元种子轮构建智能体商务基础设施

根据 The AI Insider 报道,Cernel 完成 470 万美元种子轮融资,构建智能体商务基础设施。

🤝 Anthropic:强调"人类增强"叙事

根据 Markets 报道,Anthropic 强调"人类增强"而非替代,推出 Claude 4,并突出大规模基础设施合作伙伴关系。

🔗 LPL 与 Orion:集成 Claude 到顾问工作流

根据 Investment News 报道,LPL 和 Orion 将 Claude 集成到受管顾问工作流中。

🏗️ Kong:围绕"情境经济"构建五支柱智能体平台

根据 Kong HQ 博文,Kong 围绕"情境经济"构建五支柱智能体平台框架。

社区信号与最佳实践

🚀 Qwen3.5-35B-A3B:M1 Ultra 上本地推理加速

根据 Reddit 报道,Qwen3.5-35B-A3B 在 M1 Ultra(4-bit)上达到约 60 tok/s,凸显消费级推理性能提升。

💬 dTelecom:实时语音成本成为 Agent 扩展瓶颈

根据 X 报道,dTelecom 指出实时语音成本为每分钟 0.016 美元,成为 Agent 规模化的瓶颈。

🔀 智能路由:高效规模化核心基础设施

根据 X 报道,智能 LLM 路由正成为高效规模化的核心基础设施能力。

🦀 Rust Agent 运行时:企业级沙箱与持久执行

根据 Hacker News 报道,开源 Rust Agent 运行时增加企业级沙箱和持久执行能力。

🔍 Infra Insights

本日新闻指向 AI 基础设施的四个核心转变:计算供应多元化加速AI 控制平面崛起智能体网络走向意图驱动离线主权成为刚需

Meta 与 AMD 的 600 亿美元协议和 AMD-Nutanix 的 2.5 亿美元合作,标志着企业正在积极构建多供应商 AI 基础设施策略,减少对 NVIDIA 的单一依赖。VAST Data 的 Polaris、Supermicro-VAST 的 CNode-X 和 HPE 的 AI 原生网络,显示 AI 基础设施正在形成自己的编排和控制层。

Nokia-AWS 的智能体 5G 切片演示,预示着网络运营正在从规则驱动转向意图驱动,AI Agent 成为电信基础设施的智能核心。Vusion-Qualcomm 的 AI 原生商店架构,展示了边缘 AI 在零售等垂直领域的巨大潜力。

Microsoft 的离线主权云和 DataJoint 的受管智能体层,反映政府和高度监管行业对"完全离线自治"的迫切需求。主权 AI 正从简单的数据驻留演进到完全离线的能力自治。

OpenAI 的基础设施揭示提供了宝贵的工程哲学:支撑 8 亿用户的 ChatGPT 只需要一个刻意优化的 PostgreSQL 写入器,这一"反过度工程"实践值得所有 AI 基础设施团队学习。

开源 LLM 的 Prefill 攻击漏洞和 LLM 跨平台去匿名化研究,提醒我们在追求 AI 能力的同时必须重视安全和隐私。Cernel 的融资、Anthropic 的"人类增强"叙事、Kong 的"情境经济"框架,以及 LPL-Orion 对 Claude 的集成,显示 Agent 应用正在从概念验证走向企业级生产。

整体而言,AI 基础设施正在经历从单一供应商到多供应商生态、从手动运维到意图驱动编排、从在线服务到离线主权、从规则系统到智能体网络的深刻转型。这一转型不仅关乎技术架构,更关乎地缘政治、企业战略和社会治理的全面重构。