AI Infra Brief｜多厂商 AI 堆栈与智能体网络时代（2026.02.26）

2026 年 2 月 26 日，AI 基础设施进入"多厂商与离线主权"时代。Meta 与 AMD 的 600 亿美元协议、VAST Data 的 Polaris 控制平面，以及 Microsoft 的离线主权云，标志着企业正在摆脱单一供应商依赖，构建多样化、可治理的 AI 基础设施。同时，OpenAI 揭示了支撑 8 亿 ChatGPT 用户的技术架构，展示了"刻意简单"的工程哲学。

🧭 核心速览

💰 Meta 与 AMD 签署 600 亿美元芯片供应协议

🌐 VAST Data 推出 Polaris AI 基础设施控制平面

🔒 Microsoft 扩展离线主权云能力

📡 Nokia 与 AWS 展示智能体 5G 网络切片

🗄️ OpenAI 揭示 8 亿用户的 PostgreSQL 架构

🛡️ 研究揭示开源 LLM 的 Prefill 攻击漏洞

计算多元化与供应链

💰 Meta：600 亿美元 AMD 芯片供应协议

根据 Techwire Asia 报道，Meta 与 AMD 签署五年期芯片供应协议，潜在价值达 600 亿美元，包括下一代推理优化硅芯片和基于性能的认股权证。这是 Meta 明确摆脱单一供应商依赖的战略举措。

核心本质：从单一供应商依赖 → 多厂商风险对冲，计算能力正在成为战略资产。

🏢 AMD 与 Nutanix：2.5 亿美元开放 AI 堆栈

根据 IT Brief 报道，AMD 和 Nutanix 推出 2.5 亿美元合作伙伴关系，交付供应商中立平台，整合 EPYC、Instinct、Nutanix Cloud Platform 和 ROCm，首个版本预计 2026 年底发布。

战略含义：企业级 AI 基础设施正在形成"非 NVIDIA"替代路径，开放标准（如 ROCm）正在获得生态吸引力。

AI 控制平面与编排

🌐 VAST Data：Polaris AI 基础设施控制平面

根据 TipRanks 报道，VAST Data 推出 Polaris，一个基于 Kubernetes 的意图驱动编排系统，跨越本地、云和新型云（neocloud），旨在集中管理异构 AI 集群运营。

核心本质：从手动运维 → 意图驱动编排，AI 基础设施正在获得自己的"Kubernetes 时刻"。

📊 Supermicro 与 VAST Data：CNode-X 企业 AI 数据平台

根据 HPCwire 报道，Supermicro 和 VAST Data 推出 CNode-X，集成 GPU/存储、VAST 的 AI OS 和 NVIDIA，为生成式 AI 和视频分析保持 GPU 供给。

🔧 HPE：AI 原生网络与计算

根据 TechEDT 报道，HPE 推出 AI 原生网络/计算，包括智能体就绪路由和 ProLiant Compute EL9000。

智能体网络与边缘 AI

📡 Nokia 与 AWS：智能体 AI 驱动 5G 切片

根据 HPCwire 报道，Nokia 和 AWS 在 du 和 Orange 网络上实时演示了智能体 AI 驱动的 5G-Advanced 切片，使用 Bedrock 和 Claude 根据实时 KPI 和上下文优化策略。

核心本质：网络运营从规则驱动 → 意图驱动，AI Agent 正在成为电信基础设施的"大脑"。

🏪 Vusion 与 Qualcomm：AI 原生商店架构

根据 PR Newswire 报道，Vusion 和 Qualcomm 概述了 AI 原生商店架构，使用 BLE 硬件和设备端 AI 进行定价、货架监控和库存管理。预计货架效率提升两位数，每班节省 60-90 分钟，利润率提升 1.5-2 个百分点。

离线主权与治理

🔒 Microsoft：离线主权云扩展

根据 Incrypted 报道，Microsoft 将 Sovereign Cloud 扩展到完全离线环境，通过 Foundry Local 运行高级模型和 Microsoft 365，适用于物理隔离（air-gapped）环境。

核心本质：主权 AI 从"数据驻留" → “完全离线自治”，满足政府和高度监管行业的严苛要求。

🔬 DataJoint：受管智能体 AI 控制层

根据 PR Newswire 报道，DataJoint 推出针对科学工作流的受管智能体 AI 层，在受监管研发中实现可辩护和可复现的 AI。

OpenAI 基础设施揭秘

🗄️ OpenAI：支撑 8 亿用户的 PostgreSQL 架构

根据 OpenAI 工程师 Bohan Zhang 的分享，OpenAI 通过刻意简单的架构——单一 PostgreSQL 写入器——支撑 8 亿 ChatGPT 用户。核心观点包括：

反过度工程：在加入 OpenAI 之前，他深刻体会到创业公司经常过度工程化。在这里，通过适当的优化和纪律，刻意简单的设置可以规模化到令人惊讶的程度
PostgreSQL 优化：通过适当的索引、连接池和查询优化，单一写入器架构可以支撑海量用户
工程哲学：“简单架构 + 正确优化 > 复杂分布式系统”

关键启示：AI 基础设施不一定需要复杂的分布式系统，正确的数据库优化和工程纪律可能比过度设计更有效。

🤖 OpenAI：Codex 在智能体优先世界中的应用

根据 OpenAI 工程师 Ryan Lopopolo 的分享，OpenAI 团队在 Codex 工程中采用"智能体优先"方法：

编码最佳实践：当团队将"良好的标准"编码到仓库中时，每次运行都会一致地应用这些标准，收益会不断复合
知识融合：团队成员经验各异，人类无法完全思维融合。Codex 可以通过编码仓库实现知识的持续传承
一致性优势：Agent 可以确保每次运行都遵循相同的最佳实践，避免人为不一致

🔍 OpenAI：AI 编码 Agent 内部机制解析

根据 OpenAI 工程师 Michael Bolin 的深度分析，OpenAI 揭示了 AI 编码 Agent 的工作原理：

工具调用链：Agent 通过多轮工具调用实现复杂任务
上下文管理：如何保持长期上下文而不丢失关键信息
错误恢复：Agent 如何从失败中学习和恢复
状态追踪：维护 Agent 执行状态的最佳实践

安全研究与社会影响

🛡️ Prefill 攻击：开源 LLM 普遍漏洞

根据 Reddit 和 arXiv 报道，针对开源权重 LLM 的 Prefill 攻击显示，主要模型家族普遍存在漏洞。

关键发现：

跨模型家族的系统性漏洞
Prefill 阶段缺乏充分验证
需要加强输入验证和 sanitization

👤 LLM 去匿名化：跨平台隐私风险

根据 Reddit 和 arXiv 报道，研究表明 LLM 可实现跨 Web 平台的大规模去匿名化，凸显 AI 隐私保护的紧迫性。

生态发展与融资

💡 Cernel：470 万美元种子轮构建智能体商务基础设施

根据 The AI Insider 报道，Cernel 完成 470 万美元种子轮融资，构建智能体商务基础设施。

🤝 Anthropic：强调"人类增强"叙事

根据 Markets 报道，Anthropic 强调"人类增强"而非替代，推出 Claude 4，并突出大规模基础设施合作伙伴关系。

🔗 LPL 与 Orion：集成 Claude 到顾问工作流

根据 Investment News 报道，LPL 和 Orion 将 Claude 集成到受管顾问工作流中。

🏗️ Kong：围绕"情境经济"构建五支柱智能体平台

根据 Kong HQ 博文，Kong 围绕"情境经济"构建五支柱智能体平台框架。

社区信号与最佳实践

🚀 Qwen3.5-35B-A3B：M1 Ultra 上本地推理加速

根据 Reddit 报道，Qwen3.5-35B-A3B 在 M1 Ultra（4-bit）上达到约 60 tok/s，凸显消费级推理性能提升。

💬 dTelecom：实时语音成本成为 Agent 扩展瓶颈

根据 X 报道，dTelecom 指出实时语音成本为每分钟 0.016 美元，成为 Agent 规模化的瓶颈。

🔀 智能路由：高效规模化核心基础设施

根据 X 报道，智能 LLM 路由正成为高效规模化的核心基础设施能力。

🦀 Rust Agent 运行时：企业级沙箱与持久执行

根据 Hacker News 报道，开源 Rust Agent 运行时增加企业级沙箱和持久执行能力。

🔍 Infra Insights

本日新闻指向 AI 基础设施的四个核心转变：计算供应多元化加速、AI 控制平面崛起、智能体网络走向意图驱动与离线主权成为刚需。

Meta 与 AMD 的 600 亿美元协议和 AMD-Nutanix 的 2.5 亿美元合作，标志着企业正在积极构建多供应商 AI 基础设施策略，减少对 NVIDIA 的单一依赖。VAST Data 的 Polaris、Supermicro-VAST 的 CNode-X 和 HPE 的 AI 原生网络，显示 AI 基础设施正在形成自己的编排和控制层。

Nokia-AWS 的智能体 5G 切片演示，预示着网络运营正在从规则驱动转向意图驱动，AI Agent 成为电信基础设施的智能核心。Vusion-Qualcomm 的 AI 原生商店架构，展示了边缘 AI 在零售等垂直领域的巨大潜力。

Microsoft 的离线主权云和 DataJoint 的受管智能体层，反映政府和高度监管行业对"完全离线自治"的迫切需求。主权 AI 正从简单的数据驻留演进到完全离线的能力自治。

OpenAI 的基础设施揭示提供了宝贵的工程哲学：支撑 8 亿用户的 ChatGPT 只需要一个刻意优化的 PostgreSQL 写入器，这一"反过度工程"实践值得所有 AI 基础设施团队学习。

开源 LLM 的 Prefill 攻击漏洞和 LLM 跨平台去匿名化研究，提醒我们在追求 AI 能力的同时必须重视安全和隐私。Cernel 的融资、Anthropic 的"人类增强"叙事、Kong 的"情境经济"框架，以及 LPL-Orion 对 Claude 的集成，显示 Agent 应用正在从概念验证走向企业级生产。

整体而言，AI 基础设施正在经历从单一供应商到多供应商生态、从手动运维到意图驱动编排、从在线服务到离线主权、从规则系统到智能体网络的深刻转型。这一转型不仅关乎技术架构，更关乎地缘政治、企业战略和社会治理的全面重构。