AI Infra Brief|llm-d 入驻 CNCF、向量与智能体基础设施爆发(2026.03.25)
2026 年 3 月 25 日,llm-d 正式加入 CNCF Sandbox、NVIDIA Nemotron-3 智能体模型、Oracle AI 向量数据库、MoonPay 开源钱包标准、VAST Data KV 缓存卸载。
追踪 AI 基础设施的信号变化,解读行业动态与技术演进
2026 年 3 月 25 日,llm-d 正式加入 CNCF Sandbox、NVIDIA Nemotron-3 智能体模型、Oracle AI 向量数据库、MoonPay 开源钱包标准、VAST Data KV 缓存卸载。
2026 年 3 月 24 日,CNCF Volcano 演进为 AI 原生统一调度器、Check Point 发布 AI 工厂安全蓝图、Teleport Beams 可信运行时、Nexlayer 定位智能体原生云。
2026 年 3 月 23 日,TERAFAB 垂直整合 AI 硬件、openKylin AI 原生操作系统、Nova Engine 消除 Python 税收、Virtuals Protocol 智能体商业协议。
2026 年 3 月 22 日,OpenAI 发布 GPT-5.4 mini/nano,Mistral Small 4 开源,Salesforce 与 NVIDIA 合作企业智能体,确定性 AI 工作流系统受关注。
2026 年 3 月 21 日,LinkedIn 部署生产级 LLM 排序系统,NVIDIA 发布 Feynman 架构与 Rosa CPU,SpecPrefill 实现 5 倍预填充加速,Armis 报告显示所有被测模型均无法生成安全代码。
2026 年 3 月 20 日,主权 AI 建设加速,Upstage 与 AMD 合作开发韩国主权 AI,NVIDIA KVTC 实现 20 倍 KV 缓存节省,开源智能体工具生态爆发式增长。
2026 年 3 月 19 日,本地智能体硬件化、端侧微调普及化,NVIDIA 推出 agent computers,Tether BitNet LoRA 支持消费级设备微调。
2026 年 3 月 18 日,AI 智能体安全治理成为焦点,Geordie AI 入选 RSAC 创新沙盒,Jozu 推出零信任 AI 运行时,20 MW 级 AI 基础设施投资持续升温。
2026 年 3 月 17 日,AI 安全监管加剧、多智能体系统风险凸显、企业级 AI 部署加速,Google 提出贝叶斯教学新训练范式。
2026 年 3 月 16 日,NVIDIA GTC 大会开幕聚焦 agentic-optimized CPU,GitHub Trending 上多个 AI 基础设施开源项目爆发,科技巨头宣布 6500 亿美元 AI 基础设施投资。
2026 年 3 月 15 日,HART OS 提出去中心化 AI 操作系统,Pilot Protocol 实现 Agent P2P 通信,Plaidify 将受保护网站转为 Agent API。
2026 年 3 月 14 日,AWS 推出 P-EAGLE 并与 Cerebras 合作解耦推理架构,Microsoft Azure 集成 Fireworks AI,开源工具聚焦 Agent 记忆与评估。
2026 年 3 月 13 日,AgentSeal 揭示 MCP 服务器严重漏洞,Irregular Research 展示 Agent 漂移行为,OneCLI、vyx、PycoClaw 等开源工具发布。
2026 年 3 月 12 日,Google 收购 Wiz 整合云安全,Meta 公布 24 个月四代 MTIA 路线图,Qualys 推出 TotalAI,GTC 2026 即将召开。
2026 年 3 月 11 日,Meta 收购 Moltbook 社交网络,OpenAI 融资 1100 亿美元,NVIDIA AIConfigurator,去中心化训练里程碑。
2026 年 3 月 10 日,Nscale 融资 20 亿美元,HPE 推出 1.6T AI 连接,软银 Telco AI Cloud,Karpathy 开源 autoresearch。
2026 年 3 月 9 日,Qubic 达 1550 万 TPS,SwarmBase 多 Agent 协调,Bittensor 首个 MCP 原生子网,Agent 原生部署与支付。
2026 年 3 月 8 日,Google 抛弃向量数据库管理 Agent 内存,Micron 推出 256GB LPDRAM,DELIFT 实现数据高效 LLM 训练。
2026 年 3 月 7 日,推理支出达训练的 15-20 倍,后端 LLM 角色薪资溢价 30-50%,2026 年 AI 基础设施投资预计 6500 亿美元。
2026 年 3 月 6 日,AMD 与 Meta 签署 1000 亿美元协议,CoreWeave 为 Perplexity 部署 GB200,Akamai 降低 86% 推理成本。
2026 年 3 月 5 日,IREN 扩展至 15 万 GPU,0G 推出去中心化 Agent OS,Andrew Ng 发布 JAX LLM 课程。
2026 年 3 月 4 日,微软 AKS 集成 Ray,华为 TICC 2.0 统一调度,ZTE AIR MAX 降耗 40%,开源 Agent 框架涌现。
2026 年 3 月 3 日,华为 SuperPoD 支持 8192 NPU 规模,软银推 Telco AI Cloud,GitHub 发布 Agentic Workflows 技术预览。
2026 年 3 月 2 日,OpenAI 与亚马逊达成 1500 亿美元战略合作,英伟达推动 AI 原生 6G 网络建设,企业级模型访问加速。
2026 年 3 月 1 日,阿里巴巴开源 Qwen3.5-122B/35B(Apache 2.0),Unsloth Dynamic 2.0 推出 KL 散度校准量化,Athena-Public 和 ClawRouter 推动 Agent 原生基础设施,中兴通讯发布 6G 路线图与 GigaMIMO。
2026 年 2 月 28 日,AI-RAN Alliance 发布 AI 原生 5G/6G 架构蓝图,Cisco 与 Vast Data 推出安全 AI 工厂,DeepSig 演示 AI 原生 Open RAN,Domino 发布 Agentic 开发生命周期平台。
2026 年 2 月 27 日,Perplexia Computer 与 Cursor Agents 引入独立沙箱,Qwen 3.5 开源,Union.ai 与 Encord 共融资近亿美元。
2026 年 2 月 26 日,Meta 与 AMD 签署 600 亿美元芯片供应协议,VAST Data 推出 Polaris AI 控制平面,OpenAI 揭示 8 亿用户 ChatGPT 的 PostgreSQL 架构。
2026 年 2 月 25 日,OpenAI 推出 WebSocket 模式优化长链 Agent,Inception Labs 发布 Mercury 2 推理扩散模型,印度推出 Sarvam 主权 LLM。
2026 年 2 月 24 日,OpenGradient 推出 x402 原生 TEE 推理,Taalas HC1 将模型权重嵌入芯片,DeepSeek 使用 Blackwell 训练。
2026 年 2 月 23 日,ntransformer 推出三层缓存方案,Taalas ASIC 实现 8B 模型每秒 1.7 万 tokens,Aethene 开源智能体记忆层,Infosys 与 Anthropic 达成企业级合作。
2026 年 2 月 22 日,Apple 推出端侧 GUI 智能体 Ferret-UI Lite,NTransformer 实现 RTX 3090 运行 Llama 3.1 70B,flowing 与 ClawMoat 推动智能体协调与安全。
2026 年 2 月 21 日,信实 1100 亿美元投资 AI 基础设施,Google 发布 Gemini 3.1 Pro,Sarvam AI 推出 105B 参数主权 LLM,开源 Agent 基础设施加速。
2026 年 2 月 20 日,Tata 与 OpenAI 签署 1GW 数据中心协议,QumulusAI 部署 1144 张 Blackwell GPU,Daytona 融资 2400 万美元,Web3 原生 AI 基础设施崛起。
2026 年 2 月 19 日,Nebius 与微软签署 174 亿美元创纪录协议,Selector 融资 3200 万美元,QumulusAI 推出固定定价,Agentic 安全平台崛起。
2026 年 2 月 18 日,NVIDIA 与 Meta 达成多年超算级合作,Calix 和 Ericsson 推出 AI 原生电信平台,Temporal 获 3 亿美元融资。
中国完成三体 AI 计算星座在轨测试,Corpus OS 开源跨框架互操作性协议套件,AMD 与 TCS 在印度部署 Helios 架构。
Neysa 获最高 12 亿美元融资在印度建设本土 AI 算力,微软将 Grounding 定位为核心 AI 基础设施,月之暗面推出支持 5000 社区技能的 Kimi Claw。
欧盟 AI 网格扩张至五国,GPU 容量扩张,Agent 基础设施成本优化,MiniMax M2.5 与 Gemini 3 发布新模型。
2026 年 2 月 14 日,Anthropic 投入 500 亿美元建设数据中心,谷歌在印度设立 15 亿美元 AI 枢纽,思科 AI 订单年度达 50 亿美元,微软预警 AI 推荐投毒风险。
2026 年 2 月 13 日,Nvidia 推出动态内存稀疏化推理成本降低 8 倍,Anthropic 融资 300 亿美元估值 3800 亿,AI 基础设施迎来吞吐量突破与超轮融资浪潮。
2026 年 2 月 12 日,智谱 AI 发布 GLM-5(754B 参数),Meta 投资 100 亿美元建设印第安纳数据中心,AI 基础设施迎来超大规模建设潮。
2026 年 2 月 11 日,Cisco 发布 Silicon One G300 芯片,Intel 展示移动网络 AI 策略,专用 AI 基础设施成为行业共识。
2026 年 2 月 10 日,Alphabet 发行 200 亿美元债券,Anthropic 融资超 200 亿美元,美国政府推动 AI 数据中心协议。
2026 年 2 月 9 日,私有 LLM 定价计算器、LocalGPT 发布、A2A 协议及部署权衡。
2026 年 2 月 8 日,Z.ai 发布 GLM-OCR 轻量级模型,超大规模云厂商 2026 年 AI 支出预计达 6350-6650 亿美元。
2026 年 2 月 7 日,Amazon 宣布 2000 亿美元 AI 基础设施投资,Waymo 推出 World Model 模拟系统,US Signal 建设 1000 英里 AI 光纤网络。
AI 编码代理迎来重大突破,Claude Opus 4.6 和 GPT-5.3-Codex 分别在长上下文和编码基准上刷新记录,OpenAI Frontier 和 CoreWeave ARENA 等企业级平台推动生产就绪。
Alphabet 和 Meta 公布 2026 年创纪录的 AI 基础设施预算,O(1) 内存注意力机制实现 97-99% 内存削减,新的视频/代码模型突破性能边界。
企业级 AI 部署加速下沉至关系数据库和推荐系统,边缘计算与 AI 的融合通过标准化协议迈出关键一步,超大规模云厂商继续加码 AI 算力投资,开源生态则在高性能模型和本地 Agent 框架两个方向同步突破。
2026 年 2 月 3 日:EdgeLake 晋升 LF Edge Stage 2,OpenAI 与 Snowflake 合作 2 亿美元,Oracle 计划投资 450-500 亿美元扩展 OCI,Meta 将 LLM 嵌入推荐系统。
2026 年 2 月 2 日:印度推出半导体使命 2.0 和零税收 AI 政策,Teleport 提出 Agent 零信任身份框架,AIsa Skills 统一 API 发布,开源生态持续加速。
2026 年 2 月 1 日:TintraOS AI 原生金融基础设施,41caijing AI 原生 PR 平台,诺基亚光网络订单增长 17%,生产级 LLM 部署指南,主要开源发布。
2026 年 1 月 31 日:IndiaAI Mission 10,300 亿卢比计划,PageIndex 树搜索 RAG 框架,METR Time Horizon 1.1,Modular 26.1,Gravitino 元数据湖。
2026 年 1 月 30 日:Kthena Kubernetes 原生 LLM 编排,Moltworker 边缘 Agent 托管,LLM.co 私有基础设施,Bizarre Bazaar 扫描,本地 AI 工具。