AI Infra Brief|Kubernetes AI 推理标准化加速(2026.03.27)
2026 年 3 月 27 日,LLM-D 加入 CNCF Sandbox,Microsoft 发布 AI Runway 统一 Kubernetes AI API,Solo.io 开源 agentevals。
追踪 AI 基础设施的信号变化,解读行业动态与技术演进
2026 年 3 月 27 日,LLM-D 加入 CNCF Sandbox,Microsoft 发布 AI Runway 统一 Kubernetes AI API,Solo.io 开源 agentevals。
2026 年 3 月 26 日,NVIDIA 发布 MIG 硬件分区指南,Glimpse 融资 3500 万美元,World Mobile 推出去中心化 Agent 基础设施 EarthNode。
2026 年 3 月 25 日,llm-d 正式加入 CNCF Sandbox、NVIDIA Nemotron-3 智能体模型、Oracle AI 向量数据库、MoonPay 开源钱包标准、VAST Data KV 缓存卸载。
2026 年 3 月 24 日,CNCF Volcano 演进为 AI 原生统一调度器、Check Point 发布 AI 工厂安全蓝图、Teleport Beams 可信运行时、Nexlayer 定位智能体原生云。
2026 年 3 月 23 日,TERAFAB 垂直整合 AI 硬件、openKylin AI 原生操作系统、Nova Engine 消除 Python 税收、Virtuals Protocol 智能体商业协议。
2026 年 3 月 22 日,OpenAI 发布 GPT-5.4 mini/nano,Mistral Small 4 开源,Salesforce 与 NVIDIA 合作企业智能体,确定性 AI 工作流系统受关注。
2026 年 3 月 21 日,LinkedIn 部署生产级 LLM 排序系统,NVIDIA 发布 Feynman 架构与 Rosa CPU,SpecPrefill 实现 5 倍预填充加速,Armis 报告显示所有被测模型均无法生成安全代码。
2026 年 3 月 20 日,主权 AI 建设加速,Upstage 与 AMD 合作开发韩国主权 AI,NVIDIA KVTC 实现 20 倍 KV 缓存节省,开源智能体工具生态爆发式增长。
2026 年 3 月 19 日,本地智能体硬件化、端侧微调普及化,NVIDIA 推出 agent computers,Tether BitNet LoRA 支持消费级设备微调。
2026 年 3 月 18 日,AI 智能体安全治理成为焦点,Geordie AI 入选 RSAC 创新沙盒,Jozu 推出零信任 AI 运行时,20 MW 级 AI 基础设施投资持续升温。