AI Infra Brief|推理主导 AI 支出,6G 与主权风险更新(2026.03.07)
2026 年 3 月 7 日,推理支出达训练的 15-20 倍,后端 LLM 角色薪资溢价 30-50%,2026 年 AI 基础设施投资预计 6500 亿美元。
追踪 AI 基础设施的信号变化,解读行业动态与技术演进
2026 年 3 月 7 日,推理支出达训练的 15-20 倍,后端 LLM 角色薪资溢价 30-50%,2026 年 AI 基础设施投资预计 6500 亿美元。
2026 年 3 月 6 日,AMD 与 Meta 签署 1000 亿美元协议,CoreWeave 为 Perplexity 部署 GB200,Akamai 降低 86% 推理成本。
2026 年 3 月 5 日,IREN 扩展至 15 万 GPU,0G 推出去中心化 Agent OS,Andrew Ng 发布 JAX LLM 课程。
2026 年 3 月 4 日,微软 AKS 集成 Ray,华为 TICC 2.0 统一调度,ZTE AIR MAX 降耗 40%,开源 Agent 框架涌现。
2026 年 3 月 3 日,华为 SuperPoD 支持 8192 NPU 规模,软银推 Telco AI Cloud,GitHub 发布 Agentic Workflows 技术预览。
2026 年 3 月 2 日,OpenAI 与亚马逊达成 1500 亿美元战略合作,英伟达推动 AI 原生 6G 网络建设,企业级模型访问加速。
2026 年 3 月 1 日,阿里巴巴开源 Qwen3.5-122B/35B(Apache 2.0),Unsloth Dynamic 2.0 推出 KL 散度校准量化,Athena-Public 和 ClawRouter 推动 Agent 原生基础设施,中兴通讯发布 6G 路线图与 GigaMIMO。
2026 年 2 月 28 日,AI-RAN Alliance 发布 AI 原生 5G/6G 架构蓝图,Cisco 与 Vast Data 推出安全 AI 工厂,DeepSig 演示 AI 原生 Open RAN,Domino 发布 Agentic 开发生命周期平台。
2026 年 2 月 27 日,Perplexia Computer 与 Cursor Agents 引入独立沙箱,Qwen 3.5 开源,Union.ai 与 Encord 共融资近亿美元。
2026 年 2 月 26 日,Meta 与 AMD 签署 600 亿美元芯片供应协议,VAST Data 推出 Polaris AI 控制平面,OpenAI 揭示 8 亿用户 ChatGPT 的 PostgreSQL 架构。