2026 年 2 月 15 日,主权 AI 建设、GPU 容量扩张、Agent 优化型 Web 基础设施和开源效率提升在近 48 小时内迎来新一轮发展动能。
🧭 核心速览
🇪🇺 欧盟 AI 网格扩张至拉脱维亚、爱沙尼亚、芬兰、德国和意大利
🖥️ HIVE BUZZ 签署两年 3000 万美元 GPU 客户协议
💰 Rizz Network 获 500 万美元资本承诺支持 AI 无线网络扩张
🚀 MiniMax M2.5 刷新 SOTA — BrowseComp 76.3%、SWE‑Bench 80.2%
🧠 Gemini 3 Deep Think 发布扩展推理模式
📄 Cloudflare “Markdown for Agents” 实现约 80% Token 削减
💾 Pierre “Code Storage” 推出 API 优先的 Git 代码存储层
⚠️ ICML 提示词注入争议:每篇论文 PDF 元数据中均发现注入指令
🔧 AdaLLM 开源 RTX 4090 上的 NVFP4 推理 — 峰值 VRAM 降低 2.4 倍
主权 AI 与算力基础设施
🇪🇺 欧盟 AI 网格扩张至五国
根据 Manilatimes 报道,欧盟 AI 网格扩张至拉脱维亚、爱沙尼亚、芬兰、德国和意大利,超出最初维尔纽斯部署范围。该联邦网络通过 TokenVisor 商业平台将 AI 作为计费实用程序提供,旨在保持价值和控制留在欧洲。
欧盟 AI 网格的扩张标志着欧洲在主权 AI 基础设施上的实质性进展,联邦化模式允许各国共享算力资源的同时保持数据主权,TokenVisor 平台为 AI 能力提供类似水电的计费模式。
🖥️ HIVE BUZZ 签署两年 3000 万美元 GPU 客户协议
根据 Insidehpc 报道,HIVE BUZZ 签署两年 3000 万美元客户 AI GPU 协议 — 504 个基于液冷 Dell 服务器的 GPU 预定部署于马尼托巴,目标 2026 年 3 月 31 日上线,预计约 1500 万美元年度经常性收入(ARR)。
液冷 GPU 部署反映了 AI 数据中心向更高效散热技术演进,马尼托巴的地理位置可能利用其低温气候和清洁能源优势。
💰 Rizz Network 获 500 万美元资本承诺支持 AI 无线网络扩张
根据 Streetinsider 报道,Rizz Network 从 Nimbus Capital 获得 500 万美元资本承诺用于 $RZTO,支持 Rizz Wireless 发展,这是一个融合电信基础设施与区块链和 AI 的 MVNO,使用 AI 驱动分析实现奖励和效率优化。
AI 与电信基础设施的融合代表了新型网络服务模式,MVNO(移动虚拟网络运营商)通过 AI 优化用户体验和运营效率。
模型性能与推理
🚀 MiniMax M2.5 刷新 SOTA
根据 Patmcguinness 报道,MiniMax M2.5 发布 SOTA 结果 — BrowseComp 76.3%、SWE‑Bench Verified 80.2%,输入 Token 定价为每百万 0.30 美元。
MiniMax M2.5 的性能提升和定价策略反映了开源模型与前沿厂商模型的竞争加剧,每百万 0.30 美元的输入 Token 价格处于成本优势区间。
🧠 Gemini 3 Deep Think 发布扩展推理模式
根据 Patmcguinness 报道,Gemini 3 Deep Think 推出扩展推理模式 — ARC‑AGI2 达 84.6%、Codeforces 3455 分。
扩展推理模式代表了 AI 系统在复杂任务解决能力上的进步,ARC‑AGI2 和 Codeforces 是衡量推理和编程能力的重要基准。
Agent 基础设施与 Web 优化
📄 Cloudflare “Markdown for Agents” 实现约 80% Token 削减
根据 Linksurge 报道,Cloudflare 推出"Markdown for Agents",在通过 Accept: text/markdown 请求时在边缘将 HTML 转换为 Markdown — 实现约 80% Token 削减(例如约 16k → 约 3k),降低 RAG 成本,新增机器可读头部(ai-train、search、ai-input),并标注了"AI 伪装"风险。
Agent 需要读取大量 Web 内容,HTML 到 Markdown 的转换大幅减少 Token 消耗,直接降低 RAG(检索增强生成)系统的运营成本。新的机器可读头部为 Agent 提供更精细的内容控制,但"AI 伪装"风险(恶意内容专门针对 Agent 优化)需要警惕。
💾 Pierre “Code Storage” 推出 API 优先的 Git 代码存储层
根据 Hacker News 报道,Pierre “Code Storage” 软启动 API 优先的 Git 代码存储层,面向大规模 Agent 编码(单一 createCommitFromDiff API,原生 grep/archive/ephemeral branches 支持);社区指出潜在的存储 ingress 成本担忧。
Agent 编码需要专门的代码存储基础设施,Pierre 的 API 优先设计简化了 Agent 对 Git 仓库的操作,但存储成本成为规模化部署的关注点。
开源生态与效率优化
🔧 AdaLLM 开源 RTX 4090 上的 NVFP4 推理
根据 Reddit 报道,AdaLLM 开源 RTX 4090 上的 NVFP4 推理,面向 Qwen3 和 Gemma3 — 相比 FP16 峰值 VRAM 降低 2.4 倍,Qwen3‑8B 达约 297 tok/s,消除 FP16 回退。
NVFP4 精度格式在消费级 GPU 上实现高性能推理,降低本地部署的硬件门槛,每秒约 297 Token 的吞吐量使 Qwen3‑8B 在 RTX 4090 上达到实用级别。
安全与风险
⚠️ ICML 提示词注入争议
根据 Reddit 报道,ICML 提示词注入争议:审稿人报告其批次中的每篇论文均在 PDF 元数据中发现注入指令,引发关于检测与威慑的辩论。
提示词注入从 AI 应用层渗透到学术出版流程,研究者通过在论文 PDF 中嵌入指令试图影响审稿过程,反映了 AI 系统在内容审核和元数据处理中的新型安全挑战。
🔍 Infra Insights
本日新闻共同指向 AI 基础设施的核心趋势:主权 AI 基础设施实质性扩张与Agent 基础设施成本系统性优化。
主权 AI 建设从概念走向落地,欧盟 AI 网格的五国扩张和联邦化运营模式,为其他地区提供了主权 AI 的实践模板。HIVE BUZZ 的 3000 万美元 GPU 协议和 Rizz Network 的 AI 无线网络融资,印证算力基础设施向区域性、专用化布局演进。
Agent 基础设施的成本优化成为创新热点。Cloudflare 的 Markdown for Agents 通过边缘转换实现 80% Token 削减,直接降低 RAG 成本;Pierre 的 API 优先代码存储层简化 Agent 编码流程。两者都体现了"为 Agent 设计基础设施"的理念 — 从人类可读向机器可读演进,从交互友好向程序化友好转变。
开源模型持续追赶前沿厂商。MiniMax M2.5 在 BrowseComp 和 SWE‑Bench 上的 SOTA 结果,以及每百万 0.30 美元的定价,反映开源生态在性能和成本竞争力上的双重进步。AdaLLM 的 NVFP4 推理在消费级 GPU 上实现高性能,降低本地部署门槛。
ICML 提示词注入争议揭示 AI 安全的新维度 — 攻击面从模型和应用层扩展到内容生产和分发流程,学术出版系统面临的挑战预示 AI 原生内容审核基础设施的必要性。
总体而言,近 48 小时的发展显示 AI 基础设施正在向三个方向演进:主权化(控制权在地)、Agent 化(为 AI 系统优化)、民主化(开源降低门槛)。