AI Infra Brief｜欧盟 AI 网格扩张与成本削减型 Agent 基础设施（2026.02.15）

2026 年 2 月 15 日，主权 AI 建设、GPU 容量扩张、Agent 优化型 Web 基础设施和开源效率提升在近 48 小时内迎来新一轮发展动能。

🧭 核心速览

🇪🇺 欧盟 AI 网格扩张至拉脱维亚、爱沙尼亚、芬兰、德国和意大利

🖥️ HIVE BUZZ 签署两年 3000 万美元 GPU 客户协议

💰 Rizz Network 获 500 万美元资本承诺支持 AI 无线网络扩张

🚀 MiniMax M2.5 刷新 SOTA — BrowseComp 76.3%、SWE‑Bench 80.2%

🧠 Gemini 3 Deep Think 发布扩展推理模式

📄 Cloudflare “Markdown for Agents” 实现约 80% Token 削减

💾 Pierre “Code Storage” 推出 API 优先的 Git 代码存储层

⚠️ ICML 提示词注入争议：每篇论文 PDF 元数据中均发现注入指令

🔧 AdaLLM 开源 RTX 4090 上的 NVFP4 推理 — 峰值 VRAM 降低 2.4 倍

主权 AI 与算力基础设施

🇪🇺 欧盟 AI 网格扩张至五国

根据 Manilatimes 报道，欧盟 AI 网格扩张至拉脱维亚、爱沙尼亚、芬兰、德国和意大利，超出最初维尔纽斯部署范围。该联邦网络通过 TokenVisor 商业平台将 AI 作为计费实用程序提供，旨在保持价值和控制留在欧洲。

欧盟 AI 网格的扩张标志着欧洲在主权 AI 基础设施上的实质性进展，联邦化模式允许各国共享算力资源的同时保持数据主权，TokenVisor 平台为 AI 能力提供类似水电的计费模式。

🖥️ HIVE BUZZ 签署两年 3000 万美元 GPU 客户协议

根据 Insidehpc 报道，HIVE BUZZ 签署两年 3000 万美元客户 AI GPU 协议 — 504 个基于液冷 Dell 服务器的 GPU 预定部署于马尼托巴，目标 2026 年 3 月 31 日上线，预计约 1500 万美元年度经常性收入（ARR）。

液冷 GPU 部署反映了 AI 数据中心向更高效散热技术演进，马尼托巴的地理位置可能利用其低温气候和清洁能源优势。

💰 Rizz Network 获 500 万美元资本承诺支持 AI 无线网络扩张

根据 Streetinsider 报道，Rizz Network 从 Nimbus Capital 获得 500 万美元资本承诺用于 $RZTO，支持 Rizz Wireless 发展，这是一个融合电信基础设施与区块链和 AI 的 MVNO，使用 AI 驱动分析实现奖励和效率优化。

AI 与电信基础设施的融合代表了新型网络服务模式，MVNO（移动虚拟网络运营商）通过 AI 优化用户体验和运营效率。

模型性能与推理

🚀 MiniMax M2.5 刷新 SOTA

根据 Patmcguinness 报道，MiniMax M2.5 发布 SOTA 结果 — BrowseComp 76.3%、SWE‑Bench Verified 80.2%，输入 Token 定价为每百万 0.30 美元。

MiniMax M2.5 的性能提升和定价策略反映了开源模型与前沿厂商模型的竞争加剧，每百万 0.30 美元的输入 Token 价格处于成本优势区间。

🧠 Gemini 3 Deep Think 发布扩展推理模式

根据 Patmcguinness 报道，Gemini 3 Deep Think 推出扩展推理模式 — ARC‑AGI2 达 84.6%、Codeforces 3455 分。

扩展推理模式代表了 AI 系统在复杂任务解决能力上的进步，ARC‑AGI2 和 Codeforces 是衡量推理和编程能力的重要基准。

Agent 基础设施与 Web 优化

📄 Cloudflare “Markdown for Agents” 实现约 80% Token 削减

根据 Linksurge 报道，Cloudflare 推出"Markdown for Agents"，在通过 Accept: text/markdown 请求时在边缘将 HTML 转换为 Markdown — 实现约 80% Token 削减（例如约 16k → 约 3k），降低 RAG 成本，新增机器可读头部（ai-train、search、ai-input），并标注了"AI 伪装"风险。

Agent 需要读取大量 Web 内容，HTML 到 Markdown 的转换大幅减少 Token 消耗，直接降低 RAG（检索增强生成）系统的运营成本。新的机器可读头部为 Agent 提供更精细的内容控制，但"AI 伪装"风险（恶意内容专门针对 Agent 优化）需要警惕。

💾 Pierre “Code Storage” 推出 API 优先的 Git 代码存储层

根据 Hacker News 报道，Pierre “Code Storage” 软启动 API 优先的 Git 代码存储层，面向大规模 Agent 编码（单一 createCommitFromDiff API，原生 grep/archive/ephemeral branches 支持）；社区指出潜在的存储 ingress 成本担忧。

Agent 编码需要专门的代码存储基础设施，Pierre 的 API 优先设计简化了 Agent 对 Git 仓库的操作，但存储成本成为规模化部署的关注点。

开源生态与效率优化

🔧 AdaLLM 开源 RTX 4090 上的 NVFP4 推理

根据 Reddit 报道，AdaLLM 开源 RTX 4090 上的 NVFP4 推理，面向 Qwen3 和 Gemma3 — 相比 FP16 峰值 VRAM 降低 2.4 倍，Qwen3‑8B 达约 297 tok/s，消除 FP16 回退。

NVFP4 精度格式在消费级 GPU 上实现高性能推理，降低本地部署的硬件门槛，每秒约 297 Token 的吞吐量使 Qwen3‑8B 在 RTX 4090 上达到实用级别。

安全与风险

⚠️ ICML 提示词注入争议

根据 Reddit 报道，ICML 提示词注入争议：审稿人报告其批次中的每篇论文均在 PDF 元数据中发现注入指令，引发关于检测与威慑的辩论。

提示词注入从 AI 应用层渗透到学术出版流程，研究者通过在论文 PDF 中嵌入指令试图影响审稿过程，反映了 AI 系统在内容审核和元数据处理中的新型安全挑战。

🔍 Infra Insights

本日新闻共同指向 AI 基础设施的核心趋势：主权 AI 基础设施实质性扩张与Agent 基础设施成本系统性优化。

主权 AI 建设从概念走向落地，欧盟 AI 网格的五国扩张和联邦化运营模式，为其他地区提供了主权 AI 的实践模板。HIVE BUZZ 的 3000 万美元 GPU 协议和 Rizz Network 的 AI 无线网络融资，印证算力基础设施向区域性、专用化布局演进。

Agent 基础设施的成本优化成为创新热点。Cloudflare 的 Markdown for Agents 通过边缘转换实现 80% Token 削减，直接降低 RAG 成本；Pierre 的 API 优先代码存储层简化 Agent 编码流程。两者都体现了"为 Agent 设计基础设施"的理念 — 从人类可读向机器可读演进，从交互友好向程序化友好转变。

开源模型持续追赶前沿厂商。MiniMax M2.5 在 BrowseComp 和 SWE‑Bench 上的 SOTA 结果，以及每百万 0.30 美元的定价，反映开源生态在性能和成本竞争力上的双重进步。AdaLLM 的 NVFP4 推理在消费级 GPU 上实现高性能，降低本地部署门槛。

ICML 提示词注入争议揭示 AI 安全的新维度 — 攻击面从模型和应用层扩展到内容生产和分发流程，学术出版系统面临的挑战预示 AI 原生内容审核基础设施的必要性。

总体而言，近 48 小时的发展显示 AI 基础设施正在向三个方向演进：主权化（控制权在地）、Agent 化（为 AI 系统优化）、民主化（开源降低门槛）。