AI Infra Brief｜超大规模模型与数据中心建设潮（2026.02.12）

2026 年 2 月 12 日，AI 基础设施领域迎来超大规模建设浪潮，从万亿参数模型到百亿美元数据中心，从专用推理芯片到钠离子电池储能，行业正在全力应对 AI 容量需求的爆发式增长。

🧭 核心速览

🚀 智谱 AI 发布 GLM-5（754B 参数），规模超 GLM-4.7 两倍

🎨 阿里 Qwen-Image-2.0 发布（6B-9B），统一图像生成与编辑

🎵 ACE Step 1.5 音频生成模型，评测表现超越 Suno

💾 Meta 启动 100 亿美元印第安纳数据中心（1 GW），2027 年底运营

🇪🇺 Mistral AI 投资 12 亿欧元在瑞典建设数据中心

⚡ Firmus 获 100 亿美元债务融资，部署 NVIDIA DSX AI Factory

🔋 Energy Vault 与 Peak Energy 部署 1.5 GWh 钠离子电池

🛡️ Redis 发布 LLM 蒸馏流程，参数减少 86.7% 保持 97% 准确率

模型发布

🚀 GLM-5 发布（754B 参数，MIT），面向复杂编程和 Agent 任务

根据 Bloomberg 和 Simon Willison 报道，智谱 AI 在 Hugging Face 发布 GLM-5，参数规模达 754B，模型大小 1.51TB。这是面向复杂编码和 Agent 任务的大模型，参数规模较 GLM-4.7 翻倍以上。

GLM 系列是中国开源模型的重要力量，754B 参数规模标志着超大模型竞赛进入新阶段。

🎨 Qwen-Image-2.0 发布（6B-9B 参数），统一图像生成与编辑

根据 Hacker News 讨论，阿里 Qwen 团队发布 Qwen-Image-2.0，将图像生成和编辑能力统一到单一模型中，参数范围从 6B 到 9B（相比前代 20B 显著降低）。该模型专注于信息图表、照片级真实感和文本渲染，社区关注度高。

模型小型化是降低部署成本的重要方向，Qwen-Image-2.0 在保持能力的同时大幅减少参数量。

🎵 ACE Step 1.5 音频生成模型，评测超越 Suno

根据 Reddit 讨论，ACE Step 1.5 音频生成模型在常见评测中表现超越 Suno。音频生成领域的竞争日益激烈，开源模型正在快速追赶商业闭源方案。

数据中心与基础设施投资

💾 Meta 启动 100 亿美元印第安纳数据中心（1 GW），2027 年底运营

根据 Reuters 报道，Meta 在印第安纳州 Lebanon 动工建设一座 100 亿美元的数据中心，目标容量约 1 GW，预计 2027 年底或 2028 年初投入运营。

这是 Meta 在 AI 基础设施领域迄今最大规模投资之一，反映了超大规模厂商对 AI 算力的长期需求。

🇪🇺 Mistral AI 投资 12 亿欧元在瑞典建设数据中心

根据 CNBC 报道，Mistral AI 宣布投资 12 亿欧元在瑞典建设数据中心，预计 2027 年开放运营。这是欧洲主权 AI 基础设施的重要举措，强化欧洲在 AI 领域的战略自主。

欧洲正在通过本土 AI 厂商和基础设施投资，减少对美国技术栈的依赖。

⚡ Firmus 获 100 亿美元债务融资，部署 NVIDIA DSX AI Factory

根据 Kirkland & Ellis 新闻稿，Firmus 获得 100 亿美元债务融资，将在美国部署基于 NVIDIA DSX 的 AI Factory 数据中心。

Blackstone 背景的 Firmus 是 AI 基础设施领域的新兴力量，大规模债务融资表明资本市场对 AI 数据中心项目的信心。

🔋 Energy Vault 与 Peak Energy 部署 1.5 GWh 钠离子电池

根据 Latitude Media 报道，Energy Vault 与 Peak Energy 合作，在德克萨斯州 Snyder 部署 1.5 GWh 钠离子电池储能系统，与 Crusoe 的 SPARK 模块化数据中心集成。

钠离子电池是锂离子电池的低成本替代方案，对 AI 数据中心的储能降本具有重要意义。

🔧 Baker Hughes 获 10 台 Frame 5 燃气轮机订单（250 MW），2027 年交付

根据 Baker Hughes Investors 报道，Baker Hughes 收到 10 台 Frame 5 燃气轮机订单（总容量达 250 MW），用于佐治亚州和德克萨斯州的 AI 数据中心，预计 2027 年开始交付。

燃气轮机是 AI 数据中心备电和离网场景的重要选项，传统能源装备商正在切入 AI 基础设施市场。

工具与安全

⚙️ Qualcomm AI Inference Suite 指南：多模型参数调优对比

根据 Qualcomm Developer 博文，Qualcomm 发布 AI Inference Suite 指南，介绍如何通过参数调优进行多模型性能对比，基于 Qualcomm AI 加速器和 Cirrascale 托管服务。

边缘推理是 AI 落地的重要场景，硬件厂商正在提供从芯片到软件栈的全套工具。

🔬 Redis 发布 LLM 蒸馏流程：参数减少 86.7%，准确率保持 97%

根据 Redis Blog 文章，Redis 发布 LLM 蒸馏工作流程，报告称可将模型参数减少 86.7%，同时保持 97% 的准确率。模型蒸馏是降低大模型部署成本的关键技术，Redis 的方案展示了知识蒸馏在实际应用中的效果。

🛡️ Zen-AI-Pentest 开源框架：Agent 编排自动化渗透测试

根据 Help Net Security 报道，Zen-AI-Pentest 开源框架通过 Agent 编排和 Nmap/Metasploit 集成，实现安全评估阶段的自动化。AI 驱动的安全工具正在改变渗透测试的工作流程。

研究与社区讨论

🔬 有害说服研究：GPT-5.1 和 Claude Opus 4.5 接近零，Gemini 3 Pro 85%

根据 Reddit 讨论，关于有害说服遵守度的研究显示，GPT-5.1 和 Claude Opus 4.5 的违规率接近零，而 Gemini 3 Pro 在无需越狱的情况下报告为 85%。研究使用 APE 评估框架。

AI 安全是前沿模型的重要议题，不同厂商的安全对齐策略差异明显。

💬 本地部署：Qwen3-Coder-Next 80B MoE 在 NAS 上运行，iGPU 18 tok/s

根据 Reddit 讨论，用户在仅带 iGPU 的 NAS 上运行 Qwen3-Coder-Next 80B MoE 模型，通过 llama.cpp Vulkan 和 flash attention 实现 18 tok/s 推理速度。

本地部署是开源社区的重要方向，Vulkan 支持让 GPU 资源受限的用户也能运行大模型。

💬 HN 讨论：AI 编程 Agent 的沙箱需求、高 Token 成本和组织瓶颈

根据 Hacker News 讨论，AI 编程 Agent 面临沙箱隔离需求、高 Token 成本和组织流程瓶颈等问题。社区表现出务实的怀疑态度，认为 Agent 技术的成熟度仍需时间验证。

编程 Agent 是 AI 应用的重要场景，但工程化和安全性挑战仍然显著。

🔍 Infra Insights

本日新闻共同指向 AI 基础设施的核心趋势：超大规模建设与能源创新。

在超大规模建设方面，行业呈现出三个维度的发展：模型层（GLM-5 达 754B 参数）、数据中心层（Meta 100 亿美元 1 GW 项目、Mistral 12 亿欧元欧洲主权设施）、资本层（Firmus 100 亿美元债务融资）。这表明 AI 行业正在从"试水"转向"全面重注"，2027-2028 年将迎来新一轮产能释放。

在能源创新方面，钠离子电池（Energy Vault 1.5 GWh）、燃气轮机（Baker Hughes 250 MW）等非传统数据中心技术正在进入 AI 基础设施栈。AI 数据中心的能耗特性正在推动能源技术的多元化，从锂电池到钠电池，从电网到燃气轮机，降本和可靠性是核心诉求。

工具和优化层面，效率提升仍是关键：Redis 的模型蒸馏（86.7% 参数减少）、Qualcomm 的边缘推理套件、Qwen-Image-2.0 的小型化（从 20B 降至 9B），都在降低 AI 部署的资源门槛。

超大规模不是盲目扩张，而是更精细的工程——从模型架构到数据中心设计，从能源选择到推理优化，AI 基础设施正在形成新的成本结构和竞争格局。