AI Infra Dao

AI Infra Brief|LiteLLM 关键供应链漏洞与 AI 基础设施新进展(2026.03.29)

2026 年 3 月 29 日,LiteLLM 关键供应链漏洞引发社区紧急响应,NVIDIA、Istio 和电信基础设施领域迎来重要更新。

🧭 核心速览

🚨 LiteLLM v1.82.7/1.82.8 遭供应链攻击,窃取凭证密钥

🎯 NVIDIA 发布 ProRL Agent 解耦 RL 训练与 Agent 编排

🌐 Istio 推出 AI 工作负载支持,KubeCon EU 发布两个新功能

🏭 Lumentum 在美建设激光制造设施服务 AI 数据中心

📡 ODC 融资 4500 万美元构建 AI 原生电信基础设施

🔒 nanobot 替换 LiteLLM 并修复邮箱注入漏洞

🔢 PentaNet 发布五元量化,WikiText-103 提升 6.4%

安全

🚨 LiteLLM 遭遇关键供应链攻击,影响 2000+ 下游包

根据 XReddit 讨论,LiteLLM 版本 1.82.7 和 1.82.8 于 3 月 28 日被检测到包含恶意代码,严重程度为关键。恶意 .pth 文件在每次 Python 进程启动时执行,窃取 SSH 密钥、云凭证和 API 密钥,源头是通过 Trivy 扫描器受损的发布令牌。影响包括 dspy 和 mlflow 在内的 2000+ 下游包。

这是 AI 基础设施领域迄今最严重的供应链攻击事件之一。依赖注入攻击直接威胁生产环境凭证安全,呼吁社区立即验证 LiteLLM 版本并迁移到集中式密钥管理。

🔒 nanobot 替换 LiteLLM 并修复邮箱注入漏洞

根据 GitHub 发布,nanobot v0.1.4.post6 于 3 月 29 日发布,直接替换 LiteLLM 为原生 OpenAI/Anthropic SDK,解构 Agent 运行时,添加端到端流式传输,并修复邮箱注入漏洞,直接缓解 LiteLLM 事件影响。

LiteLLM 攻击事件加速了社区对多提供商 SDK 抽象层的重新审视。nanobot 的快速响应体现了开源安全协作的敏捷性。

算力与云基础设施

🎯 NVIDIA 发布 ProRL Agent 解耦 RL 训练与 Agent 编排

根据 Marktechpost 报道,NVIDIA 于 3 月 27 日发布 ProRL Agent,通过异步 INIT/RUN/EVAL 管道解耦 I/O 密集型 Agent 编排与 GPU 密集型 RL 训练,避免慢评估阻塞训练。包含独立 HTTP rollout 服务、基于 Singularity 的 HPC 沙箱、token-in/token-out I/O、前缀缓存复用负载均衡,以及稳定性和利用率提升。

RLHF 是 LLM 对齐的关键步骤,但传统架构中评估与训练耦合导致资源浪费。ProRL 的解耦设计为大规模 Agent 强化学习提供了可扩展基础设施。

🌐 Istio 推出 AI 工作负载支持,KubeCon EU 发布两个新功能

根据 Cloud Native Now 报道,Istio 在 3 月 27 日 KubeCon + CloudNativeCon Europe 2026 发布两个面向 AI 工作负载的 beta 功能:Ambient Multicluster 实现无 sidecar 跨集群流量,Gateway API Inference Extension 标准化 Kubernetes 上 AI 流量管理。开源在 Istio 中。

Service Mesh 向 AI 工作负载演进标志着云原生基础设施与 AI 的深度融合。无 sidecar 模式降低了延迟,推理扩展标准化则提升可移植性。

🏭 Lumentum 在美建设激光制造设施服务 AI 数据中心

根据 HPCwire 报道,Lumentum 于 3 月 27 日宣布在北卡罗来纳州格林斯博罗建设 24 万平方英尺制造设施,生产基于 InP 的 CW 和 UHP 激光器用于数据中心内互连,NVIDIA 被引述为关键客户,增强超大规模 AI 供应链韧性。

数据中心光互连是 AI 集群带宽和能效的关键。美国本土制造减少地缘政治风险,强化 AI 基础设施供应链安全。

📡 ODC 融资 4500 万美元构建 AI 原生电信基础设施

根据 D Market Forces 报道,ODC 于 3 月 28 日完成 4500 万美元 A 轮融资,构建基站分布式计算网格,基于 NVIDIA Aerial RAN Computer Pro 实现实时生成推理和边缘 Physical AI,开放架构平台支持主权 AI。

电信基础设施向 AI 原生转型将推理能力推向边缘。分布式网格利用现有基站资源,为低延迟应用提供本地算力。

开源生态

🔢 PentaNet 发布五元量化,WikiText-103 提升 6.4%

根据 Reddit 讨论,PentaNet 于 3 月 28 日发布五元量化 {−2, −1, 0, +1, +2},保留零乘法器效率并提升精度,124M 模型在 WikiText-103 上提升 6.4% 困惑度,代码和权重在 Hugging Face。

从二进制到三进制再到五元,量化在保持推理效率的同时持续提升精度。PentaNet 的 6.4% 改进显示了低比特量化的潜力。

🔍 Infra Insights

本日核心趋势:供应链安全成为 AI 基础设施最大威胁RL 训练基础设施解耦加速电信与边缘 AI 融合深化

LiteLLM 供应链攻击是 AI 基础设施发展历程中的分水岭事件。2000+ 下游包受影响的规模暴露了 AI 生态系统的依赖脆弱性,攻击直接窃取凭证而非植入后门的特点显示攻击者对 AI 工作负载的深入理解。这一事件将加速三大变革:(1) 集中式密钥管理成为标配,环境变量和明文凭证将被淘汰;(2) 多提供商 SDK 抽象层将重新审视安全设计,nanobot 替换 LiteLLM 仅是开始;(3) 供应链审计和签名验证将强制化,Trivy 等工具的漏洞也敲响了警钟。与此同时,NVIDIA ProRL Agent 的解耦设计和 Istio 的 AI 工作负载支持显示基础设施正在适应 AI 的特殊需求:异步编排避免资源浪费,无 sidecar 模式降低延迟,标准化流量管理提升可移植性。ODC 的融资和 Lumentum 的美国制造则体现了 AI 基础设施的两个长期趋势:推理能力向边缘延伸以降低延迟,供应链本土化以降低地缘风险。安全、效率、韧性正在成为 AI 基础设施的三角支柱。