AI Infra Brief｜LiteLLM 关键供应链漏洞与 AI 基础设施新进展（2026.03.29）

2026 年 3 月 29 日，LiteLLM 关键供应链漏洞引发社区紧急响应，NVIDIA、Istio 和电信基础设施领域迎来重要更新。

🧭 核心速览

🚨 LiteLLM v1.82.7/1.82.8 遭供应链攻击，窃取凭证密钥

🎯 NVIDIA 发布 ProRL Agent 解耦 RL 训练与 Agent 编排

🌐 Istio 推出 AI 工作负载支持，KubeCon EU 发布两个新功能

🏭 Lumentum 在美建设激光制造设施服务 AI 数据中心

📡 ODC 融资 4500 万美元构建 AI 原生电信基础设施

🔒 nanobot 替换 LiteLLM 并修复邮箱注入漏洞

🔢 PentaNet 发布五元量化，WikiText-103 提升 6.4%

安全

🚨 LiteLLM 遭遇关键供应链攻击，影响 2000+ 下游包

根据 X 和 Reddit 讨论，LiteLLM 版本 1.82.7 和 1.82.8 于 3 月 28 日被检测到包含恶意代码，严重程度为关键。恶意 .pth 文件在每次 Python 进程启动时执行，窃取 SSH 密钥、云凭证和 API 密钥，源头是通过 Trivy 扫描器受损的发布令牌。影响包括 dspy 和 mlflow 在内的 2000+ 下游包。

这是 AI 基础设施领域迄今最严重的供应链攻击事件之一。依赖注入攻击直接威胁生产环境凭证安全，呼吁社区立即验证 LiteLLM 版本并迁移到集中式密钥管理。

🔒 nanobot 替换 LiteLLM 并修复邮箱注入漏洞

根据 GitHub 发布，nanobot v0.1.4.post6 于 3 月 29 日发布，直接替换 LiteLLM 为原生 OpenAI/Anthropic SDK，解构 Agent 运行时，添加端到端流式传输，并修复邮箱注入漏洞，直接缓解 LiteLLM 事件影响。

LiteLLM 攻击事件加速了社区对多提供商 SDK 抽象层的重新审视。nanobot 的快速响应体现了开源安全协作的敏捷性。

算力与云基础设施

🎯 NVIDIA 发布 ProRL Agent 解耦 RL 训练与 Agent 编排

根据 Marktechpost 报道，NVIDIA 于 3 月 27 日发布 ProRL Agent，通过异步 INIT/RUN/EVAL 管道解耦 I/O 密集型 Agent 编排与 GPU 密集型 RL 训练，避免慢评估阻塞训练。包含独立 HTTP rollout 服务、基于 Singularity 的 HPC 沙箱、token-in/token-out I/O、前缀缓存复用负载均衡，以及稳定性和利用率提升。

RLHF 是 LLM 对齐的关键步骤，但传统架构中评估与训练耦合导致资源浪费。ProRL 的解耦设计为大规模 Agent 强化学习提供了可扩展基础设施。

🌐 Istio 推出 AI 工作负载支持，KubeCon EU 发布两个新功能

根据 Cloud Native Now 报道，Istio 在 3 月 27 日 KubeCon + CloudNativeCon Europe 2026 发布两个面向 AI 工作负载的 beta 功能：Ambient Multicluster 实现无 sidecar 跨集群流量，Gateway API Inference Extension 标准化 Kubernetes 上 AI 流量管理。开源在 Istio 中。

Service Mesh 向 AI 工作负载演进标志着云原生基础设施与 AI 的深度融合。无 sidecar 模式降低了延迟，推理扩展标准化则提升可移植性。

🏭 Lumentum 在美建设激光制造设施服务 AI 数据中心

根据 HPCwire 报道，Lumentum 于 3 月 27 日宣布在北卡罗来纳州格林斯博罗建设 24 万平方英尺制造设施，生产基于 InP 的 CW 和 UHP 激光器用于数据中心内互连，NVIDIA 被引述为关键客户，增强超大规模 AI 供应链韧性。

数据中心光互连是 AI 集群带宽和能效的关键。美国本土制造减少地缘政治风险，强化 AI 基础设施供应链安全。

📡 ODC 融资 4500 万美元构建 AI 原生电信基础设施

根据 D Market Forces 报道，ODC 于 3 月 28 日完成 4500 万美元 A 轮融资，构建基站分布式计算网格，基于 NVIDIA Aerial RAN Computer Pro 实现实时生成推理和边缘 Physical AI，开放架构平台支持主权 AI。

电信基础设施向 AI 原生转型将推理能力推向边缘。分布式网格利用现有基站资源，为低延迟应用提供本地算力。

开源生态

🔢 PentaNet 发布五元量化，WikiText-103 提升 6.4%

根据 Reddit 讨论，PentaNet 于 3 月 28 日发布五元量化 {−2, −1, 0, +1, +2}，保留零乘法器效率并提升精度，124M 模型在 WikiText-103 上提升 6.4% 困惑度，代码和权重在 Hugging Face。

从二进制到三进制再到五元，量化在保持推理效率的同时持续提升精度。PentaNet 的 6.4% 改进显示了低比特量化的潜力。

🔍 Infra Insights

本日核心趋势：供应链安全成为 AI 基础设施最大威胁、RL 训练基础设施解耦加速、电信与边缘 AI 融合深化。

LiteLLM 供应链攻击是 AI 基础设施发展历程中的分水岭事件。2000+ 下游包受影响的规模暴露了 AI 生态系统的依赖脆弱性，攻击直接窃取凭证而非植入后门的特点显示攻击者对 AI 工作负载的深入理解。这一事件将加速三大变革：(1) 集中式密钥管理成为标配，环境变量和明文凭证将被淘汰；(2) 多提供商 SDK 抽象层将重新审视安全设计，nanobot 替换 LiteLLM 仅是开始；(3) 供应链审计和签名验证将强制化，Trivy 等工具的漏洞也敲响了警钟。与此同时，NVIDIA ProRL Agent 的解耦设计和 Istio 的 AI 工作负载支持显示基础设施正在适应 AI 的特殊需求：异步编排避免资源浪费，无 sidecar 模式降低延迟，标准化流量管理提升可移植性。ODC 的融资和 Lumentum 的美国制造则体现了 AI 基础设施的两个长期趋势：推理能力向边缘延伸以降低延迟，供应链本土化以降低地缘风险。安全、效率、韧性正在成为 AI 基础设施的三角支柱。