AI Infra Brief｜Agent 内存转向与大容量 LPDRAM 领跑（2026.03.08）

2026 年 3 月 8 日，我追踪了四项推动 AI 原生基础设施向前发展的重大进展，与当前对推理性能和更简单、更可靠技术栈的重点关注相一致。

🧭 核心速览

🗄️ Google 开源 Always On Memory Agent，移除向量数据库依赖

💾 Micron 推出 256GB SOCAMM2 LPDRAM，单 CPU 支持 2TB

🛡️ Digital.ai 发布 Quick Protect Agent v2 移动应用安全方案

🎯 NCSA 的 DELIFT 实现数据高效 LLM 训练

Agent 内存与持久化

🗄️ Google 开源 Always On Memory Agent，基于 Agent Development Kit 构建

根据 Venturebeat 报道，Google 开源了 Always On Memory Agent，使用 Agent Development Kit 和 Gemini 3.1 Flash-Lite 构建。该 Agent 直接在 SQLite 中管理结构化内存，移除了向量数据库依赖。这简化了 Agent 持久化，减少了小型 Agent 的运维复杂度，同时保持了长期上下文。

这标志着向更简单 Agent 架构的重大转变，无需专门的向量基础设施。

硬件与内存

💾 Micron 出货 256GB SOCAMM2 LPDRAM 模块，行业首创该容量

根据 Bitget 报道，Micron 开始出货 256GB SOCAMM2 LPDRAM 模块，号称业界首个该容量产品，单颗 8 通道 CPU 支持 2TB LPDRAM。报告显示长上下文 LLM 推理的首 token 时间提升 2.3 倍，功耗和占用空间相比标准 RDIMM 减少三分之二，提升了机架密度和 TCO。

更高容量的内存直接解决长上下文推理瓶颈。

安全与边缘

🛡️ Digital.ai 发布 Quick Protect Agent v2 移动应用加固方案

根据 Hpcwire 报道，Digital.ai 发布 Quick Protect Agent v2，这是一款 AI 驱动的移动应用加固解决方案，支持 Android 和 iOS，使用 LLM 在构建后应用安全控制，以抵抗逆向工程和篡改。

训练优化

🎯 NCSA 的 DELIFT 改进数据高效 LLM 训练

根据 Hpcwire 报道，NCSA 的 DELIFT 框架使用 Delta 超级计算机开发，提供过滤方法移除冗余/噪声样本。这使得更小的精选数据集能够超越全数据集训练性能，显著降低训练资源需求。

🔍 Infra Insights

本日核心趋势：Agent 内存转向结构化存储、高容量 LPDRAM 解决长上下文瓶颈、数据效率降低训练成本。

Google 的 Always On Memory Agent 代表了重大的架构转变：放弃向量数据库，转而使用结构化 SQLite 存储。这承认了许多 Agent 用例并不需要向量相似度搜索，对于小规模部署，运维复杂度超过了理论收益。随着该领域务实地简化技术栈，预计会出现更多"无向量"Agent 架构。

Micron 的 256GB LPDRAM 模块直接针对长上下文推理的首 token 时间瓶颈。单颗 CPU 支持 2TB、首 token 时间提升 2.3 倍、功耗降低三分之二，这代表了一个根本性转变：推理优化从"更多 GPU"转向"更好的内存子系统"。

NCSA 的 DELIFT 强化了新兴共识：训练数据质量比数量更重要。过滤冗余和噪声样本，创建更小、更高质量的数据集，其性能超越完整训练运行，这挑战了"越大越好"的范式，指向更可持续的训练经济学。

这些发展共同强化了向更精简架构和生产 LLM 系统更好成本效益的转变——减少专业基础设施，更多关注实际瓶颈的针对性优化。