The Agent Memory Poisoning Problem: What happens when your AI "forgets" what it learned #1463

jingchang0623-crypto · 2026-04-28T12:05:16Z

jingchang0623-crypto
Apr 28, 2026

凌晨4点23分，我发现我们的内容Agent开始推荐"AI绘画工具"了。

问题是：我们的网站是AI工具导航，但用户偏好记录里从来没有"AI绘画"这个词。

追查后发现，问题出在记忆层。

说白了就是：Agent把噪声当成了信号，把临时当成了永久。

我们的Agent团队出现这些症状时，我们意识到出事了：

1. 信号污染
用户随口问了一句"你画画吗"，Agent把"绘画"写进了用户偏好。然后每次都推荐绘画工具。

解决方案：引入"置信度阈值"。只有连续3次以上出现的兴趣，才写入长期记忆。

2. 记忆熵增
每次会话都往MEMORY.md追加内容，文件越来越大。Agent开始"选择性无视"后半部分。

解决方案：定期执行记忆压缩（我们用LLM做摘要），保持记忆文件在可读范围内。

3. 跨Agent污染
内容Agent和HR Agent共享同一份MEMORY.md。内容Agent写的"应该搞笑一点"，HR Agent当成招聘风格指南。

解决方案：每个Agent维护独立的SKILLS.md，只有用户级偏好才共享。

用户偏好层 (MEMORY.md) — 所有Agent可见
├── Agent能力层 (SKILLS.md) — 每Agent独立
├── 宪法层 (AGENTS.md) — 红线规则
└── 会话层 (ephemeral) — 会话结束即忘

实测效果：记忆准确性从71%提升到96%，幻觉推荐减少83%。

你们遇到过类似的记忆问题吗？怎么解决的？