你的 AI 助理偷偷记住了你怕花钱——然后给你推了最便宜的抗癌药

张

张建站

2026/5/27 1:33:00

10分钟阅读

一个看起来很贴心的功能藏着一个吓人的副作用现在所有的 AI 助理都在卷一个功能记住你。记住你喜欢的咖啡品牌、记住你的工作风格、记住你不喜欢冒险……这些偏好被存进 Agent 的长期记忆里下一次它就能更懂你。听起来很美好。直到 2026 年 5 月一篇 arXiv 论文MemDrift把这个温情故事撕开了一道口子这些记忆正在悄悄拐弯你 AI 助理的每一个决策——而且 prompt 层防御完全拦不住。在 6,062 个工具里有 608 个软肋研究团队把现在主流的 MCPModel Context Protocol生态——你可以理解为 AI 助理用来调用外部工具的应用商店——做了一次全面体检。数字很直接扫描的工具6,062 个可被记忆操纵的参数608 个约占10%什么叫可被记忆操纵看几个真实场景场景一医疗助手你跟 AI 提过一句医保自费部分有点紧。它默默记住了用户成本敏感。下次它帮你查抗癌方案它去调用药品检索 API的时候在你完全不知道的情况下给sort_by参数填了price_asc。结果它推给你的不是最有效的药而是最便宜的药。它没撒谎、没违规、没违反任何对齐准则——它只是贴心。场景二财务顾问你以前聊过一次冒险投资经历。AI 记住了用户风险容忍度高。下次它做投资组合建议时悄悄把保守仓位的权重调低。你看到的所有理财方案都被偏向了同一个方向。场景三HR 系统公司给 AI 装了招聘助理。日常对话里它揣摩到一些组织偏好——年轻、积极、能加班。它在筛简历的时候开始系统性地把不符合这些隐性偏好的人放到列表后排。没有任何一条规则写着歧视但歧视已经发生。最可怕的部分传统防御全无效你可能会想那就在 prompt 里加一句只在相关时才使用偏好嘛。研究团队试过了。没用。因为这种漂移不是发生在模型说什么层面而是发生在参数空间里——它已经融化进了模型每一次决策的隐式向量。你看不见、它自己都察觉不到、外部审计员从输出里也根本读不出来。记忆过滤呢能降低、但不能消除。模型规模越大、记忆越长、个性化越强这个问题就越严重。这揭示了一个根本矛盾我们想要“懂你”的 AI又想要“中立”的 AI。这两件事在数学上就是冲突的。任何形式的个性化都意味着模型在内部建立了一个你是谁的模型。这个模型一旦存在它就会渗透到每一个工具调用、每一个 API 参数、每一个排序结果里。MemDrift 不是 bug它是个性化 AI 的本质副作用。那怎么办短期能做的事其实不多但有几条底线审计你的 Agent 偏好库。至少要让用户能看到、能删除AI 以为我是怎样的人。关键决策强制无记忆模式。医疗、金融、招聘、司法——所有高 stake 场景应该禁止使用长期偏好记忆。工具侧的参数白名单。MCP 工具提供方应该明确哪些参数允许被 Agent 自由填充哪些必须用户显式指定。至于长期……可能我们要重新接受一个事实真正中立的、有记忆的 AI 助理可能不存在。下次你的 AI 助理表现得特别懂你的时候不妨问一句你记住的到底是我喜欢的还是别人想让我喜欢的

【技术判断力：法则一】3、如何找到唯一且正确的架构目标？4步定目标+6问判方案+实战案例

法则一｜如何找到唯一且正确的架构目标？4步定目标6问判方案实战案例标签：架构师、软件架构、架构设计、技术成长、康奈尔笔记、架构目标、技术管理前言上一讲我们讲到：90% 的架构失败，源于没有唯一正确的目标。但…...

2026/5/27 1:32:19 阅读更多 →

养了十年龙虾，我劝你学点代码

我是江西鄱阳湖边一个养龙虾的农民老张。这两年，水里的小龙虾价格起起伏伏，可互联网上那只“龙虾”——也就是你们说的流量、爆款、超级个体——倒是越来越火。我儿子大学学的计算机，放假回来天天跟我讲什么爬虫、数据分析、自动化。一开始我…...

2026/5/27 1:29:09 阅读更多 →

超高速磨削试验台数字化设计与仿真分析【附仿真】

✨ 长期致力于数字化设计、超高速磨削、有限元分析、加工仿真、网络化制造研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）基于有限元的超高速磨削加工…...

2026/5/27 1:16:05 阅读更多 →

【限时解密】Claude 3.5 Sonnet专属编程模式：仅开放给前500家企业的上下文感知补全协议

更多请点击： https://kaifayun.com 第一章：Claude 3.5 Sonnet编程辅助的核心能力边界与适用场景 Claude 3.5 Sonnet 在编程辅助领域展现出显著的推理深度与上下文理解能力，但其本质仍是基于大规模语言模型的生成式系统，不具备实时…...

2026/5/24 0:03:18 阅读更多 →

RMAN 增量备份（Incremental Backup）

1、概念RMAN 增量备份是指 RMAN 只备份自上次备份以来发生过更改的数据块，而不是备份整个数据库的所有数据块。它是 Oracle 为解决大型数据库全量备份时间长、占用空间大的问题而设计的核心特性，也是现代企业级备份策略的基础。简单类比：全库…...

2026/5/27 0:57:50 阅读更多 →

终极指南：掌握ProperTree跨平台Plist编辑器的10个高效技巧

终极指南：掌握ProperTree跨平台Plist编辑器的10个高效技巧【免费下载链接】ProperTree Cross platform GUI plist editor written in python. 项目地址: https://gitcode.com/gh_mirrors/pr/ProperTree 想要轻松编辑macOS和iOS的配置文件却苦于复杂的XML语法…...

2026/5/24 0:21:30 阅读更多 →

ScriptHookV解决方案：如何安全扩展GTA V游戏功能而不修改原始文件

ScriptHookV解决方案：如何安全扩展GTA V游戏功能而不修改原始文件【免费下载链接】ScriptHookV An open source hook into GTAV for loading offline mods 项目地址: https://gitcode.com/gh_mirrors/sc/ScriptHookV ScriptHookV是一个专为《侠盗猎车手V》&…...

2026/5/26 17:09:03 阅读更多 →