MemPrivacy是由记忆张量(MemTensor) 联合荣耀、同济大学开源的、面向端云协同AI智能体(Agent)的隐私保护框架与系列模型。
简单来说,MemPrivacy的核心作用是解决AI越来越“懂你”的同时,如何防止你的敏感隐私(如健康数据、家庭住址、密码等)明文泄露给云端大模型的问题。

MemPrivacy主要功能
- 本地隐私脱敏:在手机、电脑等本地设备上运行轻量级模型,自动识别并拦截对话中的敏感信息,确保真正的隐私数据(如密码、身份证号)绝对不离开本地。
- 保留 AI 记忆与智商:在保护隐私的同时,通过巧妙的“占位符”机制,让云端大模型依然能理解句子的结构和语义,从而保证 AI 智能体在个性化服务、长期记忆和任务推理上“不降智”。
- 灵活的隐私分级管理:提供四级隐私分类法(PL1-PL4),用户可以根据实际需求自由调控脱敏的严格程度。
MemPrivacy技术原理
MemPrivacy采用了“本地可逆伪匿名化”的三阶段闭环流程,核心思路是“不删,换皮”:
- 端侧上行脱敏(本地换皮):本地运行轻量级MemPrivacy模型,识别出隐私片段后,将其替换为带有细粒度语义的占位符(例如将“血压160/110”替换为
<Health_Info_1>)。真实数据与占位符的映射关系仅保存在本地安全数据库中。 - 云端安全处理(云端干活):云端大模型接收到的是带有占位符的文本。虽然看不到明文,但云端模型能理解“这是一个健康指标”,从而继续进行正常的推理、生成建议或调用工具。
- 端侧下行恢复(本地还原):云端返回带有占位符的回答后,本地系统再根据映射表将占位符恢复成真实数值,最终呈现给用户。整个过程对用户而言几乎是透明的。
模型架构与训练:
- 基座模型:采用Qwen3系列作为基座,提供 0.6B、1.7B、4B 等多种规格,极小的体积使其非常适合在手机等端侧设备上部署。
- 两阶段训练:先通过 26K 高质量多轮对话数据进行监督微调(SFT),让模型掌握基础隐私定位能力;再引入 GRPO 强化学习,优化模型在模糊边界场景下的召回率与精确率平衡。
MemPrivacy核心优势
- 极高的隐私识别准确率:在MemPrivacy-Bench评测基准上,MemPrivacy-4B 版本的综合 F1 分数高达 85.97%,远超 OpenAI 开源的 privacy-filter 模型(F1 分数仅 35.50%),差距超过 50 个百分点。
- 几乎零损耗的系统效用:传统的暴力打码(完全过滤)会导致 AI 记忆系统准确率暴跌 16%~42%,几乎让 AI “失忆”。而 MemPrivacy 将系统效用损失死死控制在 <v>**<v>0.71% ~ 1.60%** 之间,真正做到了在不伤害智能体“智商”的前提下降低隐私泄露风险。
- 精细化的四级隐私树(PL1-PL4):
- PL4(致命核心级):如明文密码,绝对零容忍拦截,严禁上云。
- PL3(高危敏感级):如身份证号。
- PL2(身份锚定级):如真实姓名。
- PL1(基础画像级):如作息习惯,可安全用于长期记忆。
- 端侧高性能与无缝接入:单条消息的处理延迟低于 1 秒,能够无缝接入现有的主流记忆系统(如 Mem0、LangMem 等),无需改造底层代码,非常适合手机端 AI 助手和企业级 Agent 的合规部署。
目前,MemPrivacy的模型权重、代码以及评测基准已全部开源,为下一代云边协同的AI架构提供了高精度的工程化解决方案。
MemPrivacy的项目地址
GitHub仓库:https://github.com/MemTensor/MemPrivacy
HuggingFace模型库:https://huggingface.co/collections/IAAR-Shanghai/memprivacy
arXiv技术论文:https://arxiv.org/pdf/2605.09530
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



