生化危机女主用Claude打造0.7美元AI一年反杀大厂
最近,一个名为MemPalace的开源AI记忆系统在技术社区引发了不小的震动。它不仅在公认严苛的长期记忆基准测试LongMemEval中,以500题全对的成绩斩获了全球首个满分,其背后的开发者身份更是出人意料——其中一位是曾主演《第五元素》、《生化危机》的好莱坞影星米拉·乔沃维奇(Milla Jovovich)。
这个项目在GitHub上已迅速获得近1.8万颗星,其诞生故事本身,就颇具启发性。
从游戏梦到记忆宫殿:一个偶然的转向
MemPalace的诞生,源于一次创作上的“卡壳”。半年前,米拉从工程师好友Ben Sigman那里初次接触了Claude Code。作为一名热爱写作的创作者,她立刻被这种能将文字想法转化为实际代码的能力所吸引,并雄心勃勃地想要构建一款大型游戏。
然而,在开发过程中,她遇到了一个根本性的痛点:AI缺乏“记忆”。每次开启新的对话会话,之前所有讨论过的设计思路、推翻的方案、尝试过的路径都会清零。这让她深刻意识到,AI虽然强大,但本质上仍是一个工具,真正赋予项目灵魂与独特性的,是人类永不枯竭的想象力与好奇心。如果没有这些,AI充其量只是个高级搜索引擎。
于是,她和Ben决定暂停游戏项目,转而先解决这个“拦路虎”。米拉以“架构师”的身份负责逻辑与设计,Ben则负责代码实现。经过六个月的打磨,这套名为“记忆宫殿”的系统——MemPalace,正式问世。
“记忆宫殿”如何工作?结构化本身就是检索力
MemPalace的设计灵感,来源于古希腊演说家使用的“记忆术”。他们将演讲内容“放置”在脑海宫殿的不同房间里,演讲时只需在宫殿中漫步,便能调出所有内容。
MemPalace将这一古典智慧数字化、结构化。它将所有数据组织成一个虚拟的宫殿:每个项目、每个人或每个主题,都是宫殿里的一个“翼楼”。翼楼内设有按主题分类的“房间”,例如“认证系统”、“数据库选型”等,数量不限。房间之间由代表不同记忆类型(如决策、里程碑、偏好等)的“走廊”连接。
最巧妙的设计在于“隧道”:当不同翼楼中存在同名房间(例如,人员“Kai”的翼楼和项目“Driftwood”的翼楼里都有一个“auth迁移”房间)时,系统会自动生成隧道将它们关联起来,实现跨视角的记忆融合。
每个房间配有一个存储摘要索引的“衣柜”,而“衣柜”里的“抽屉”则保存着原始对话的每一个字。这种结构带来了高效的检索能力:AI无需遍历全部数据,而是先定位翼楼,再进入房间,最后打开抽屉,搜索范围从全局急剧缩小到精准目标。
测试数据显示,在超过2.2万条真实对话记忆上,全库搜索的召回率为60.9%,而结合翼楼和房间的元数据过滤后,召回率飙升至94.8%,提升了34个百分点。这意味着,MemPalace的结构化设计本身,就构成了强大的检索引擎。所有数据都存储在本地ChromaDB中,无需调用云端API,实现了零成本运行。
成本对比:一年仅需0.7美元
MemPalace在成本控制上表现惊人。根据估算,一个重度AI用户半年可能产生1950万token的对话历史。如果仅依赖大模型自身做摘要处理,一年成本约507美元,且摘要过程会丢失关键的推理细节。
而使用MemPalace,每次AI启动时仅需加载约170个token的关键事实(如团队、项目、偏好等),仅在需要时才进行精准检索。综合计算,其一年的运行成本仅需约0.7美元。
AAAK:写给AI看的“速记法”
MemPalace中还有一个亮点设计,名为AAAK。这是一种专门为AI理解而设计的结构化压缩“方言”,旨在用极少的token传递完整信息。
例如,一段约1000个token的英文描述,压缩成AAAK格式后仅需约120个token,信息无损,体积缩减至原来的约八分之一。AAAK的本质是高度结构化的文本,任何能够理解文本的大模型(如Claude、GPT、Gemini)都能直接解析,无需额外的解码器或微调。
社区的审视与开发者的坦诚
MemPalace上线后,迅速经历了开源社区的严格审视。社区开发者们指出了项目初期宣传中存在的一些不准确之处:例如AAAK的“30倍无损压缩”说法被验证为有损压缩,且在某些情况下token数并未减少;“+34%宫殿增益”本质上是利用向量数据库的标准元数据过滤功能,并非独创机制;知识图谱的矛盾检测功能也尚未接入主流程。
面对这些指正,米拉和Ben展现出了难得的坦诚。他们没有删除评论或辩解,而是在项目首页发布了一封公开信,逐条承认了描述上的不准确之处,并承诺修正。公开信的最后一句写道:“我们宁愿正确,也不愿看起来厉害。”
这场“扒皮”反而为项目进行了一次免费的“信任审计”。在褪去夸大宣传的外衣后,社区更清晰地看到了MemPalace的核心价值:其在LongMemEval基准测试中96.6%的原始模式成绩是实打实的,完全本地免费运行的特性也是实打实的。批评并未杀死这个项目,反而让更多人开始认真关注其技术实质。
三步上手:开发范式的变迁
MemPalace的使用非常简洁。通过pip安装后,用户只需初始化自己的“世界”(设定项目和协作者),导入历史数据(代码、文档、聊天记录等),即可开始搜索。更关键的是,它能无缝接入Claude、ChatGPT、Cursor等支持模型上下文协议(MCP)的工具。只需一行命令连接,AI助手便能自动调用MemPalace的19个工具进行记忆检索,用户无需再手动干预。
这个项目最引人深思之处,或许不在于那个满分成绩,也不在于压缩比,而在于它再次印证了一个趋势:AI时代,“开发者”的边界正在变得模糊。一位好莱坞影星与一位工程师合作,借助Claude这样的AI编程助手,便在一个被大厂反复攻坚的领域(长期记忆)取得了突破性进展,并且选择将其开源、免费。
正如Ben在最新帖子中玩的一个双关梗:MemPalace -> Multipass。对于《第五元素》的影迷来说,“Multipass”(通行证)是主角莉露的经典台词。而MemPalace,似乎正在为AI拥有持久、结构化的记忆,打开一条“通行无阻”的新路径。