0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Evermem 突破大模型记忆瓶颈实现低耗高效

话说科技 来源:话说科技 作者:话说科技 2026-03-03 13:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

由陈天桥和邓亚峰带队的EverMind最新发布世界级长期记忆系统——EverMemOS,即SOTA,一举打破多项记忆基准测试的同时,还能远超此前所有的基线方法。

wKgZPGmmdUyAZpuHAAA_bJcnBAw99.webp

其次,它是真正能用的。

不是只会跑测试的“花架子”,实际部署后效果照样能打。而且团队有底气有信心,技术代码全部开源。

为了方便开发者使用,他们刚刚还专门上线了云服务——现在只需一个最简单的API,就能直接将最前沿的大模型记忆能力装进自己的应用。

学习大脑记忆机制,成了。

启发于脑科学技术的研究成果,盛大一直以来非常重视长期记忆领域的研究。早在2024年10月,盛大团队就对外发布了长期记忆领域的纲领性文章《Long Term Memory-The Foundation of AI Self-Evolution》。

基于盛大多个团队在该领域的持续积累,EverMind在2025年8月正式启动EverMemOS项目,并于11月对外正式发布开源版本。

EverMemOS是EverMind打造的首款AI记忆基础设施,对比同赛道团队,似乎姗姗来迟。

Mem0、Zep等产品最早都能追溯到2024年,现在商业化最成功的开发者框架Letta(原MemGPT)也是2023年就开始起步。

EverMemOS却交出了亮眼的答卷:最晚入场,但效果弯道超车。

从技术角度看,它同时继承了基于外部存储和基于隐状态两种路径。不过业内并非没有尝试过此类方案,但EverMind显然在记忆提取的精准度和逻辑一致性上实现了更优的平衡。

原因在于EverMind抓住了精髓,用邓亚峰的话说,就是:

通过EverMemOS,我们赋予智能体一个活的、不断演化的历史。

这里的关键词其实是“活的”。那么如何能保存最鲜活的记忆呢?人类大脑。

这就引出了EverMind的独特思路——生物启发。

wKgZO2mmdU2AZmdkAAFyvtDbBb028.webp

具体来讲,EverMemOS通过模拟人类记忆的形成并转化为计算框架,利用三阶段层层递进以实现大模型长期记忆的存储和提取:

Step 1:情景轨迹构建。

对应人脑的海马体和内嗅皮层,可以将连续的对话内容拆分成一个个独立的记忆单元(MemCell),每个单元里不仅记录有完整的聊天内容,还包括一些关键事实、时效信息等。

Step 2:语义整合。

类比新皮层(前额叶皮层+颞叶皮层),系统会将内容相关的记忆单元归类在一起,形成主题化的记忆场景(MemScene),同时还会更新用户画像,区分用户的长期稳定偏好和短期临时状态。

Step 3:重构式回忆。

这一步对应的是前额叶皮层和海马体的协同机制,当用户提问时,系统就会在记忆场景的引导下进行智能检索,只挑选出必要且足够的记忆内容,用于后续的推理任务。

由此,AI学会像人类一样记忆——这不仅是知识的数据库存储,更是认知系统的深度整合。如此一来,即便是在多个Agent之间,也能实现信息的高效传递。

wKgZPGmmdU2AU_cSAAGQnBz4zt836.webp

至于效果如何,咱们还是眼见为实,看看基准测试结果。

团队选取了4个主流记忆基准测试,以及多种大模型记忆增强方法。所有方法都基于同一基础大模型(GPT-4o-mini或GPT-4.1-mini)进行测试。

结果也很明显,EverMemOS大获全胜,全面超越现有记忆系统和全上下文模型。

wKgZO2mmdU6AQ7fJAAGGGIqJgcs22.webp

其中在LoCoMo上,准确率直接一跃来到93.05%,尤其是在多跳推理和时序任务上表现突出,分别提升19.7%和16.1%,同时token使用量和计算成本得到大幅度降低。

在多会话对话评估LongMemEval里,EverMemOS同样以83%的准确率位居榜首,说明在面对跨度极大、信息量极高的场景中,EverMemOS依旧能够精准检索和关联到过去的信息,并且通过持续交流还会不断进化完善自己。

HaluMem由MemTensor和中国电信研究院联合发布,是业界首个面向AI记忆系统的操作级幻觉评估基准。而EverMemOS在保证记忆完整性的同时,也显著改善了幻觉现象。

在PersonaMem v2里,EverMemOS在九个复杂场景中依旧全场最佳,保证了深度个性化和行为一致性。

wKgZPGmmdU6AYkp0AACYKPeTF5Y12.webp

足以见得,EverMemOS是相当全能的一枚选手,记性好、搜得准,关键还运行速度快、成本还够低,最长可突破百兆上下文限制。

一边帮大模型减负,一边帮大模型补记忆力,堪称大模型版安神补脑液。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大模型
    +关注

    关注

    2

    文章

    3854

    浏览量

    5289
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI Ceph 分布式存储教程资料大模型学习资料2026

    往往成为瓶颈。 AI 分布式存储实战的首要科技突破,在于摒弃了传统的层级目录结构,转向扁平化的对象存储与键值存储架构。通过去除元数据节点的中心化瓶颈,采用哈希环或一致性哈希算法进行数据寻址,
    发表于 05-01 17:35

    九天菜菜大模型agent智能体开发实战2026一月班

    和长期记忆,短期记忆存储即时信息,长期记忆沉淀持久知识,通过向量数据库等技术实现高效存储与检索,为 Agent 的决策提供有力支持。规划模块
    发表于 04-15 16:04

    技术解析 PSRAM 在 HPLC 电力载波通信系统中的应用与实现

    PSRAM破解HPLC芯片内存瓶颈,适配主流型号,低耗易集成,助力智能电网升级。
    的头像 发表于 04-15 15:29 223次阅读
    技术解析 PSRAM 在 HPLC 电力载波通信系统中的应用与<b class='flag-5'>实现</b>

    少模光纤:突破带宽瓶颈的新兴技术

    (Few-Mode Fiber, FMF)凭借其独特的模分复用(MDM)技术,成为突破带宽瓶颈的关键解决方案。本文将从技术原理、应用场景及未来趋势三方面,解析少模光纤如何重塑光纤通信格局。 技术原理:模式复用与低非线性效应 少模光纤的核心优势在于其纤芯直径设计(通常为
    的头像 发表于 04-14 09:47 318次阅读

    忆联UH812a以极致存力破局大模型载入瓶颈

    随着大模型技术规模化落地,AI应用的实时性正成为企业竞争力的核心。然而,在算力持续升级的同时,模型从存储层加载至计算单元的环节却日渐成为制约系统效率与弹性的关键瓶颈。缓慢或波动的加载过程,不仅会导致
    的头像 发表于 03-04 16:22 1105次阅读
    忆联UH812a以极致存力破局大<b class='flag-5'>模型</b>载入<b class='flag-5'>瓶颈</b>

    如何突破AI存储墙?深度解析ONFI 6.0高速接口与Chiplet解耦架构

    的带宽(如HBM3/E)来支撑张量处理单元。• 存储瓶颈:传统NAND闪存接口已无法支撑企业级PCIe 5.0 SSD的吞吐要求,亟需更高效的互联协议。 2. 奎芯科技(MSquare)的突破性方案
    发表于 01-29 17:32

    DeepSeek开源Engram:让大模型拥有&quot;过目不忘&quot;的类脑记忆

    of Sparsity for Large Language Models》,并同步开源记忆模块Engram。这一机制通过可扩展查找结构,让大模型实现O(1)时间复杂度的"条件反射式"记忆
    的头像 发表于 01-14 16:07 534次阅读
    DeepSeek开源Engram:让大<b class='flag-5'>模型</b>拥有&quot;过目不忘&quot;的类脑<b class='flag-5'>记忆</b>

    友思特方案 | 突破 Jetson平台的接口性能瓶颈,Gidel 基于FPGA的高速边缘AI视觉系统

    友思特合作伙伴Gidel FantoVision 成功突破 Jetson I/O 性能瓶颈,助力开发者毫无妥协地将像素数据转化为智能算力,实现边缘视觉 AI 的极致落地。
    的头像 发表于 01-13 10:22 2163次阅读
    友思特方案 | <b class='flag-5'>突破</b> Jetson平台的接口性能<b class='flag-5'>瓶颈</b>,Gidel 基于FPGA的高速边缘AI视觉系统

    一键开启涂鸦OmniMem:打通跨设备记忆壁垒,实现毫秒级高精度召回

    “更多功能”,而是“一次设定,处处懂我”。涂鸦智能深入千万家庭场景,思考用户切实体验,推出AI记忆系统OmniMem,重构AI记忆逻辑,融合短记忆高效总结与长
    的头像 发表于 12-17 18:11 508次阅读
    一键开启涂鸦OmniMem:打通跨设备<b class='flag-5'>记忆</b>壁垒,<b class='flag-5'>实现</b>毫秒级高精度召回

    突破供电瓶颈,英特尔代工实现功率传输的跨代际飞跃

    在2025年IEEE国际电子器件大会(IEDM 2025)上,英特尔代工展示了针对AI时代系统级芯片设计的关键技术突破——下一代嵌入式去耦电容器,这一创新有望解决晶体管持续微缩过程中面临的供电瓶颈
    的头像 发表于 12-16 11:44 910次阅读

    DL/T645协议瓶颈突破:瑞银充电桩电表协议配置指南

    DL/T645协议瓶颈突破:瑞银充电桩电表协议配置指南
    的头像 发表于 12-02 17:13 2436次阅读
    DL/T645协议<b class='flag-5'>瓶颈</b><b class='flag-5'>突破</b>:瑞银充电桩电表协议配置指南

    引领端侧大模型落地!Firefly-RK182X 开发套件上线发售

    。Rockchip全新高性能端侧大模型协处理器RK182X,以硬核技术突破瓶颈,重构端侧智能格局,引领端侧大模型落地。3D堆叠架构突破带宽
    的头像 发表于 11-26 16:33 2927次阅读
    引领端侧大<b class='flag-5'>模型</b>落地!Firefly-RK182X 开发套件上线发售

    陀螺形体材料,突破光子芯片瓶颈

    的光子芯片凭借其超高速、低功耗的天然优势,被视为下一代计算技术的核心方向。   然而,光子芯片的规模化应用面临关键技术瓶颈:在微型化芯片上实现光信号的精确操控,需构建稳定的光路环境。这要求材料具备“各向同性带隙
    的头像 发表于 11-23 07:14 1w次阅读
    陀螺形体材料,<b class='flag-5'>突破</b>光子芯片<b class='flag-5'>瓶颈</b>

    【新启航】《超薄玻璃晶圆 TTV 厚度测量技术瓶颈突破

    我将从超薄玻璃晶圆 TTV 厚度测量面临的问题出发,结合其自身特性与测量要求,分析材料、设备和环境等方面的技术瓶颈,并针对性提出突破方向和措施。 超薄玻璃晶圆(
    的头像 发表于 09-28 14:33 781次阅读
    【新启航】《超薄玻璃晶圆 TTV 厚度测量技术<b class='flag-5'>瓶颈</b>及<b class='flag-5'>突破</b>》

    企业部署AI大模型怎么做

    当下,AI大模型已成为驱动决策自动化、服务智能化与产品创新的核心引擎。然而,企业面对动辄数百亿参数的大模型部署时,常陷入算力不足、响应延迟高、成本失控等困境。如何突破瓶颈
    的头像 发表于 06-04 09:26 1054次阅读