0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

腾讯云开源Agent Memory:Token消耗最高降低61%

科技绿洲 2026-05-15 10:38 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,腾讯云数据库团队正式开源TencentDB Agent Memory,一套面向AI Agent长任务场景的分层记忆引擎,采用MIT协议开放。该项目通过"上下文卸载+Mermaid任务画布"两大核心技术,在多任务连续Session实验中最高降低61.38%的Token消耗,同时将任务成功率相对提升51.52%。目前项目已适配OpenClaw和Hermes等主流Agent框架,支持一键集成。

当前主流AI Agent的记忆方案,大多是把对话历史压缩成一段摘要,在下次会话时注入上下文。这种方式在短对话中够用,但在真实的长周期任务中会暴露三个核心问题。

一是跨会话断裂。昨天反复确认的代码规范,今天新开一个会话就全忘了。二是事实与偏好混淆。用户说过"我用TypeScript"和"帮我查一下天气",这两条信息的价值完全不同,却被同等对待。三是上下文膨胀。任务越长,堆进上下文的历史信息越多,Token消耗持续攀升,模型注意力也在衰减。

TencentDB Agent Memory正是为解决这些问题而来。

这套记忆引擎提出了两项关键技术。

第一项是"Mermaid任务画布"。系统会将Agent的任务执行过程组织成一张结构化任务图,用Mermaid Flowchart把任务状态、步骤摘要和执行关系可视化呈现。Agent不需要记住所有内容,只需要知道哪些信息重要、它们被组织在哪里、必要时如何一步步展开。历史没有被压成一段不可恢复的摘要,而是变成了一张可以继续执行的地图——能折叠,也能展开。

第二项是"上下文卸载(Context Offloading)"。每次工具调用结束后,网页内容、日志输出、代码结果等原始信息不再长期占据上下文窗口,而是完整写入外部文件,上下文中只保留一行摘要和索引路径。需要时,Agent可以按四层递进结构逐层回溯:从Level 2-3的轻量摘要,到Level 1的JSONL记录,再到Level 0的完整原文,任何一层压缩都不是不可逆的黑盒。

数据是最有说服力的。在超长Session评测中,TencentDB Agent Memory作为OpenClaw插件接入后,Token消耗最高降低61.38%,任务通过率相对提升51.52%。在个性化记忆准确率(PersonaMem指标)上,从48%提升到76%,优化幅度接近60%。

值得注意的是,仅使用上下文卸载时Token节省约15%,叠加Mermaid画布后提升至31%至33%。这说明画布的结构化能力对记忆压缩有着独立且显著的贡献——上下文中的噪声减少后,模型注意力更集中在当前任务目标上。

TencentDB Agent Memory采用四层递进式记忆架构:底层(L0)保留原始对话证据,中间层(L1-L2)逐步提炼为场景归纳和原子记忆,顶层(L3)生成用户画像。每一层只做一件事,层与层之间通过提取、聚合、蒸馏的管道连接,任何一层都可以独立升级或替换。

在部署方式上,项目默认使用本地SQLite作为后端,零外部API依赖,所有中间产物均为人类可读的Markdown和Mermaid文件。进阶用户也可接入腾讯云向量数据库TCVDB,实现BM25+Vector的混合检索。同时支持跨Agent、跨框架、跨设备的记忆导入导出和实时迁移。

据腾讯云介绍,TencentDB Agent Memory的长期记忆功能已于4月初上线并免费开放使用,当时在PersonaMem测试集上就已将OpenClaw的整体回答准确率从48%提升至76.10%。而此次5月14日的开源,重点聚焦于短期记忆压缩能力,把已经在内部验证过的产品能力开放给社区。

项目已在GitHub上线,目前已获得超过1300个Star。开发者可以通过OpenClaw插件或Hermes Gateway一键接入,极简安装仅需一条命令。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41965

    浏览量

    303060
  • 腾讯
    +关注

    关注

    7

    文章

    1689

    浏览量

    51043
  • 开源
    +关注

    关注

    3

    文章

    4421

    浏览量

    46578
  • OpenClaw
    +关注

    关注

    0

    文章

    55

    浏览量

    34
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    亚马逊科技推出Agent支付功能

    近日,亚马逊科技(AWS)正式宣布推出 **Amazon Bedrock AgentCore payments(预览版)** ——业界首个专门为自主AI Agent打造的托管式支付功能。这意味着
    的头像 发表于 05-18 09:34 531次阅读

    腾讯开源Agent Memory

    近日,腾讯正式开源 **TencentDB Agent Memory** ,代号"龙虾"的记忆引擎以MIT协议全面开放,为
    的头像 发表于 05-17 09:36 431次阅读

    Agent+Skills+SpringAI 构建自主决策智能体视频教程

    回放。 另外一个现实问题是成本控制。多 Agent 意味着多次模型调用,Token 消耗是单 Agent 的数倍。课程讲了一套动态路由策略——简单问题走小模型快速处理,复杂问题才调用大
    发表于 05-12 14:06

    Token成本激增、大模型集体涨价,Agent时代端侧算力迎来价值重估

    知名大模型厂商已进行了多次API价格上调,涨价源于“市场需求持续强劲增长,用户规模与调用量快速提升”。Agent(智能体)时代,词元(Token消耗与推理成本的
    的头像 发表于 05-08 13:36 500次阅读
    <b class='flag-5'>Token</b>成本激增、大模型集体涨价,<b class='flag-5'>Agent</b>时代端侧算力迎来价值重估

    能够降低Token成本的因素有哪些

    传统数据中心过去主要用于数据的存储、检索与处理。但在生成式 AI 与代理式 AI 时代,这些设施已演变为 AI Token 工厂。随着 AI 推理成为其核心工作负载,它们的主要产出已转变为以 Token 形式制造的智能。
    的头像 发表于 04-27 15:45 747次阅读
    能够<b class='flag-5'>降低</b>每<b class='flag-5'>Token</b>成本的因素有哪些

    亚马逊科技发布Amazon Agent Registry:企业级Agent管理迈入统一化新时代

    近期,亚马逊科技在Amazon Bedrock AgentCore平台上正式推出 **Amazon Agent Registry(预览版)** ——这一企业级Agent统一注册中心,以“集中管理
    的头像 发表于 04-22 15:48 629次阅读

    节省龙虾 40% Token 消耗!ClawChips 加持 Firefly-RK1828 端协同

    这些问题,瑞芯微推出一套端协同的龙虾解决方案ClawChips,为龙虾Agent的本地化、场景化开发提供了强力支持。什么是ClawChips?ClawChips
    的头像 发表于 04-09 18:10 504次阅读
    节省龙虾 40% <b class='flag-5'>Token</b> <b class='flag-5'>消耗</b>!ClawChips 加持 Firefly-RK1828 端<b class='flag-5'>云</b>协同

    亚马逊科技Amazon DevOps Agent智能运维助手正式可用

    北京2026年4月7日 /美通社/ -- 亚马逊科技宣布Amazon DevOps Agent现已正式可用。Amazon DevOps Agent是用户全天候随时待命的智能运维助手。它可跨亚马逊
    的头像 发表于 04-07 14:59 210次阅读

    芯盾时代助企业破解智能体Token失控难题

    2026年,随着OpenClaw等自主智能体(Agent)技术的爆发,企业AI应用正经历从“对话问答”到“自主执行”的跃迁。为了占得智能体应用先机,企业纷纷给员工下发Token额度、鼓励全员“养龙虾”。一时之间,Token成为企
    的头像 发表于 03-28 13:40 1172次阅读

    DMA(Direct Memory Access)的具体原理和实现方法是什么

    1. DMA 是什么(在 Zephyr / Nordic 里的抽象) Zephyr 把 DMA(Direct Memory Access)抽象成一个“DMA 控制器 + 多个通道”的驱动接口,用来
    发表于 02-12 10:16

    亚马逊科技Amazon Bedrock AgentCore正式可用,引领Agent走向全面落地

    Amazon Bedrock AgentCore打破原型困境,助力Agent安全、可扩展、高可靠地投入生产   北京——2025年10月14日  亚马逊科技宣布, Amazon Bedrock
    的头像 发表于 10-14 17:06 1017次阅读
    亚马逊<b class='flag-5'>云</b>科技Amazon Bedrock AgentCore正式可用,引领<b class='flag-5'>Agent</b>走向全面落地

    科技报到:Agent应用爆发,谁成为向上托举的力量?

    科技报道原创。 经过两年多的发展后,AI开始加速进入Agent时代。 当AI从“被动响应”迈向“主动决策”,AI Agent正成为连接数字世界与物理世界的核心枢纽。 从自动处理客户服务工单的企业
    的头像 发表于 08-07 08:58 734次阅读
    科技<b class='flag-5'>云</b>报到:<b class='flag-5'>Agent</b>应用爆发,谁成为向上托举的力量?

    开放原子开源基金会与腾讯达成合作

    近日,在北京举行的2025开放原子开源生态大会现场,开放原子开源基金会与腾讯计算(北京)有限责任公司签署“开源协作平台互联合作协议”。
    的头像 发表于 08-05 11:06 1592次阅读

    开源鸿蒙AI Agent TSG正式成立

    鸿蒙 AI Agent TSG(技术专家组)正式宣布成立,旨在联合产学研力量,共同洞察 Agent 在通信、协同、自演进等方面的技术趋势,并规划和探索下一代 Agent 技术框架。该组织的成立标志着
    的头像 发表于 07-28 17:38 1132次阅读

    Genie:产品级Agent开源产品

    京东前两天发布了一个开源Agent产品-JoyAgent-JDGenie,在GAIA榜单上分数达到了75.15%,超越了众多开源的AI Agent项目。 该
    的头像 发表于 07-27 12:40 927次阅读
    Genie:产品级<b class='flag-5'>Agent</b><b class='flag-5'>开源</b>产品