0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

节省龙虾 40% Token 消耗!ClawChips 加持 Firefly-RK1828 端云协同

Firefly开源团队 2026-04-09 18:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着AI Agent逐步走向实际业务场景,客户的关注点也在发生变化。相比单纯的模型能力展示,客户更关心的是:Agent能否真正落地到设备侧、场景侧和交互侧,并在成本、体验与适配性之间取得有效平衡?

针对这些问题,瑞芯微推出一套端云协同的龙虾解决方案ClawChips,为龙虾Agent的本地化、场景化开发提供了强力支持。

5a6b37e4-33fc-11f1-ab55-92fbcf53809c.jpg



什么是ClawChips?

ClawChips属于“端侧智能路由插件方案”,是在瑞芯微边缘设备上,把本地模型、云端模型、记忆路由和可视化运维面板整合起来,让龙虾在端侧更省钱、更实用、更可控,相较于完全依赖云端模型的处理方式,系统能够根据任务复杂度,对请求进行本地与云端分流,本地处理占比有了显著提升。这意味着一部分高频、轻量、实时性要求更高的任务,可以优先在本地完成处理,从而减少不必要的云端调用压力,让云端资源更多用于复杂理解和高质量生成等任务。


关于ClawChip更详细的介绍,可参考瑞芯微电子原文链接:瑞芯微龙虾平台“ClawChips”——端云协同·安全省耗·高效适配

5a7d4e98-33fc-11f1-ab55-92fbcf53809c.png

(图片资料来源:瑞芯微龙虾平台“ClawChips”



节省云端Token消耗

ClawChips搭载自研本地智能路由机制,实现交互成本的高效管控。系统收到请求后,优先复用记忆库基于PinchBench实测,可节省40%云端模型消耗,实现本地推理零成本,云端调用更高效。

5a8af912-33fc-11f1-ab55-92fbcf53809c.png

(资料来源:瑞芯微龙虾平台“ClawChips”



简易指令,龙虾开箱即用

ClawChips已完成多项基础功能的集成与落地,兼顾实用性与开发性,内置通用型+客户定制型首批Skils,将设备调试、图像分析、模型测试等核心需求封装为简易指令,降低开发者初期使用门槛,让龙虾可以到手直接使用。



应用场景:编程助手

在编程助手这一典型应用场景中,ClawChips展现出“简单任务本地优先、复杂任务云端补充”的协同优势。像代码注释翻译、短代码说明、函数命名优化等轻量任务,可以优先在本地完成,而对于报错排查、根因分析、修复建议、测试设计等更复杂的开发任务,则借助云端能力进一步提高处理质量。对于开发者而言,能够在效率、成本与能力之间取得有效平衡。

5a948694-33fc-11f1-ab55-92fbcf53809c.png



应用场景:语音识别

除了端云协同之外,ClawChips所具备的ASR语音识别交互能力,实现复杂环境下的语音指令快速识别与解析。能够适用于机器人智能家居、智能终端、语音控制设备等高频的语音自然交互场景。

5aa48c7e-33fc-11f1-ab55-92fbcf53809c.png



ClawChips多元场景适配

ClawChips在“本地承载 + 协同推理 + 云端补充”的思路下,展现出较好的工程落地潜力。尤其对于通用行业场景而言,这种端侧可部署、端云可协同、交互能力可扩展的方案形态,结合实际业务需求,实现高效的场景化适配。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    40940

    浏览量

    302515
  • 瑞芯微
    +关注

    关注

    27

    文章

    841

    浏览量

    54647
  • 智能路由
    +关注

    关注

    0

    文章

    10

    浏览量

    7238
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AIBOX + JishuShell:一键部署侧 AI,把本地龙虾“装”进小盒子

    近期AI技术生态中有个耳熟能详的词:OpenClaw,也就是所谓的“龙虾”,而为了将龙虾本地化,许多平台和厂商都在投入研发相关变体和工具,其中安谋科技(ArmChina)旗下的极术社区发布了
    的头像 发表于 04-15 16:35 306次阅读
    AIBOX + JishuShell:一键部署<b class='flag-5'>端</b>侧 AI,把本地<b class='flag-5'>龙虾</b>“装”进小盒子

    Firefly-RK1828 赋能视频大模型:多目标+全场景,引领智能分析新风向

    问题。针对这一问题,我们基于FireflyRK1828开发套件,搭载南京锐景专属视频分析算法,以视频大模型为核心,实现「多目标检测+全场景适配」,可自定义各种问题,适应
    的头像 发表于 04-15 16:35 592次阅读
    <b class='flag-5'>Firefly-RK1828</b> 赋能视频大模型:多目标+全场景,引领智能分析新风向

    Token工厂加速兑现!迅策携手国家级数据交易所,深化垂类Token开发

    当中国日均Token消耗突破140万亿,当OpenAI每分钟处理150亿Token,当中国两年增长1400倍——Token,这个两年前还陌生的技术术语,正在成为AI时代的"新千瓦时"。
    的头像 发表于 04-13 16:26 143次阅读
    <b class='flag-5'>Token</b>工厂加速兑现!迅策携手国家级数据交易所,深化垂类<b class='flag-5'>Token</b>开发

    龙虾员工OpenClaw部署完整步骤,基于瑞芯微国产处理器

    ▍ 你养龙虾了吗 大家好,我是 发际线守护者 !公司同事近期都不怎么讨论我的发际线了,见面都在问:养龙虾了吗?这里的“龙虾”,正是近期开源社区爆火的AI智能体——OpenClaw。 OpenClaw
    的头像 发表于 04-13 14:16 275次阅读
    <b class='flag-5'>龙虾</b>员工OpenClaw部署完整步骤,基于瑞芯微国产处理器

    RV1126B AI 相机协同方案

    相机给出了更优解——协同,让计算在最合适的位置发生,也成为了从IPC网络摄像机到车载场景的通用视觉解决方案。当下边缘计算市场爆发式增长,到2025年全球边缘计算
    的头像 发表于 04-08 17:24 1143次阅读
    RV1126B AI 相机<b class='flag-5'>端</b><b class='flag-5'>云</b><b class='flag-5'>协同</b>方案

    详解Token经济:智能时代的价值标尺与产业全链路重构

    前言2026年开年以来,AI产业迎来了三个里程碑式的转折点:开源AIAgent框架OpenClaw席卷全球掀起"养龙虾"热潮,阿里巴巴成立全球首个Token事业群重构AI商业版
    的头像 发表于 04-08 09:25 400次阅读
    详解<b class='flag-5'>Token</b>经济:智能时代的价值标尺与产业全链路重构

    芯盾时代助企业破解智能体Token失控难题

    2026年,随着OpenClaw等自主智能体(Agent)技术的爆发,企业AI应用正经历从“对话问答”到“自主执行”的跃迁。为了占得智能体应用先机,企业纷纷给员工下发Token额度、鼓励全员“养龙虾”。一时之间,Token成为企
    的头像 发表于 03-28 13:40 1017次阅读

    科技报到:“龙虾”入笼:为何金融行业不敢“养”?

    科技报到:“龙虾”入笼:为何金融行业不敢“养”?
    的头像 发表于 03-27 09:38 337次阅读

    &quot; 创盈芯×雷神联手打造OpenClaw虾盒,双机部署破Token烧钱隐私难题&quot;

    OpenClaw龙虾AI凭借高效自动化能力迅速出圈,成为职场人与运维党的效率神器,然而,盲目跟风使用,正让越来越多用户陷入两大隐痛: ❌云端成本失控 :Token悄然消耗,费用节节攀升,越高效,越
    的头像 发表于 03-23 17:54 985次阅读
    &quot; 创盈芯×雷神联手打造OpenClaw虾盒,双机部署破<b class='flag-5'>Token</b>烧钱隐私难题&quot;

    登临科技GPU本地部署OpenClaw全攻略

    “养”在本地,不仅可以大幅度节省token消耗量,而且可以实现数据隐私、低延迟等诸多优势。 登临KS20 GPU 凭借其强大的侧算力和CUDA兼容优势,成为解锁本地OpenClaw全
    的头像 发表于 03-17 14:19 1777次阅读
    登临科技GPU本地部署OpenClaw全攻略

    让OpenClaw化身专属数字员工,N602 Mini PC助你“安全养龙虾

    真正的“主动自动化”。然而,流水般的Token消耗,数据放在云端总担心“裸奔”,让许多人对OpenClaw望而却步。针对这些痛点,杰和科技推出OpenClaw专属
    的头像 发表于 03-13 20:06 617次阅读
    让OpenClaw化身专属数字员工,N602 Mini PC助你“安全养<b class='flag-5'>龙虾</b>”

    深入解析 ADP1828 同步降压 PWM 控制器:设计与应用全攻略

    深入解析 ADP1828 同步降压 PWM 控制器:设计与应用全攻略 在电子工程师的日常工作中,电源管理是一个至关重要的领域。而 ADP1828 同步降压 PWM 控制器作为一款功能强大且应用广泛
    的头像 发表于 03-12 17:10 586次阅读

    引领侧大模型落地!Firefly-RK182X 开发套件上线发售

    。Rockchip全新高性能侧大模型协处理器RK182X,以硬核技术突破瓶颈,重构侧智能格局,引领侧大模型落地。3D堆叠架构突破带宽瓶颈RK
    的头像 发表于 11-26 16:33 2656次阅读
    引领<b class='flag-5'>端</b>侧大模型落地!<b class='flag-5'>Firefly-RK</b>182X 开发套件上线发售

    Firefly 推出基于 RK1820 / RK1828 的开发套件与 AI NVR 服务器

    RK1820/RK1828是瑞芯微面向AI时代推出的算力协处理器,采用先进的3D堆叠封装技术,集成高带宽嵌入式片内DRAM(2.5GB/5GB版本),侧生成速率超100tokens/s,
    的头像 发表于 11-05 18:52 5879次阅读
    <b class='flag-5'>Firefly</b> 推出基于 <b class='flag-5'>RK</b>1820 / <b class='flag-5'>RK1828</b> 的开发套件与 AI NVR 服务器

    Onenet网关方案应用--基于米尔瑞芯微RK3576开发板

    本文将介绍基于米尔电子MYD-LR3576开发板(米尔基于瑞芯微RK3576开发板)的Onenet网关应用方案测试。 摘自优秀创作者-小手凉凉 目录: * 板卡说明 * 操作说明 * 软件主要
    发表于 06-06 16:54