0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国内通用智能体(本地操作型 Agent)深度测评对比

jf_27145353 来源:jf_27145353 作者:jf_27145353 2026-05-28 16:37 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

国内通用智能体(本地操作型 Agent)深度测评对比

一、是什么

「通用智能体(General Agent)」在 2026 年的语境里,特指一类**「从对话到执行」**的本地操作型 AI:它不只是回答问题,而是能听懂自然语言后, 真正在你的电脑上动手 ——整理文件、操作软件、跑数据、生成文档、调浏览器、收发消息,完成多步骤任务。

这一波热潮的源头是开源框架 OpenClaw(业内昵称「小龙虾」)

  • 一个轻量、自托管的本地 AI Agent 框架,GitHub 星标已超过 24 万;
  • 核心范式是「 本地网关 + 心跳调度(heartbeat scheduler) 」:把大模型的推理转化为对宿主机文件、系统、网络接口的物理操作,并支持 7×24 常驻、主动巡检;
  • 通过 Skills(技能) 扩展能力,通过 20+ 聊天渠道 (WhatsApp / Telegram / Discord / 飞书 / 钉钉 / 企微 / 微信)作为入口;
  • 数据留在本机,主打隐私与可控。

2026 年初,OpenClaw 出圈后,国内大厂几乎在同一时间「集体下场养虾」,推出各自的「类 Claw」产品。所谓「龙虾大战」的本质,是一场 围绕同一开源内核的产品化与渠道争夺战

二、为什么重要

  1. 交互范式迁移 :从「Chat(你问它答)」到「Act(它替你做)」,是大模型从「玩具」变「生产力工具」的关键一跃。本地操作能力意味着 Agent 能触达企业/个人电脑里那些没有 API、只有 GUI 的存量软件。
  2. 大模型变现的高频入口 :钛媒体的行业分析点破了大厂动机的「三重焦虑」——大模型变现路径不清,龙虾是 高频 token 消耗入口 ;囤积的闲置算力需要出口;技术趋势明朗,需抢占生态位。换言之,Agent 不只是产品,更是把推理算力卖出去的「计价器」。
  3. 生态卡位 :谁的 Agent 成为用户日常入口,谁就掌握下一代「AI 操作系统」的分发权。微信/企微(腾讯)、飞书(字节)、钉钉(阿里)之争,会原样复制到 Agent 层。

产品数据分析仪表盘

三、关键玩家与生态

整个赛道可粗分三类玩家(钛媒体框架): 云厂商 (腾讯、阿里、华为,整合企业服务生态)、 大模型厂商 (百度、智谱、Kimi、MiniMax,展示模型能力)、 硬件厂商 (小米,利用系统权限优势)。

腾讯系(本文重点)

腾讯是少数同时铺了「办公 / 通用 / 编程」三条产品线的玩家。需要先理清一个常被搞混的点: WorkBuddy 并不是 CodeBuddy「迭代」而来的版本 ,二者由同一个腾讯云 CodeBuddy 团队出品、 共享同一个底座 ,是面向不同人群的 并行产品 ——CodeBuddy 管开发(2025-09 正式发布),WorkBuddy 管办公(2026-03 上线),合起来打通「开发—办公」全链路。

产品定位关键特征
WorkBuddy桌面级办公智能体CodeBuddy 团队出品、与 CodeBuddy 同源共底座 (非其迭代版,而是并行的「办公线」),2026-03-09 上线;深度集成 企业微信 + 腾讯文档兼容 OpenClaw 的 Skills ,但「更易用、更安全」——从下载安装到连企微最快 1 分钟,免部署;支持多 Agent 并行、MCP 协议、Skills 扩展;自主规划交付多模态复杂任务(数据处理、文案、PPT)。内测期 2000+ 员工参与。
QClaw通用本地助手基于开源 OpenClaw 内核产品化;接入微信 / QQ聊天框(号称让 agent「钻进 14 亿人的聊天框」);本地常驻、心跳调度、数据留本机; 可自由更换底模 (Claude / GPT / DeepSeek / Kimi);可装自定义 Skills。已推出 海外版 QClaw(QClaw SG / Global) ,主打降低 Agent 部署门槛。
CodeBuddy / CodeBuddy Code编程智能体(注意:与阿里的Qoder是两家产品,常被混淆)三形态(IDE / 插件 / CLI)+ Agent SDK;CodeBuddy Code 2.0「90% 代码 AI 自己写」; 隔离沙箱执行 ;支持 Skills / 插件市场 / Subagents / 自定义指令 / Agent Hooks;内置多模型(Kimi 2.5、Gemini、GPT、DeepSeek、GLM-4);与腾讯云 CloudBase 深度集成、可一键部署。

WorkBuddy vs QClaw 的取舍逻辑 :WorkBuddy = 「好用派」,封装掉部署/换模/安全的复杂度,绑死腾讯办公生态,面向不想折腾的职场用户;QClaw = 「开放派」,保留开源内核与换模自由,面向开发者与极客。一封一开,覆盖两类人群。

其他大厂

厂商产品形态 / 特点
字节ArkClaw火山引擎云上 SaaS 版 OpenClaw,开箱即用、免本地部署
字节UI-TARS Desktop2026-02 开源,基于自研Seed-VL多模态,纯视觉识别并操作任意软件界面(GUI Agent 路线,不依赖 API/无障碍树)
阿里Qoder / QoderWork2025-08 发布的 agentic coding 平台,Qoder 1.0 提出「从 AI IDE 迈向智能体自主开发工作台」;QoderWork 进一步定位桌面级通用智能体
阿里CoPaw通义实验室桌面智能体,主打「本地 + 云端」统一体验
百度红手指 Operator旗舰款,强调强自主操作能力
百度DuClaw轻量版,面向个人开发者
智谱AutoClaw本地一键部署版
Moonshot/KimiKimiClaw云端托管服务
MiniMaxMaxClaw一键云部署方案
小米 / 华为同样下场,小米侧重系统级权限优势

四、多维度对比

按「从对话到执行」的本地操作型通用智能体这一口径,把可比的产品拉到同一张表(编程专用的 CodeBuddy/Qoder 单列说明):

维度WorkBuddyQClawArkClaw(字节)UI-TARS(字节)CoPaw(阿里)AutoClaw(智谱)
底层架构OpenClaw 兼容内核(封装)开源 OpenClaw 内核云 SaaS 化 OpenClaw自研纯视觉(Seed-VL)本地+云端混合OpenClaw 本地版
部署形态本地桌面,免部署本地桌面云端 SaaS本地桌面本地+云本地一键
主要场景办公(文档/数据/PPT)通用个人助理通用,企业云场景通用 GUI 操作通用通用
入口/渠道企微、腾讯文档微信、QQ火山生态桌面直接操作通义生态多渠道
模型自由度封装(弱)高(可换底模)锁自研 Seed-VL中(偏通义)
本地操作文件/办公软件文件/系统/浏览器云侧为主任意 GUI(视觉)文件/系统文件/系统
上手门槛极低(1 分钟)中(需配模型/Skills)
隐私模型本地+企业云本地优先云端托管本地混合本地

产品设计草图和用户体验原型

几个关键判断:

  • 路线分叉 :绝大多数产品是「OpenClaw 套壳 + 渠道/生态加成」,唯有字节 UI-TARS 走纯视觉 GUI 路线 ,技术上最独立,也最有可能突破「只能操作有 API 的软件」这一天花板,但成本与稳定性是代价。
  • 真壁垒不在模型 :当底模可自由替换、内核又是同一份开源代码时,差异化只剩 渠道(微信/企微/钉钉)、工程化封装(免部署、稳定性)、生态集成(文档/云) 。腾讯在「渠道 + 封装」两项上明显占优。
  • 编程 Agent 自成一档 :CodeBuddy Code(腾讯)与 Qoder(阿里)面向开发者,强调沙箱执行、Subagents、多模型与云部署一体化,与通用办公 Agent 不是同一战场,不宜混为一谈。

五、争议与风险

1. 安全:集成越深,攻击面越大(最该警惕的一点)

安全内参发布的《OpenClaw 与 5 款国产类 Claw 智能体安全评测》给出了反直觉但极重要的数据。评测以 MITRE ATT&CK 框架的 13 类攻击行为、7 个链路阶段、205 条样例、1200+ 轮对抗交互衡量「攻击成功率」(越低越安全):

产品攻击成功率主要弱点
QClaw(腾讯)54.85%(最高)凭据访问 85.71%、数据外传 80%——「容易偷凭据、容易外传数据」
AutoClaw(智谱)49.51%规划层失控
KimiClaw(Kimi)40.78%执行链条过顺,缺刹车
ArkClaw(字节)29.61%执行后状态被持续利用
OpenClaw(原版)19.42%前期探测不够紧
MaxClaw(MiniMax)16.02%(最低)探测敏感度低(侧面更稳)

核心结论是 「智能体安全不是模型安全」 :同一框架换底模,风险画像就变;同一底模在不同框架里表现差异巨大。真正的危险,是系统把一次「正常诊断」自动演进成「完整攻击链」的能力。 QClaw 因深度接入微信/QQ、且开放可换模,集成面最广,恰恰评测最不安全 ——这说明腾讯主打的「易用 + 深度集成」与「安全」之间存在结构性张力。

提醒:评测分值是相对比较,且各产品仍在快速迭代,腾讯很可能已针对性加固。引用时应核对最新版本,而非把这组数字当永久结论。

2. 同质化与「伪创新」

钛媒体直言市场分「好用派」与「噱头派」,后者把「原本只是 API 调用的自动化脚本,包装成『智能体』」,存在功能堆砌、交互繁冗、成本模糊、稳定性差的问题。当 30+ 衍生项目都基于同一开源内核时, 多数产品缺乏真正的技术护城河

3. 商业与成本

  • Token 成本不透明 :常驻 + 心跳调度 + 多步骤执行,意味着持续烧 token,普通用户对账单无感知、易超预期。
  • 需求真伪存疑 :行业判断认为「龙虾非泡沫,但距离大众应用仍远」——普通用户的需求已被对话式大模型满足,Agent 的高门槛、权限风险、成本让人望而却步。
  • 生态绑定 :WorkBuddy 绑企微、CoPaw 绑通义、ArkClaw 绑火山,选型即站队,迁移成本高。

六、个人结论

一句话定性 :这是一场围绕开源框架 OpenClaw 的 渠道与工程化竞赛 ,技术同质化严重,腾讯靠「微信/企微入口 + 免部署封装」占据有利身位,但「集成越深、攻击面越大」的安全悖论尚未解决。

判断:值得持续跟进,但当前阶段「观望 + 小范围试用」优于 All in。

  • 跟进理由 :从对话到执行是确定性趋势;腾讯把渠道(微信 14 亿用户)与办公生态(企微/腾讯文档)这两张牌打到了 Agent 上,一旦稳定性与安全过关,分发优势会迅速放大。
  • 不宜重投理由 :①安全评测显示本地操作型 Agent(尤其 QClaw)攻击面大、风险实打实;②底层多为 OpenClaw 套壳,护城河靠渠道而非技术,格局未定;③token 成本与稳定性对普通用户仍是劝退项。

下一步行动建议

  1. 自用试水 :在隔离/非敏感环境装 QClaw (开源可换模,可观察其本地操作真实能力与 token 消耗),办公场景试 WorkBuddy (看企微/腾讯文档集成是否真省事)。

  2. 编程线单独评估 :若关注 coding agent,直接对比 CodeBuddy Code 2.0 vs 阿里 Qoder vs Claude Code ,关注沙箱、Subagents、多模型与部署一体化。

  3. 盯技术分叉 :重点观察字节 UI-TARS 纯视觉路线能否突破「只能操作有 API 软件」的天花板——这才是可能改变格局的变量。

  4. 安全红线 :任何本地操作型 Agent 都不要授予真实凭据/生产环境权限,先在沙箱里跑,等权限模型与审计能力成熟再上敏感场景。

    审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42161

    浏览量

    303155
  • Agent
    +关注

    关注

    0

    文章

    246

    浏览量

    29314
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    2026危废智能称重一深度评测:7大品牌全方位对比与选型实战指南

    的 “云-管-端”全链路技术 ,在危废智能称重打码一机领域构建了完整的产品矩阵与服务体系。作为 国内极少数深度参与国家级固废平台建设的科技企业 ,物微联不仅参与承建全国危险废物规范化
    发表于 05-25 15:32

    Agent+Skills+SpringAI 构建自主决策智能体视频教程

    深度拆解 Skills 能力多 Agent 自主智能开发收官 单 Agent 的天花板,不是模型能力,是架构设计 做了这么久
    发表于 05-12 14:06

    九天菜菜大模型agent智能开发实战2026一月班

    自主 AI 新范式:大模型 Agent 开发实战火爆开课 在科技浪潮汹涌澎湃的当下,人工智能领域正经历着一场深刻变革,大模型 Agent 开发实战课程如璀璨新星般闪耀登场,迅速成为科技圈的热门焦点
    发表于 04-15 16:04

    RPA低于Agent

    ) - RPA(机器人流程自动化) 规则驱动、机械执行 → 只会按写死的步骤(if-else)点鼠标、填表单、搬数据。 像**“数字流水线工人”**。 - AI Agent智能) 目标驱动、自主决策
    发表于 04-04 21:36

    100亿智能背后的连接刚需:德索如何搞定AI Agent的“神经末梢”

    当全球迎来“百亿智能”时代,AI Agent正从软件云端走向复杂的物理工业现场。本文深度探讨德索(Desuo)如何通过微型射频连接与精密互连技术,为海量
    的头像 发表于 04-01 08:57 301次阅读
    100亿<b class='flag-5'>智能</b><b class='flag-5'>体</b>背后的连接刚需:德索如何搞定AI <b class='flag-5'>Agent</b>的“神经末梢”

    【2025夏季班正课】大模型Agent智能开发实战 课分享

    【2025年12月班】大模型与Agent智能开发实战] 拒绝碎片化:体系化学 Agent 开发方法的技术深度剖析 在当今的人工
    发表于 03-29 16:12

    Dify零基础开发本地Agent智能 -51cto

    ,Dify 作为一款开源的 LLM 应用开发平台,凭借其可视化的编排能力,极大地降低了构建智能Agent)的门槛。对于开发者而言,深入理解 Dify 的核心三大支柱——工作流编排、工具调用机制以及记忆
    的头像 发表于 03-23 14:09 341次阅读

    Dify1.9零基础开发本地Agent智能

    参考资料地址:https://pan.baidu.com/s/1EzedMxjmP8lyxlJ_KMMlig?pwd=gdwa  打破技术壁垒:我的教育 AI 低成本方案——Dify 本地
    的头像 发表于 03-21 16:12 284次阅读

    华为在MWC 2026发布正式无线网络智能RAN Agent

    在MWC26 巴塞罗那期间,华为无线MAE产品线总裁赵振龙在移动AI产业峰会上正式发布无线网络智能(RAN Agent),并发表主题演讲 《无线网络智能
    的头像 发表于 03-05 14:13 1262次阅读

    电子发烧友荣获电子工业出版社博文视点 “2025 年度卓越合作伙伴”

    的合作合力。为读者精心挑选测评图书,从国产芯片到高速数字设计、从人工智能智能机器人、从Linux实战到AI Agent等众多热门且前沿的领域,确保每一本参与
    发表于 02-06 11:58

    浅谈研华iEMS.AI Agent能源智能管理平台

    近日,研华 iEMS.AI Agent能源智能体专题直播圆满落幕!这场聚焦工业级智能升级的分享,带大家解锁了 AI 驱动的全新可能 —— 它不只是一套能碳AI管理工具,更是一个具备强大拓展性、
    的头像 发表于 11-24 15:31 1139次阅读
    浅谈研华iEMS.AI <b class='flag-5'>Agent</b>能源<b class='flag-5'>智能</b><b class='flag-5'>体</b>管理平台

    智能设计模式和智能框架,你会了么?

    一、新闻 先播放一条最新新闻,通义团队官宣开源了两个智能 Alias-Agent 和 Data-Juicer Agent 。 Alias-Agen
    的头像 发表于 11-12 16:30 1459次阅读
    多<b class='flag-5'>智能</b><b class='flag-5'>体</b>设计模式和<b class='flag-5'>智能</b><b class='flag-5'>体</b>框架,你会了么?

    JoyAgent综合测评报告

    1.背景与目的 JoyAgent-JDGenie 是最近新开源的一款多Agent的产品,对于通用类问题可以做到开箱即用。而对于用户需要定制的场景功能,也支持配置子智能或者类似MCP工
    的头像 发表于 07-27 12:40 886次阅读
    JoyAgent综合<b class='flag-5'>测评</b>报告

    中软国际入选中国信通院AI Agent智能产业图谱1.0

    近日,中国信息通信研究院(以下简称“中国信通院”)《AI Agent智能产业图谱1.0》正式发布。该图谱是国内系统性梳理智能
    的头像 发表于 07-14 14:55 1959次阅读

    小艺智能开放平台的功能介绍

    随着AI技术发展与智能自主能力的进化,智能推动生产力与创造力革命。各行业应用APP 正在朝着更智能、更主动的
    的头像 发表于 07-09 16:50 5212次阅读
    小艺<b class='flag-5'>智能</b><b class='flag-5'>体</b>开放平台的功能介绍