1月23日,北京智谱华章科技有限公司宣布旗下智谱GLM-PC开放体验,标志着自主操作电脑的多模态Agent迎来重要升级。
GLM-PC是基于智谱多模态大模型CogAgent,全球首个面向公众、回车即用的电脑智能体。它能像人类一样“观察”和“操作”计算机,协助用户完成各类电脑任务。
GLM-PC v1.0于2024年11月29日发布并开放内测。此次升级推出了“深度思考”模式,增加了专用于逻辑推理和代码生成的功能,还提供了对Windows系统的支持。
GLM-PC具备多项强大能力。在代码生成与逻辑执行规划方面,可综合分析目标与可用资源,生成执行路线图并分解大型任务。循环执行功能可在规划后启动代码生成模块,实现从输入到输出的完整闭环。其长思考能力能实时调整、反思修正和自我纠错。
在图像与GUI认知上,能准确识别图形界面元素,理解功能与交互逻辑,还能进行图像语义解析和多模态信息融合。
智谱GLM-PC的开放体验,为用户带来了更智能、高效的电脑操作新体验,有望在办公、学习等诸多领域发挥重要作用。
-
Agent
+关注
关注
0文章
162浏览量
28569 -
大模型
+关注
关注
2文章
3440浏览量
4964
发布评论请先 登录
华为提出三大要素构筑Agent-Verse社会
华为CANN与智谱GLM端侧模型完成适配
【HZ-T536开发板免费体验】3 - Cangjie Magic调用视觉语言大模型(VLM)真香,是不是可以没有YOLO和OCR了?
多模态感知+豆包大模型!家居端侧智能升级
【「零基础开发AI Agent」阅读体验】+Agent开发平台
【「零基础开发AI Agent」阅读体验】+初品Agent
海康威视发布多模态大模型AI融合巡检超脑
多模态交互技术解析
《AI Agent 应用与项目实战》第1-2章阅读心得——理解Agent框架与Coze平台的应用

智谱 GLM-PC 开放体验,多模态 Agent 升级
评论