0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智谱 GLM-PC 开放体验,多模态 Agent 升级

麦辣鸡腿堡 来源:网络整理 2025-01-24 14:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1月23日,北京智谱华章科技有限公司宣布旗下智谱GLM-PC开放体验,标志着自主操作电脑的多模态Agent迎来重要升级。

GLM-PC是基于智谱多模态大模型CogAgent,全球首个面向公众、回车即用的电脑智能体。它能像人类一样“观察”和“操作”计算机,协助用户完成各类电脑任务。

GLM-PC v1.0于2024年11月29日发布并开放内测。此次升级推出了“深度思考”模式,增加了专用于逻辑推理和代码生成的功能,还提供了对Windows系统的支持。

GLM-PC具备多项强大能力。在代码生成与逻辑执行规划方面,可综合分析目标与可用资源,生成执行路线图并分解大型任务。循环执行功能可在规划后启动代码生成模块,实现从输入到输出的完整闭环。其长思考能力能实时调整、反思修正和自我纠错。

在图像与GUI认知上,能准确识别图形界面元素,理解功能与交互逻辑,还能进行图像语义解析和多模态信息融合。

智谱GLM-PC的开放体验,为用户带来了更智能、高效的电脑操作新体验,有望在办公、学习等诸多领域发挥重要作用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Agent
    +关注

    关注

    0

    文章

    162

    浏览量

    28569
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4964
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为提出三大要素构筑Agent-Verse社会

    走向智变,AI Agent带来生产工具、生产关系和生产力的巨大变革,全面迈向万智互联的Agent-Verse。他在发言中进一步强调:“构筑Agent-Verse,需具备三大关键要素:AoNR全能超宽网络,保障多维
    的头像 发表于 10-10 17:56 874次阅读

    华为CANN与智GLM端侧模型完成适配

    2025年8月5日,在昇腾计算产业发展峰会上,华为宣布CANN(Compute Architecture for Neural Networks)技术体系及Mind系列工具链全面开源开放。此前,智
    的头像 发表于 08-11 11:00 2196次阅读

    【HZ-T536开发板免费体验】3 - Cangjie Magic调用视觉语言大模型(VLM)真香,是不是可以没有YOLO和OCR了?

    和管理 Agent 的专用语言。它允许开发人员通过结构化的系统提示词、工具和各类协作策略来增强 Agent 的功能。 今天我们就尝试在开发板上利用质AI的视觉语言模型(VLM)模型来进行图像识别。我们
    发表于 08-01 22:15

    模态感知+豆包大模型!家居端侧智能升级

    的关键力量。星宸科技与豆包大模型的合作,将这一技术趋势落实到实际应用场景中,在智能家居、可穿戴设备以及连锁店等领域引发了深刻变革。   智能家居升级   陈立敬指出:“智能家居2.0需要大模型大脑”。在智能家居领域,模态感知与
    的头像 发表于 06-21 00:06 6611次阅读
    <b class='flag-5'>多</b><b class='flag-5'>模态</b>感知+豆包大模型!家居端侧智能<b class='flag-5'>升级</b>

    【「零基础开发AI Agent」阅读体验】+Agent开发平台

    开发平台提供的大模型多样性,可将其分为两类,即单模型平台及模型平台。 2)收集角色与任务指令 通过设计Agent的提示词,开发者可以通过自然语言,定义Agent的角色,规划Agent
    发表于 05-13 12:24

    【「零基础开发AI Agent」阅读体验】+初品Agent

    事务和专业事务的处理能力,它是存在于计算机程序等虚拟环境中的虚拟代理人。 Agent并非聊天机器人的升级版,它不仅会告诉你“如何做”,还会“帮你做”。 因此它可以被定义为能自主理解、规划决策、执行复杂
    发表于 04-22 11:51

    海康威视发布模态大模型AI融合巡检超脑

    基于海康观澜大模型技术体系,海康威视推出新一代模态大模型AI融合巡检超脑,全面升级人、车、行为、事件等算法,为行业带来全新的模态大模型巡
    的头像 发表于 04-17 17:12 1332次阅读

    模态交互技术解析

    模态交互 模态交互( Multimodal Interaction )是指通过多种感官通道(如视觉、听觉、触觉等)或多种交互方式(如语音、手势、触控、眼动等)与计算机系统进行自然、
    的头像 发表于 03-17 15:12 3502次阅读

    《AI Agent 应用与项目实战》第1-2章阅读心得——理解Agent框架与Coze平台的应用

    学习了解,再总结概括将呈现出以下几个特点: 认知智能跃升:从被动执行到主动思考,Agent将具备推理规划、自主决策能力。它不再是简单的工具,而是能理解上下文、洞察意图的智能伙伴。 模态融合:打破单一
    发表于 02-19 16:35

    体验MiniCPM-V 2.6 模态能力

    模态组网
    jf_23871869
    发布于 :2025年01月20日 13:40:48

    名单公布!【书籍评测活动NO.55】AI Agent应用与项目实战

    use——AutoGLM,面向电脑的compute use——GLM PC,以及面向网页的GLM-Web能力。 此前,微软也宣布,已建立全球规模最大的企业级AI Agent生态系统。
    发表于 01-13 11:04

    推出深度推理模型GLM-Zero预览版

    近日,智公司正式发布了其深度推理模型GLM-Zero的预览版——GLM-Zero-Preview。这款模型标志着智谱在扩展强化学习技术训练推理模型方面的重大突破,成为其首个专注于增强AI推理能力
    的头像 发表于 01-03 10:42 764次阅读

    GLM-Zero深度推理模型预览版正式上线

    近日,智公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上线。这款模型是智首个基于扩展强化学习技术训练的推理模型,标志着智谱在AI推理领域
    的头像 发表于 01-02 10:55 799次阅读

    商汤日日新模态大模型权威评测第一

    刚刚,商汤科技日日新SenseNova模态大模型,在权威综合评测权威平台OpenCompass的模态评测中取得榜单第一。
    的头像 发表于 12-20 10:39 1496次阅读

    利用OpenVINO部署GLM-Edge系列SLM模型

    近期智发布了其最新的GLM-Edge系列SLM模型,GLM-Edge 系列是智谱在面向端侧真实落地使用的场景下的一次尝试,由两种尺寸的大语言对话模型和
    的头像 发表于 12-09 16:12 2436次阅读