近日,微软官网宣布了一项重要更新。微软发布了其视觉Agent解析框架OmniParser的最新版本V2。这一新版本具备将包括OpenAI的4o、o1、o3-mini,DeepSeek的R1,Qwen的2.5VL,以及Anthropic的Sonnet在内的大模型,转化为“计算机使用智能体”(Computer Use Agent)的能力。
与前代版本相比,OmniParser V2在多个方面实现了显著提升。在检测更微小、可交互的元素时,V2展现了更高的精度和更快的推理速度。这一提升得益于V2采用了更大规模的交互元素检测数据集和图标功能描述数据进行训练。
此外,OmniParser V2还通过缩小图标描述模型的输入图像尺寸,进一步优化了推理性能。据微软官方数据,与前代版本相比,V2的推理延迟降低了60%。这一改进使得OmniParser V2在处理复杂视觉任务时更加高效,为用户提供了更加流畅、实时的交互体验。
此次OmniParser V2的发布,不仅展示了微软在人工智能领域的持续创新,也为大模型在计算机智能体领域的应用开辟了新的道路。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
微软
+关注
关注
4文章
6752浏览量
108082 -
计算机
+关注
关注
19文章
7841浏览量
93464 -
数据集
+关注
关注
4文章
1240浏览量
26261 -
大模型
+关注
关注
2文章
3771浏览量
5273
发布评论请先 登录
相关推荐
热点推荐
千比特量子计算机横空出世!国产企业进入商业化“快车道”
量子相继宣布新一轮融资,玻色量子还发布了国内首个突破千比特规模的专用量子计算机“驭量·山海1000”。 量子+A I成为关注点, 国内量子计算机多路线并进 什么是量子计算机?与
长江计算G940K V2超节点服务器完成对DeepSeek V4模型极速适配
4月24日,备受行业关注的大模型产品DeepSeek V4正式发布。烽火通信旗下长江计算凭借深厚的技术积累与前瞻布局,以G940K V2
后摩智能M50芯片助力紫光计算机UNIS L3831 G3发布
4月16日,在2026紫光计算机销售合作伙伴大会上,紫光计算机正式发布新一代移动工作站UNIS L3831 G3。 该产品搭载后摩智能端边大模型
计算机专业408考研科目
”模型。
在这个阶段,不要急于背诵数据结构的代码或操作系统的算法,而是要理解计算机是如何“思考”的。你需要将数据结构视为信息的组织方式,将组成原理视为信息的物理载体,将操作系统视为资源的管理者,将网络视为
发表于 04-11 16:44
RDMA设计37:RoCE v2 子系统模型设计
本博文主要交流设计思路,在本博客已给出相关博文160多篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。
RoCE v2 子系统模型是用来模拟 RoCE v2 功能
发表于 02-06 16:19
微软发布多项全新自主式能力企业智能体
Platform的智能体集成,加速从“记录系统”迈向“行动系统”,帮助企业提升线索转化优化运营与推动创新。微软还联合哈佛商学院推出实践资源,助力企业迈向自主式
微软Microsoft Copilot Studio智能体平台全面升级
近期,微软lgnite大会重磅宣布Microsoft Copilot Studio全面升级,集成智能体构建、自动化与治理,支持多模型和跨平台集成,强化安全与可控性。企业可一站式打造高效
【「AI芯片:科技探索与AGI愿景」阅读体验】+具身智能芯片
智能的第一层,也是最基础的一层。
主要负责从外部环境中获取数据,并将这些数据转化为计算机可以理解的形式。感知层包括各种传感器和输入设备,如摄像头、麦克风、键盘和激光雷达等。
作用:是将外部数据
发表于 09-18 11:45
【作品合集】赛昉科技VisionFive 2单板计算机开发板测评
赛昉科技VisionFive 2单板计算机开发板测评作品合集
产品介绍:
昉·星光 2是全球首款集成了3D GPU的高性能量产RISC-V单板计算机
发表于 09-04 09:08
微软正式发布Microsoft行星计算机专业版
地理空间数据虽赋能能源、农业、零售等多领域,却因复杂性与数据孤岛问题长期局限于专家群体。微软正式发布Microsoft行星计算机专业版,通过Microsoft Azure(国际版)整合AI技术分析能力,实现海量数据从采集、处理到
新一代神经拟态类脑计算机“悟空”发布,神经元数量超20亿
电子发烧友网综合报道 8月2日,浙江大学脑机智能全国重点实验室发布新一代神经拟态类脑计算机——Darwin Monkey(中文名“悟空”)。 “悟空”堪称国际首台神经元规模超20亿
在V2板子上部署豆包模型调试指南
在V2板子上部署豆包模型调试指南
准备阶段
首先,可以观看大模型实战(SC171开发套件V3)并下载工程源码,之后我们需要在板子上安装这个代码所要用到的一些库。
pip3 instal
发表于 05-25 10:17
微软推出两款全新销售智能体
采用智能Mirosoft Copilot副驾驶,企业构建超40万个自定义智能体。新功能公开预览版将于5月发布,体验AI销售新纪元!
微软OmniParser V2发布:大模型转化为计算机智能体
评论