0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软OmniParser V2发布:大模型转化为计算机智能体

科技绿洲 来源:网络整理 作者:网络整理 2025-02-17 14:35 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,微软官网宣布了一项重要更新。微软发布了其视觉Agent解析框架OmniParser的最新版本V2。这一新版本具备将包括OpenAI的4o、o1、o3-mini,DeepSeek的R1,Qwen的2.5VL,以及Anthropic的Sonnet在内的大模型,转化为“计算机使用智能体”(Computer Use Agent)的能力。

与前代版本相比,OmniParser V2在多个方面实现了显著提升。在检测更微小、可交互的元素时,V2展现了更高的精度和更快的推理速度。这一提升得益于V2采用了更大规模的交互元素检测数据集和图标功能描述数据进行训练。

此外,OmniParser V2还通过缩小图标描述模型的输入图像尺寸,进一步优化了推理性能。据微软官方数据,与前代版本相比,V2的推理延迟降低了60%。这一改进使得OmniParser V2在处理复杂视觉任务时更加高效,为用户提供了更加流畅、实时的交互体验。

此次OmniParser V2的发布,不仅展示了微软在人工智能领域的持续创新,也为大模型在计算机智能体领域的应用开辟了新的道路。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6752

    浏览量

    108082
  • 计算机
    +关注

    关注

    19

    文章

    7841

    浏览量

    93464
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26261
  • 大模型
    +关注

    关注

    2

    文章

    3771

    浏览量

    5273
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    千比特量子计算机横空出世!国产企业进入商业化“快车道”

    量子相继宣布新一轮融资,玻色量子还发布了国内首个突破千比特规模的专用量子计算机“驭量·山海1000”。     量子+A I成为关注点, 国内量子计算机多路线并进 什么是量子计算机?与
    的头像 发表于 04-14 09:07 5459次阅读
    千比特量子<b class='flag-5'>计算机</b>横空出世!国产企业进入商业化“快车道”

    长江计算G940K V2超节点服务器完成对DeepSeek V4模型极速适配

      4月24日,备受行业关注的大模型产品DeepSeek V4正式发布。烽火通信旗下长江计算凭借深厚的技术积累与前瞻布局,以G940K V2
    的头像 发表于 04-24 17:40 1516次阅读

    后摩智能M50芯片助力紫光计算机UNIS L3831 G3发布

    4月16日,在2026紫光计算机销售合作伙伴大会上,紫光计算机正式发布新一代移动工作站UNIS L3831 G3。 该产品搭载后摩智能端边大模型
    的头像 发表于 04-22 17:01 452次阅读
    后摩<b class='flag-5'>智能</b>M50芯片助力紫光<b class='flag-5'>计算机</b>UNIS L3831 G3<b class='flag-5'>发布</b>

    计算机专业408考研科目

    模型。 在这个阶段,不要急于背诵数据结构的代码或操作系统的算法,而是要理解计算机是如何“思考”的。你需要将数据结构视为信息的组织方式,将组成原理视为信息的物理载体,将操作系统视为资源的管理者,将网络视为
    发表于 04-11 16:44

    RDMA设计37:RoCE v2 子系统模型设计

    本博文主要交流设计思路,在本博客已给出相关博文160多篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。 RoCE v2 子系统模型是用来模拟 RoCE v2 功能
    发表于 02-06 16:19

    重磅更新 | 先楫半导体HPM_APPS v1.10.1发布

    重磅更新 | 先楫半导体HPM_APPS v1.10.1发布
    的头像 发表于 12-26 08:33 1369次阅读
    重磅更新 | 先楫半导体HPM_APPS <b class='flag-5'>v</b>1.10.1<b class='flag-5'>发布</b>

    微软发布多项全新自主式能力企业智能

    Platform的智能集成,加速从“记录系统”迈向“行动系统”,帮助企业提升线索转化优化运营与推动创新。微软还联合哈佛商学院推出实践资源,助力企业迈向自主式
    的头像 发表于 12-19 16:14 767次阅读

    微软Microsoft Copilot Studio智能平台全面升级

    近期,微软lgnite大会重磅宣布Microsoft Copilot Studio全面升级,集成智能构建、自动化与治理,支持多模型和跨平台集成,强化安全与可控性。企业可一站式打造高效
    的头像 发表于 12-09 17:36 1482次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+具身智能芯片

    智能的第一层,也是最基础的一层。 主要负责从外部环境中获取数据,并将这些数据转化为计算机可以理解的形式。感知层包括各种传感器和输入设备,如摄像头、麦克风、键盘和激光雷达等。 作用:是将外部数据
    发表于 09-18 11:45

    【作品合集】赛昉科技VisionFive 2单板计算机开发板测评

    赛昉科技VisionFive 2单板计算机开发板测评作品合集 产品介绍: 昉·星光 2是全球首款集成了3D GPU的高性能量产RISC-V单板计算机
    发表于 09-04 09:08

    微软正式发布Microsoft行星计算机专业版

    地理空间数据虽赋能能源、农业、零售等多领域,却因复杂性与数据孤岛问题长期局限于专家群体。微软正式发布Microsoft行星计算机专业版,通过Microsoft Azure(国际版)整合AI技术分析能力,实现海量数据从采集、处理到
    的头像 发表于 08-19 14:31 1319次阅读

    新一代神经拟态类脑计算机“悟空”发布,神经元数量超20亿

    电子发烧友网综合报道 8月2日,浙江大学脑机智能全国重点实验室发布新一代神经拟态类脑计算机——Darwin Monkey(中文名“悟空”)。   “悟空”堪称国际首台神经元规模超20亿
    的头像 发表于 08-06 07:57 7865次阅读
    新一代神经拟态类脑<b class='flag-5'>计算机</b>“悟空”<b class='flag-5'>发布</b>,神经元数量超20亿

    V2板子上部署豆包模型调试指南

    V2板子上部署豆包模型调试指南 准备阶段 首先,可以观看大模型实战(SC171开发套件V3)并下载工程源码,之后我们需要在板子上安装这个代码所要用到的一些库。 pip3 instal
    发表于 05-25 10:17

    重磅更新 | 先楫半导体HPM_APPS v1.9.0发布

    重磅更新 | 先楫半导体HPM_APPS v1.9.0发布
    的头像 发表于 05-13 11:29 2026次阅读
    重磅更新 | 先楫半导体HPM_APPS <b class='flag-5'>v</b>1.9.0<b class='flag-5'>发布</b>

    微软推出两款全新销售智能

    采用智能Mirosoft Copilot副驾驶,企业构建超40万个自定义智能。新功能公开预览版将于5月发布,体验AI销售新纪元!
    的头像 发表于 05-09 16:09 1287次阅读