0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CVPR2025:中科视语发布首个具身物理空间大模型PhysVLM!战略布局“AI+机器人”新生态

爱云资讯 2025-03-19 15:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能技术加速向具身智能(Embodied AI)演进的关键节点,中科视语重磅发布其最新前沿成果——PhysVLM(首个机器人物理空间具身大模型),作为具身智能领域的里程碑式突破,PhysVLM 率先实现 “环境感知-本体理解-决策执行” 全链条技术闭环,通过多模态感知、动态环境建模、自主决策规划的深度融合,赋予机器人在复杂物理空间的类人级操作能力。

作为首创“环境感知、本体理解、决策执行”全链条技术突破的AI企业,中科视语以PhysVLM的发布为起点,正逐步构筑面向工业4.0、智慧交通、具身机器人等领域的核心技术底座,重新定义“AI+机器人”协同发展新范式。

物理感知革命,机器人也懂“分寸感”!

随着视觉语言模型(VLM)的快速发展,机器人已能精准理解场景语义,但 “看懂” 不等于 “能做”。传统模型普遍缺乏对机器人自身物理约束的感知能力,导致其在工业、智慧城市等复杂场景中频繁出现“越界操作”,如机械臂试图抓取超出其可达范围的物体,或因未考虑关节限位而引发机械故障。这种 “感知与决策割裂” 的问题,已成为制约具身智能规模化落地的关键瓶颈。

针对这一挑战,中科视语创新性地提出首个机器人物理空间具身大模型,通过创新的空间-物理约束表征的学习范式,有效整合了对环境的视觉理解和对具身智能体的物理空间约束感知,通过三大维度的突破,实现了从 “环境感知” 到 “可靠行动” 的质的飞跃。

构建“空间感知-物理约束”双轮驱动决策体系

具身空间-物理约束建模,打破平台壁垒

首创空间- 物理约束映射(S-P Map)技术,将机械臂的几何参数、关节运动范围等物理约束转化为可学习的视觉语义表征。通过这种 “物理约束视觉化” 的方法,模型无需依赖具体机器人参数即可实现跨平台泛化,为构建通用型具身智能奠定了基础。

视觉-物理空间协同推理,重塑决策逻辑

采用视觉- 物理双编码器架构:主视觉分支保留开放域场景理解能力,物理约束分支专注于可达性分析。通过多模态融合模块和对齐模块,模型能够实时权衡环境语义与物理可行性,生成 “既看得懂又做得到” 的动作规划。例如,当识别到目标物体超出当前机械臂范围时,系统会自动规划 “移动底盘靠近目标” 的分步策略。

wKgZPGfabKiAL72uAAJXiSkTkYg194.png

百万级数据集,定义行业标准

中科视语研究团队构建了包含6类工业机械臂、10万组操作场景的基准数据集,涵盖RGB图像—可达物理空间图(S-P Map)—具身物理问答三元组数据。配套开发的EQA-phys评估基准包含带有4类工业机械臂的仿真环境和问答数据,为具身智能的物理认知提供了量化评估基准。

实验结果表明,PhysVLM在EQA-phys上的性能比GPT-4o高出14%,在RoboVQA-val和OpenEQA等基准测试中也超过了RoboMamba和SpatialVLM等先进的具身VLM。此外,S-P Map与各种VLM高度兼容,集成到GPT-4o-mini后,提升了7.1%的可达性理解任务性能。

战略布局:“三维框架”引领从感知到具身智能跨越

中科视语始终以前瞻性眼光,致力于将先进的通用视觉技术与机器人实际操作深度融合,此次发布的PhysVLM作为重要战略成果,以“三维战略框架”构筑坚实的产业壁垒:

视语坤川®通用视觉大模型:中科视语经过多次技术升级与迭代,构建了多模态大语言模型(MLLM),融合大语言模型的基础能力,结合了视语多年面向行业的人工智能视觉解决方案经验,具备超强的视觉感知能力,并进一步支持了原生的视觉理解与推理。

具身智能核心算法中科视语宣布正式开源PhysVLM(首个机器人物理空间具身大模型),实现 “环境感知-本体理解-决策执行” 全链条技术闭环,为工业、智慧交通等场景提供安全可靠的决策支撑,为具身智能领域开辟了新路径。

行业场景深度融合:中科视语具备20余年行业专业知识储备及成熟的行业落地经验,聚焦工业、交通、具身机器人等高价值场景,推动技术落地。

行业融合加速推进,打造“AI+机器人”协同生态圈

目前,PhysVLM已在多个高价值领域形成实际应用并取得显著成果,尤其在工业4.0、智慧交通、具身机器人等领域展现出突出商业价值。

在工业领域,中科视语智能焊接机器人,在工业焊接、喷涂等精密作业场景中,突破传统机械臂常因路径规划粗放导致碰撞风险高、生产效率低。中科视语创新推出(S-P Map)模型,通过三维空间动态建模与智能视觉路径规划双重引擎,实现机械臂作业效率与安全性的革命性提升。

在交通领域,中科视语智能劝导机器人,在城市交通治理智能化升级的浪潮中,以“AI + 混合模态感知” 技术重构非机动车监管模式。该产品通过实时识别违规行为、动态路径规划及智能语音劝导,实现交通监管效率提升 40%、事故率下降 35%,为智慧城市交通治理提供 “零接触、全时段、高精度” 的创新解决方案。基于此次发布的最新成果,PhysVLM已初步实现跨机器人、跨行业、跨场景的泛化应用能力,逐渐形成产业级的技术壁垒,为工业4.0、智慧城市与服务机器人市场带来新的产业机遇。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    31453

    浏览量

    223678
  • AI
    AI
    +关注

    关注

    91

    文章

    41147

    浏览量

    302609
  • 大模型
    +关注

    关注

    2

    文章

    3772

    浏览量

    5273
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    我国首个人形机器人智能标准体系发布,灵境智源参与编制

    2026年2月28日,人形机器人智能标准化(HEIS)年会在北京召开。会上正式发布《人形机器人
    的头像 发表于 03-04 17:27 670次阅读

    智能交流会

    龙头企业决策者,围绕 “感知 / 决策 / 控制 / 交互” 核心技术、商业化路径、政策支持等热点展开深度对话,一键嵌入产业生态。 二、展品范围 智能机器人整机: 工业
    发表于 01-22 09:55

    资讯速递 | 智能PMC(筹)发布“零成本”开源鸿蒙智能机器人系统

    面向智能机器人系统与应用开发,Ubuntu 等操作系统可以用 ROS2 生态机器人仿真器、英伟达算力。 然而在国产化方面,开源鸿蒙操作
    的头像 发表于 01-05 16:24 831次阅读
    资讯速递 | <b class='flag-5'>具</b><b class='flag-5'>身</b>智能PMC(筹)<b class='flag-5'>发布</b>“零成本”开源鸿蒙智能<b class='flag-5'>机器人</b>系统

    银河通用机器人拿下1000 台机器人订单,推进智能工业场景深度应用

    模型技术+场景深耕的双轮驱动,银河通用机器人成中国第一 北京2025年12月23日 /美通社/ -- 12月22日,银河通用
    的头像 发表于 12-23 18:24 1887次阅读
    银河通用<b class='flag-5'>机器人</b>拿下1000 台<b class='flag-5'>机器人</b>订单,推进<b class='flag-5'>具</b><b class='flag-5'>身</b>智能工业场景深度应用

    构建生态新范式!开源大脑+小脑,地平线发布两款智能模型

    2025地平线技术生态大会上,地平线创始兼CEO余凯正式发布两大智能开源
    的头像 发表于 12-16 15:01 1.3w次阅读
    构建<b class='flag-5'>生态</b>新范式!开源大脑+小脑,地平线<b class='flag-5'>发布</b>两款<b class='flag-5'>具</b><b class='flag-5'>身</b>智能<b class='flag-5'>模型</b>

    云天励飞亮相2025中国智能机器人大会

    近日,在 2025 中国智能机器人大会上,云天励飞副总裁罗忆从芯片厂商的视角出发,对智能
    的头像 发表于 11-25 11:26 1035次阅读

    首个5G-A智能机器人电网巡检应用示范发布

    近日,中国南方电网广东电网有限责任公司、中国移动通信集团公司、乐聚智能(深圳)股份有限公司及北京通用人工智能研究院,联合发布首个基于5G-A(5G-Advanced)网络的智能
    的头像 发表于 11-03 11:32 1021次阅读

    芯驰科技与银河通用签署战略合作,共推智能机器人芯片与系统创新

    11月1日,本土车规芯片领军企业芯驰科技和模型与人形机器人领军企业银河通用正式签署战略合作协议,双方将围绕下一代
    发表于 11-01 19:29 1280次阅读
    芯驰科技与银河通用签署<b class='flag-5'>战略</b>合作,共推<b class='flag-5'>具</b><b class='flag-5'>身</b>智能<b class='flag-5'>机器人</b>芯片与系统创新

    AI+智造”领跑,光亚鸿道2025工博会完美收官,期待再聚

    2025年9月23日-27日,光亚鸿道重磅亮相2025中国国际工业博览会。围绕智能、轨道交通、智能制造、能源电力等场景,携手生态伙伴,为
    的头像 发表于 10-10 14:47 531次阅读
    “<b class='flag-5'>AI+</b>智造”领跑,光亚鸿道<b class='flag-5'>2025</b>工博会完美收官,期待再聚

    【「AI芯片:科技探索与AGI愿景」阅读体验】+智能芯片

    智能技术的关键要求: 1、基于忆阻器的感存算一体化技术 牛。都可以情感生成了。 2、智能的执行控制 目前,AI运动控制的研究主要集中在: 将成熟的机器人控制转化为可以在神经形态设备
    发表于 09-18 11:45

    机器人十大发展趋势

    2025世界机器人大会开幕式上发布了《2025智能机器
    的头像 发表于 08-12 13:22 2122次阅读
    <b class='flag-5'>具</b><b class='flag-5'>身</b><b class='flag-5'>机器人</b>十大发展趋势

    《人民日报》报道!中科亿海微“中国芯”赋能智能机器人

    7月15日,中科亿海微电子科技(苏州)有限公司(简称中科亿海微)总裁魏育成署名文章《推广“中国芯”在智能机器人领域应用》,登上《人民日报
    的头像 发表于 07-15 14:28 1352次阅读
    《人民日报》报道!<b class='flag-5'>中科</b>亿海微“中国芯”赋能<b class='flag-5'>具</b><b class='flag-5'>身</b>智能<b class='flag-5'>机器人</b>

    媒体报道 | 锚定“端侧AI+机器人”,移远又有大动作!

    以前瞻性的技术布局与场景落地能力深度参与“端侧AI+机器人”产业链,已率先在这一领域取得关键进展。在刚落幕的2025MWC上海展上,移远通信与逐际动力联合
    的头像 发表于 07-11 19:05 1116次阅读
    媒体报道 | 锚定“端侧<b class='flag-5'>AI+</b><b class='flag-5'>机器人</b>”,移远又有大动作!

    艾摩星机器人完成首个智能产品全链路功能验证

    近日,知行科技旗下专注机器人研发与商业化的全资子公司艾摩星机器人完成首个智能产品 —— “充电机器人
    的头像 发表于 06-13 16:21 906次阅读

    智能时代来临,灵途科技助力人形机器人“感知升级”

    、驱动系统与AI算法的落地应用,展览与沙龙双线并行,全面呈现人形机器人的前沿进展。 作为智能核心零部件供应商,灵途科技携多款自研高性能光电传感器受邀亮相。   NEPCON Chi
    的头像 发表于 04-28 09:31 908次阅读
    <b class='flag-5'>具</b><b class='flag-5'>身</b>智能时代来临,灵途科技助力人形<b class='flag-5'>机器人</b>“感知升级”