0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大晓机器人推出全屋三维可交互世界模型Kairos-HomeWorld

商汤科技SenseTime 来源:大晓机器人 2026-06-08 17:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

来源:大晓机器人

近日,大晓机器人联合香港中文大学多媒体实验室、深圳河套学院发布最新世界模型研究成果 Kairos-HomeWorld,这是全球首个实现全屋生成、个体物体全交互的世界模型统一框架。

该技术突破了现有室内场景生成仅能覆盖单房间、缺乏全局一致性与可操作性的行业瓶颈,能够一键生成结构连贯、物理合理、功能完整的全屋三维场景,为具身人工智能与机器人训练提供了大规模、高保真的中国家庭场景可交互的实训场。

具身智能的终极目标是走进千家万户,但家庭环境的高度复杂性与个性化,要求机器人必须在海量差异化真实场景中训练。为此,研究团队同步开源全球规模最大、首个专为中国家庭打造的全屋 3D 数据集。该数据集包含 30 万套中国真实住宅平面图与 5千个完整带可交互家具和物体的仿真场景,覆盖全国各类典型家居户型,完整还原中国本土家庭居住特征,为具身人工智能的国产化落地提供了核心数据与技术底座。

bf7df25c-6318-11f1-90a1-92fbcf53809c.png

此前,北美机器人领军企业 Figure AI 与全球最大房地产持有者之一 Brookfield 达成战略合作,依托Brookfield 超10万套的住宅单元,进行机器人导航、交互、家务执行的训练,这与 Kairos-HomeWorld 赋能本土机器人训练的思路形成全球呼应。

与之相比,Kairos—HomeWorld在家庭机器人训练方面成本低、效率高。依托模型就能批量生成多样化中国家庭仿真场景,以及自带物理交互属性的物体。机器人可在虚拟环境完成各类家务训练,新增场景近乎零边际成本,省去场地运维、家具损耗等实景开支;同时不受现实房源总量限制,在训练效率与规模化拓展上优于实地采集路线。

目前 Kairos-HomeWorld 已成功应用于大晓机器人的具身智能日常训练,能够支持机器人完成跨房间导航、多房间物品整理等复杂长程家务任务的全流程仿真训练,大幅缩短了从虚拟仿真到现实落地的迁移周期,显著降低具身智能的研发门槛,加速机器人在中国市场的规模化普及。

首创全屋三维生成与物体级可交互 打破行业仿真数据天花板

Kairos-HomeWorld 凭借四阶段分层生成架构(全局结构—局部细节—闭环校验—交互增强),首次实现从单句文本到结构全局一致、物理完全合规、物体可交互的完整住宅三维场景端到端生成,彻底重构了室内场景生成的技术范式。

该架构将复杂的全屋级生成任务解耦为四个阶段,完美解决了传统方法全局一致性差、物理错误频发、场景不可交互的挑战。

bfe5b72a-6318-11f1-90a1-92fbcf53809c.png

框架的第一阶段首创基于K-D树的平面图结构化表示方法,将真实住宅平面图转化为大语言模型可高效学习的分层文本结构,避免房间重叠、拓扑断裂等传统户型生成方法的缺陷。第二阶段采用"俯视图全局初始化+第一人称细节漫游"的分层策略,以一阶段生成的3D建筑外壳锚定整个生成过程,解决了2D-3D提升方法普遍存在的几何漂移问题。第三阶段通过微调视觉语言模型构建递归闭环校验机制,自动检测并修正"沙发挡门"、"物体穿墙"等物理违规,将家具布局碰撞率控制在行业最优水平。

在物体级全交互层面,Kairos-HomeWorld是全球首个全屋可操作物体生成的统一框架,这一标志性能力由架构第四阶段的表面中心物体放置算法实现。系统自动获取物体材质、密度、铰接结构等。最终生成的每个场景平均包含超过 15 个可操作物体,足迹物体密度(衡量家具表面上物体的密集程度与功能丰富度)达4.16,且所有物体可直接导入仿真引擎进行抓取、移动、堆叠等交互操作。

该框架精准解决了房间动线混乱、功能邻接性缺失的全局一致性问题;打破了生成场景 "只能看不能用" 的局限,让虚拟环境真正具备支撑机器人导航、操作、任务执行的能力;破解了3D仿真数据稀缺的瓶颈,解决了合成数据不真实、扫描数据不可交互的矛盾。此次同步开源的大规模数据集,将进一步加速具身人工智能的产业化落地。

30万真实户型+5千家庭全场景,全球首个中国家庭专属全屋3D数据集发布

大晓机器人联合香港中文大学多媒体实验室发布首个专为中国家庭居住场景打造的全屋 3D 数据集,数据规模全球最大。该数据集包含30万张经过结构化标注的真实住宅平面图、5千个具有完整室内布局与家具布置的全屋仿真场景,以及5万个支持物理仿真与交互操作的物体资产。彻底填补了国内缺乏大规模、高保真、符合本土居住习惯的室内场景数据的行业空白,为中国家庭服务机器人的本土化训练提供了核心数据底座。

在规模上,该数据集实现了量级式突破。30万张真实住宅平面图全部来自中国市场真实房源,经过多阶段自动化处理流程完成矢量化与结构化标注,包含门窗位置、房间几何、功能分区、连通关系等全维度信息,是目前全球最大的真实住宅平面图数据集,是此前广泛使用 RPLAN 数据集包含8万张,ResPlan 数据集仅包含1.7万张。

在此基础上训练生成的带家具和物体的全屋仿真场景,每户均包含完整的家具布局,并借助Physx-Omni模型,自动生成平均15+个带物理属性(包含密度、铰接、流形等)的可交互对象,且全部支持直接导入仿真引擎进行交互式训练。

c04ac804-6318-11f1-90a1-92fbcf53809c.png

图注:全球室内场景资源对比表,其中各符号与术语的含义如下:Rec. 代表基于重建的真实世界数据集;S./H. 分别指代带家具场景数(单个、通常为房间级别的独立区域)与住宅数(包含多个房间的统一完整住宅);Sim-ready 即仿真就绪度,用于衡量数据集是否提供可直接在仿真 / 渲染引擎中实例化、并支持物体级交互操作的完整 3D 场景;MObj. 表示有数据可查时的单场景平均可操作物体数量;n/r 指未报告相关数据,“–” 表示该项不适用;Collection 则代表由多个不同数据源整合而成的聚合类数据集。

更具行业价值的是其中国家庭专属属性。此前全球主流的开源室内场景数据集均基于欧美居住习惯构建,普遍存在房间布局和装饰欧美化、开放式厨房、缺乏阳台功能区等问题,导致基于这些数据训练的机器人在进入中国家庭时出现水土不服。

Kairos-HomeWorld 数据集覆盖了全国不同城市、不同面积段的典型户型,从30㎡一居室刚需小户型到 200㎡以上改善型大户型,完整还原了中国家庭特有的南北通透布局、封闭式厨房、独立生活阳台、干湿分离卫生间、玄关鞋柜等本土居住特征,甚至包含老小区非矩形厨房、不规则客厅等常见复杂户型。

此次数据集将面向学术界与产业界全面开源,团队还计划在后续版本中持续扩充不同地域、不同装修风格的场景样本,并加入更多中国家庭特有的物品与交互场景,进一步降低具身AI的本土化训练门槛,加速服务机器人在中国家庭的规模化落地。

沉浸式演示一键生成中国家庭仿真场景,加速机器人训练

Kairos-HomeWorld 已成功应用于大晓机器人的具身智能日常训练。本次视频完整呈现了 Kairos-HomeWorld 从文本指令到可交互户型的全链路生成过程,直观展现了其 "一键生成、全局一致、物理合规" 的核心能力。

视频中,只需输入 "生成一套新中式 90 平米两室一厅" 的文本提示,模型首先基于中国真实户型数据与 K-D 树结构化表示,快速生成符合本土居住习惯的空房间结构,精准还原南北通透、功能分区合理的典型户型。

随后通过 "俯视图全局布局 + 第一人称细节填充" 的分层策略,自动生成风格统一的家具摆放;接着通过Physx-Omni模型为桌面、台面等表面生成带完整物理属性的可交互物品资产,例如铰接属性、密度、流形等。

通过自然语言下达 "全屋物品整理" 的复杂指令,机器人自动将其拆解为多个精准的子任务,按照 "客厅→阳台→厨房→主卧→餐厅→次卧" 的完整全屋动线依次执行。

在大规模中国家庭仿真环境训练的机器人可以识别不同物品、规划最优路径、完成精准抓取与放置的全过程,包括将打开冰箱和柜门的铰接物体交互、倒洗衣液的流体交互、拉开窗帘的柔性物体交互、拿苹果的不规则物体交互,以及放置零食的模拟重力属性交互等。

相比传统仅能支持导航训练的仿真环境,Kairos-HomeWorld 生成的场景具备全局一致的空间结构,支持机器人跨房间连续导航;所有物体均带有真实物理属性,机器人可与超过15种不同类型的物品进行自然交互,模拟真实世界的碰撞、重力与摩擦效果,让机器人在虚拟世界中就能完成复杂家务任务的全流程训练,大幅缩短了从仿真到现实的迁移周期。

项目主页链接:

https://kairos-homeworld.github.io/

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    215

    文章

    31782

    浏览量

    224941
  • 三维
    +关注

    关注

    1

    文章

    532

    浏览量

    30053
  • 模型
    +关注

    关注

    1

    文章

    3907

    浏览量

    52421

原文标题:全球首个!大晓机器人推出全屋三维可交互世界模型 Kairos-HomeWorld

文章出处:【微信号:SenseTime2017,微信公众号:商汤科技SenseTime】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    三维力传感器工作原理及应用领域是什么样的,在未来市场是占据怎么的地位?

    力控方案的需求。 机器人灵巧操作 在人形机器人的手指与手腕关节,空间狭小且对精度要求极高。厦门力晟的三维力传感器凭借其小体积、高刚度的特点,被用于机器人手指尖的抓取力测量。在精密装配(
    发表于 05-21 09:37

    普渡机器人正式发布具身智能大模型PuduFM 1.0

    :对三维空间的深度感知与推理、面向未来的物理状态预测,在真实交互中持续进化的学习机制,基于对物理世界的理解,从而支持异构机器统一运行。
    的头像 发表于 05-15 11:52 592次阅读
    普渡<b class='flag-5'>机器人</b>正式发布具身智能大<b class='flag-5'>模型</b>PuduFM 1.0

    力传感器:当机器人拥有“真实触觉”,未来会发生什么?

    的“触觉神经”。虽然不起眼,但它正在悄悄改变智能制造和机器人共处的未来。 六力传感器是什么? 简单说,六力传感器也叫六轴力传感器,是目前能测量力的“最全能的选手”。它能同时测出
    发表于 04-29 16:29

    价值20万的机器人做大奖!创想三维携手智元,加速3D打印破圈

    4月17日,消费级3D打印与具身智能赛道完成了一次产业触碰。 3D打印生态领创者 创想三维 联合具身智能独角兽 智元机器人 ,正式上线「Make Your Robot」机器人3D打印外观设计大赛
    的头像 发表于 04-20 09:03 221次阅读
    价值20万的<b class='flag-5'>机器人</b>做大奖!创想<b class='flag-5'>三维</b>携手智元,加速3D打印破圈

    商汤大装置联合大机器人与广西产业技术研究院达成战略合作

    近日,商汤大装置联合大机器人与广西产业技术研究院达成战略合作,就AI基础设施建设、具身数据采集、世界模型研发、机器人应用场景拓展等领域达成
    的头像 发表于 03-20 17:40 1944次阅读

    机器人开源实时生成世界模型Kairos 3.0-4B

    近日,大机器人重磅开源开悟世界模型3.0(Kairos 3.0)-4B 系列具身原生世界
    的头像 发表于 03-14 16:54 2139次阅读
    大<b class='flag-5'>晓</b><b class='flag-5'>机器人</b>开源实时生成<b class='flag-5'>世界</b><b class='flag-5'>模型</b><b class='flag-5'>Kairos</b> 3.0-4B

    机器人开源空间智能通用模型ACE-Brain-0

    近日,大机器人联合上海交通大学、南洋理工大学、香港中文大学、香港大学等研究机构共同推出以空间智能为底层框架、跨不同具身本体的通用基础模型“ACE-Brain-0”,正式面向全行业开源
    的头像 发表于 03-11 13:45 451次阅读
    大<b class='flag-5'>晓</b><b class='flag-5'>机器人</b>开源空间智能通用<b class='flag-5'>模型</b>ACE-Brain-0

    NVIDIA Cosmos世界基础模型如何塑造机器人未来

    在这一演进过程中,世界模型逐渐成为连接高层智能与底层执行的关键基础设施。通过对环境状态及其时间演化进行建模,世界模型使机器人系统能够在受控环
    的头像 发表于 01-22 16:38 966次阅读
    NVIDIA Cosmos<b class='flag-5'>世界</b>基础<b class='flag-5'>模型</b>如何塑造<b class='flag-5'>机器人</b>未来

    机器人发布开悟3.0,国产世界模型机器人拥有“超级大脑”

    机器人的使命就是让每个机器人都拥有一个聪明的大脑,洞察万物,学会与视觉精准交互。   在此背景下,大机器人凭借其原创的“
    的头像 发表于 12-25 09:25 2951次阅读
    大<b class='flag-5'>晓</b><b class='flag-5'>机器人</b>发布开悟3.0,国产<b class='flag-5'>世界</b><b class='flag-5'>模型</b>让<b class='flag-5'>机器人</b>拥有“超级大脑”

    商汤科技联合创始刚担任大机器人董事长

    机器人将于12月18日正式亮相,重磅发布多项全球领先的技术与产品阵列,并将推出首个国内开源且实现商业应用的“开悟”世界模型3.0,与行业
    的头像 发表于 12-08 11:31 935次阅读

    RK3576机器人核心:屏异显+八路摄像头,重塑机器人交互与感知

    ,以其"屏异显"和"八路摄像头"的强悍能力,为机器人开发者提供了前所未有的强大算力平台。米尔电子基于其MYD-LR3576
    发表于 10-29 16:41

    一种基于多次观测融合的交互三维高斯场景重建框架

    在计算机视觉和机器人领域,如何完整、真实地重建一个交互三维场景,一直是一个难题。传统方法往往依赖复杂的多阶段流程,比如先做分割,再进行背景补全或修复,或者需要对每个物体进行密集扫描
    的头像 发表于 09-29 11:12 850次阅读
    一种基于多次观测融合的<b class='flag-5'>可</b><b class='flag-5'>交互</b><b class='flag-5'>三维</b>高斯场景重建框架

    再掀语音交互革命,广和通AI解决方案加速机器人听觉进化

    机器人世界里,感知是智能化的第一步,是机器人获取环境信息,学习适应并自主决策的前提。听觉作为五感之一,深度融合AI,帮助机器人实现高效感知、数据获取、语音
    的头像 发表于 08-26 17:44 1150次阅读

    发力人形机器人赛道,傅利叶重磅推出陪伴机器人GR-3

    8月6日,在北京举办的世界机器人大会上,上海傅利叶智能科技公司正式发布了首款主打交互陪伴、具备触摸特性的尺寸人形
    的头像 发表于 08-20 09:12 6651次阅读
    发力人形<b class='flag-5'>机器人</b>赛道,傅利叶重磅<b class='flag-5'>推出</b>陪伴<b class='flag-5'>机器人</b>GR-3

    请帮帮我:AutoCAD三维显示问题,和正常视角相背

    AutoCAD三维显示问题,和正常视角相背 AutoCAD三维显示问题,和正常视角相背
    发表于 08-14 09:50