平面布置图对于可视化空间、规划路线和沟通建筑设计非常有用。例如,一个进入新建筑的机器人可以使用平面图快速感知总体布局。创建平面图通常需要一个完整的布局,这样3D传感器和摄像机就可以捕捉到整个空间。
1月11日消息,据外媒报道,近日,来自Facebook、德克萨斯大学奥斯汀分校和卡内基梅隆大学的研究人员正在探索一种人工智能技术,利用视觉和音频,从一个短视频剪辑中重建一个平面图。
研究人员断言,音频提供了空间和语义信号,补充了图像的映射能力。他们说,这是因为声音天生是由物体的几何形状所驱动的。声音从表面反射回来,揭示了房间的形状,远远超出了相机的视野。从远处听到的声音,甚至是多个房间之外的声音,可以揭示自由空间的存在,声音物体可能存在。此外,从不同方向听到的声音暴露了基于这些声音所代表的活动或事物的布局。例如,淋浴的声音可能暗示着浴室的方向,而微波炉的声音则暗示着厨房的方向。
研究人员的方法被称为AV-Map,旨在将带有多通道音频的短视频转换成2D楼层平面图。机器学习模型利用音频和视觉数据序列来推理楼层平面图的结构和语义,最终使用解码组件融合音频和视频信息。AV-Map生成的平面图大大超出了视频中直接可见的区域,显示了划分为离散语义房间标签(如家庭房间和厨房)的自由空间和被占用区域。
该团队在来自Matternet3D和SoundSpaces数据集的数字环境中试验了两种设置,即主动和被动。在第一个实验中,使用一个虚拟摄像机在模型房屋的房间内移动时发出一种已知的声音。在第二种情况下,只依赖家中物体或人自然发出的声音。
研究人员表示,在未来的工作中,将计划考虑扩展多层平面图,并将绘图想法与机器人连接起来,主动控制摄像头。
责任编辑:pj
-
机器人
+关注
关注
213文章
30590浏览量
219623 -
Facebook
+关注
关注
3文章
1432浏览量
58355 -
人工智能
+关注
关注
1813文章
49741浏览量
261570
发布评论请先 登录
微软与新思科技分享智能体人工智能技术的行业影响
中科创达旗下创通联达即将举办RUBIK Pi 3端侧人工智能技术巡演
挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器
挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!
人工智能技术的现状与未来发展趋势
CES Asia 2025同期低空智能感知与空域管理技术论坛即将启幕
最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)
中科曙光亮相2025全球人工智能技术大会
传统工厂如何利用人工智能技术实现运筹优化与效率提升
智慧路灯如何应用人工智能技术
【「具身智能机器人系统」阅读体验】+初品的体验
研究人员利用激光束开创量子计算新局面

Facebook研究人员利用视觉和音频探索人工智能技术
评论