0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

研究人员正在探索一种新型的人工智能技术

姚小熊27 来源:51cto 作者:51cto 2021-01-12 09:09 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

平面布置图对于可视化空间、规划路线和沟通建筑设计非常有用。例如,一个进入新建筑的机器人可以使用平面图快速感知总体布局。创建平面图通常需要一个完整的布局,这样3D传感器和摄像机就可以捕捉到整个空间。

1月11日消息,据外媒报道,近日,来自Facebook、德克萨斯大学奥斯汀分校和卡内基梅隆大学的研究人员正在探索一种人工智能技术,利用视觉和音频,从一个短视频剪辑中重建一个平面图。

研究人员断言,音频提供了空间和语义信号,补充了图像的映射能力。他们说,这是因为声音天生是由物体的几何形状所驱动的。声音从表面反射回来,揭示了房间的形状,远远超出了相机的视野。从远处听到的声音,甚至是多个房间之外的声音,可以揭示自由空间的存在,声音物体可能存在。此外,从不同方向听到的声音暴露了基于这些声音所代表的活动或事物的布局。例如,淋浴的声音可能暗示着浴室的方向,而微波炉的声音则暗示着厨房的方向。

研究人员的方法被称为AV-Map,旨在将带有多通道音频的短视频转换成2D楼层平面图。机器学习模型利用音频和视觉数据序列来推理楼层平面图的结构和语义,最终使用解码组件融合音频和视频信息。AV-Map生成的平面图大大超出了视频中直接可见的区域,显示了划分为离散语义房间标签(如家庭房间和厨房)的自由空间和被占用区域。

该团队在来自Matternet3D和SoundSpaces数据集的数字环境中试验了两种设置,即主动和被动。在第一个实验中,使用一个虚拟摄像机在模型房屋的房间内移动时发出一种已知的声音。在第二种情况下,只依赖家中物体或人自然发出的声音。

研究人员表示,在未来的工作中,将计划考虑扩展多层平面图,并将绘图想法与机器人连接起来,主动控制摄像头。
责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 摄像头
    +关注

    关注

    61

    文章

    5058

    浏览量

    102449
  • 人工智能
    +关注

    关注

    1813

    文章

    49742

    浏览量

    261577
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    微软与新思科技分享智能人工智能技术的行业影响

    (Agentic AI)技术的行业影响,以及未来跨界合作的前景。此次圆桌讨论不仅展现了双方的战略协同,以及他们在开发市场领先解决方案方面的共同努力,也勾勒出人工智能是如何驱动工程、电信、制药等行业变革的新蓝图。
    的头像 发表于 11-30 09:48 225次阅读

    航天宏图人工智能技术深度赋能社会治理现代化

    航天宏图多年来持续重点投入技术研发,尤其专注人工智能深度探索。航天宏图多以自主研发“天权大模型” 是款基于多模态大模型技术的遥感解译专用A
    的头像 发表于 09-06 10:35 858次阅读
    航天宏图<b class='flag-5'>人工智能技术</b>深度赋能社会治理现代化

    中科创达旗下创通联达即将举办RUBIK Pi 3端侧人工智能技术巡演

    人工智能技术加速向端侧渗透,驱动产业智能化转型的战略机遇期,全球领先的智能物联网产品和解决方案提供商Thundercomm(创通联达)将于2025年9月至10月期间,携手Atlantik
    的头像 发表于 08-15 15:56 932次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    的深度学习,构建起从基础到前沿的完整知识体系,门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    的深度学习,构建起从基础到前沿的完整知识体系,门实验箱就能满足多门课程的学习实践需求,既节省经费又不占地 。 五、代码全开源,学习底层算法 所有实验全部开源,这对于想要深入学习人工智能技术的人来说
    发表于 08-07 14:23

    人工智能技术的现状与未来发展趋势

    人工智能技术的现状与未来发展趋势     近年来,人工智能(AI)技术迅猛发展,深刻影响着各行各业。从计算机视觉到自然语言处理,从自动驾驶到医疗诊断,AI的应用场景不断扩展,推动社会向智能
    的头像 发表于 07-16 15:01 1196次阅读

    CES Asia 2025同期低空智能感知与空域管理技术论坛即将启幕

    的最新进展,探讨如何打破系统间的壁垒,实现不同系统之间的信息共享与协同工作,为未来城市空中交通的大规模商业化运营奠定基础。 人工智能技术的飞速发展,为空域动态管理带来了新的机遇。在这议题下,与会者将深入探讨
    发表于 07-10 10:16

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术
    发表于 07-04 11:10

    中科曙光亮相2025全球人工智能技术大会

    此前,6月7日-8日,2025全球人工智能技术大会(GAITC 2025)在杭州举办。中科曙光携全栈AI基础设施多项核心成果深度参与本次大会,并携手中国人工智能学会成功举办“大模型时代的AI基础设施”专题活动,全方位展示在智能
    的头像 发表于 06-10 16:19 1103次阅读

    智慧路灯如何应用人工智能技术

    叁仟智慧路灯通过整合人工智能(AI)技术,显著提升了城市的智能化程度,为城市管理工作带来了诸多便利。以下将详细阐述叁仟智慧路灯在应用人工智能技术方面的几个关键领域:
    的头像 发表于 03-07 09:18 796次阅读
    智慧路灯如何应用<b class='flag-5'>人工智能技术</b>

    中车慧衍平台入选工信部2024年人工智能赋能新型工业化典型应用案例

    近日,工业和信息化部公布《人工智能赋能新型工业化典型应用案例名单》,中车研究院研发的“中车慧衍工业人工智能开放平台”,在1450项涵盖安防、政务、制造、水利、金融、交通等18个行业的申
    的头像 发表于 01-06 11:39 935次阅读

    人工智能推理及神经处理的未来

    、个性化和效率的社会需求,又进步推动了人工智能技术的集成。此外,不断发展的监管体系,则强调了合乎伦理道德的人工智能、数据隐私和算法透明度的重要性,进而指导人工
    的头像 发表于 12-23 11:18 871次阅读
    <b class='flag-5'>人工智能</b>推理及神经处理的未来

    【「具身智能机器人系统」阅读体验】+初品的体验

    Intelligence,EAI)是个集多学科技术与理论于体的研究领域,旨在探讨智能如何在智能
    发表于 12-20 19:17

    卡诺模型为人工智能领域提供了一种全新的视角

    探索人工智能如何更深层次满足用户需求、提升用户体验的旅程中,卡诺模型(Kano Model)提供了个极具价值的理论框架。这模型不仅为产品开发者带来了深刻的洞察力,同时也为
    的头像 发表于 12-11 10:17 946次阅读

    什么是嵌入式人工智能

    嵌入式人工智能是指将人工智能技术应用于嵌入式系统中的一种技术。嵌入式系统是嵌入到其他设备或系统中的计算机系统,通常用于控制、监测或执行特定任务,如
    的头像 发表于 12-11 09:23 1520次阅读
    什么是嵌入式<b class='flag-5'>人工智能</b>