0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook研究人员利用视觉和音频探索人工智能技术

lhl545545 来源:比特网 作者:Yu 2021-01-12 16:03 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

平面布置图对于可视化空间、规划路线和沟通建筑设计非常有用。例如,一个进入新建筑的机器人可以使用平面图快速感知总体布局。创建平面图通常需要一个完整的布局,这样3D传感器和摄像机就可以捕捉到整个空间。

1月11日消息,据外媒报道,近日,来自Facebook、德克萨斯大学奥斯汀分校和卡内基梅隆大学的研究人员正在探索一种人工智能技术,利用视觉和音频,从一个短视频剪辑中重建一个平面图。

研究人员断言,音频提供了空间和语义信号,补充了图像的映射能力。他们说,这是因为声音天生是由物体的几何形状所驱动的。声音从表面反射回来,揭示了房间的形状,远远超出了相机的视野。从远处听到的声音,甚至是多个房间之外的声音,可以揭示自由空间的存在,声音物体可能存在。此外,从不同方向听到的声音暴露了基于这些声音所代表的活动或事物的布局。例如,淋浴的声音可能暗示着浴室的方向,而微波炉的声音则暗示着厨房的方向。

研究人员的方法被称为AV-Map,旨在将带有多通道音频的短视频转换成2D楼层平面图。机器学习模型利用音频和视觉数据序列来推理楼层平面图的结构和语义,最终使用解码组件融合音频和视频信息。AV-Map生成的平面图大大超出了视频中直接可见的区域,显示了划分为离散语义房间标签(如家庭房间和厨房)的自由空间和被占用区域。

该团队在来自Matternet3D和SoundSpaces数据集的数字环境中试验了两种设置,即主动和被动。在第一个实验中,使用一个虚拟摄像机在模型房屋的房间内移动时发出一种已知的声音。在第二种情况下,只依赖家中物体或人自然发出的声音。

研究人员表示,在未来的工作中,将计划考虑扩展多层平面图,并将绘图想法与机器人连接起来,主动控制摄像头。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    31466

    浏览量

    223695
  • Facebook
    +关注

    关注

    3

    文章

    1432

    浏览量

    59362
  • 人工智能
    +关注

    关注

    1820

    文章

    50342

    浏览量

    266983
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能多模态与视觉大模型开发实战 - 2026必会

    视觉大模型特训:从原理到部署一站式学会 在科技飞速发展的当下,视觉大模型已成为人工智能领域的一颗璀璨明星,广泛应用于安防监控、自动驾驶、医疗影像分析等众多领域,深刻改变着我们的生活与工作方式。如今
    发表于 04-15 16:06

    爱立信与于利希研究中心将合作开发面向6G的先进人工智能技术

    爱立信与于利希研究中心将合作开发面向6G的先进人工智能技术 图为于利希超级计算中心在欧洲最强大的超级计算机JUPITER机柜 *版权: 于利希研究中心 / Sascha Kreklau
    的头像 发表于 04-07 14:45 720次阅读

    融合多场耦合效应:生成式人工智能技术演进及其在航空发动机复杂工程系统中的赋能机制研究

    人工智能技术正经历着从感知智能向生成智能、再向代理智能与物理智能演进的深刻变革。在这一进程中,生成式AI
    的头像 发表于 02-26 10:07 667次阅读
    融合多场耦合效应:生成式<b class='flag-5'>人工智能技术</b>演进及其在航空发动机复杂工程系统中的赋能机制<b class='flag-5'>研究</b>

    成都华微出席人工智能技术创新能力供需对接活动

    近日,成都华微电子科技股份有限公司受邀参加了由成都市科技局主办,四川省人工智能行业协会、四川省人工智能研究院承办的“科创天府·智汇蓉城”成都市人工智能技术创新能力供需对接活动。作为西南
    的头像 发表于 12-10 16:17 694次阅读

    微软与新思科技分享智能人工智能技术的行业影响

    (Agentic AI)技术的行业影响,以及未来跨界合作的前景。此次圆桌讨论不仅展现了双方的战略协同,以及他们在开发市场领先解决方案方面的共同努力,也勾勒出人工智能是如何驱动工程、电信、制药等行业变革的新蓝图。
    的头像 发表于 11-30 09:48 530次阅读

    【艾为视角】保证大方向正确!利用人工智能解决一线实际问题

    改变作业模式人工智能的核心在于应用,研究海量重复性活动的智能化自动化,提升人的效率和辅助人的工作。在人工智能和自动化推动过程中,要关注交付服务流程以及
    的头像 发表于 09-26 19:03 822次阅读
    【艾为视角】保证大方向正确!<b class='flag-5'>利用人工智能</b>解决一线实际问题

    航天宏图人工智能技术深度赋能社会治理现代化

    航天宏图多年来持续重点投入技术研发,尤其专注人工智能深度探索。航天宏图多以自主研发“天权大模型” 是一款基于多模态大模型技术的遥感解译专用AI大模型,它以
    的头像 发表于 09-06 10:35 1339次阅读
    航天宏图<b class='flag-5'>人工智能技术</b>深度赋能社会治理现代化

    利用超微型 Neuton ML 模型解锁 SoC 边缘人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文中,我们将介绍这对开发人员意味着什么,以及使用 Neuton 模型如何改进您的开发和终端
    发表于 08-31 20:54

    中科创达旗下创通联达即将举办RUBIK Pi 3端侧人工智能技术巡演

    人工智能技术加速向端侧渗透,驱动产业智能化转型的战略机遇期,全球领先的智能物联网产品和解决方案提供商Thundercomm(创通联达)将于2025年9月至10月期间,携手Atlantik
    的头像 发表于 08-15 15:56 1409次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 三、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能
    发表于 08-07 14:23

    人工智能技术的现状与未来发展趋势

    人工智能技术的现状与未来发展趋势     近年来,人工智能(AI)技术迅猛发展,深刻影响着各行各业。从计算机视觉到自然语言处理,从自动驾驶到医疗诊断,AI的应用场景不断扩展,推动社会向
    的头像 发表于 07-16 15:01 2318次阅读

    CES Asia 2025同期低空智能感知与空域管理技术论坛即将启幕

    安全、UTM/UAM管理系统发展与互操作性、人工智能在空域动态管理中的应用等前沿议题,将汇聚全球顶尖专家、企业代表,共同探索低空领域的未来发展方向。 低空通信导航监视技术作为低空飞行的关键支撑
    发表于 07-10 10:16

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术
    发表于 07-04 11:10

    中科曙光亮相2025全球人工智能技术大会

    此前,6月7日-8日,2025全球人工智能技术大会(GAITC 2025)在杭州举办。中科曙光携全栈AI基础设施多项核心成果深度参与本次大会,并携手中国人工智能学会成功举办“大模型时代的AI基础设施”专题活动,全方位展示在智能
    的头像 发表于 06-10 16:19 1389次阅读