0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

聚焦语音 AI:在 AR 眼镜上可视化语音和声音

NVIDIA英伟达 来源:未知 2023-07-26 19:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

音频可以包含从人类语言到非语言声音等各种声音,例如狗吠和警笛声。在为听力困难的人设计无障碍应用程序时,该应用程序应能够识别声音并理解语义。

这种技术将有助于聋哑或听力有障碍的人可视化语音,例如人类的对话和非语音声音。通过将语音和声音 AI 相结合,可以将这些可视化效果叠加到 AR 眼镜上,从而使用户能够看到并理解他们无法听到的声音。

根据世界卫生组织的统计,约有 15 亿人(占全球人口近 20%)患有听力损失。到 2050 年,这一数字将上升至 25 亿。

Cochl 是 NVIDIA 的合作伙伴,总部位于圣何塞。该公司是一家利用声音 AI 技术来理解各类音频的科技密集型初创企业。他同时也是 NVIDIA 初创加速计划的会员。通过提供尖端技术和 NVIDIA 专家的支持,该计划帮助初创企业更快地构建解决方案。

该平台可识别 37 种环境声音,并且 CochI 还加入了先进的语音转文本技术,使用户能够真正全方位地了解声音世界。

AR 眼镜可视化任何声音

AR 眼镜作为一个可视化声音的工具,有望极大改善听力损失者的生活。这项技术可以帮助提高他们的交流能力,使他们更容易理解和融入到周围的世界。

Cochl.Sense 和 NVIDIA Riva 在微软 HoloLens 2 上运行!

在此方案中,自动语音识别(ASR)使眼镜能够识别并理解人类的语音。这项技术可通过多种方式集成到眼镜中:

  • 使用麦克风捕捉与聋哑人或听力有障碍者交谈的人的语音,然后使用 ASR 算法解释语音并将其转录为文本,最后将该文本显示在眼镜上,从而使聋哑人或听力有障碍者能够阅读并理解该语音。

  • ASR 还可以使眼镜能够响应语音命令,以便用户可以通过语音控制眼镜。

  • AR 眼镜还能在屏幕上显示所有对话(例如在驾车时转录地图上的语音指示)以及其他声音(例如紧急车辆的喇叭声、警报声以及风声)。

解决方案背后的技术

Cochl 在其软件堆栈中使用了 NVIDIA Riva 来增强其 ASR 功能。Riva 是一个使用 GPU 加速、完全可定制的 SDK,用于开发语音 AI 的应用程序。通过使用 Riva,该平台的功能得以扩展,能够理解包括非语音声音在内的各种声音。

Cochl 联合创始人兼首席执行官 Yoonchang Han 表示:“我们测试了很多语音识别服务,但只有 Riva 提供了极高且稳定的实时性能。所以现在我们可以让我们的声音 AI 系统更加接近人类的听觉感知。”

“正如我们所观察到的,AR 眼镜最有可能在环境嘈杂的开放空间中使用。NVIDIA Riva 帮助我们在嘈杂的环境中也能准确转录语音,并为我们提供了无缝体验,可以集成到我们的 Cochl.Sense 平台上。”

辅助技术的未来

创建一个能像人类一样感知声音的通用 AI 系统是一项巨大的挑战。为了使 AR 眼镜更易于使用,需要更轻便的可穿戴技术。

尽管它们仍然是将声音和语音转化为视觉信息的理想媒介。通过集成机器听觉功能,AR 眼镜能够为世界各地的聋哑或听力障碍者带来更加安全、便捷和愉快的日常生活体验。

Cochl 还在探索语音 AI 的更多用例,例如为 AR 眼镜上的任何视频提供隐藏式字幕和实现多个发言者的转录。为了给听力障碍者带来最佳体验,该公司正在探索分析并可视化音乐的方法,以帮助他们至少能够理解音乐的类型和情感。

该公司期待体验更多的 NVIDIA 解决方案,包括 Riva、NVIDIA NeMo 和 NVIDIA TensorRT。

点击“阅读原文”,或扫描下方海报二维码,在 8 月 8日聆听NVIDIA 创始人兼 CEO 黄仁勋在 SIGGRAPH 现场发表的 NVIDIA 主题演讲,了解 NVIDIA 的新技术,包括屡获殊荣的研究,OpenUSD 开发,以及最新的 AI 内容创作解决方案。


原文标题:聚焦语音 AI:在 AR 眼镜上可视化语音和声音

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    23

    文章

    4040

    浏览量

    97663

原文标题:聚焦语音 AI:在 AR 眼镜上可视化语音和声音

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AR智能眼镜定制_ar眼镜PCBA硬件设计与AI赋能

    随着增强现实(AR)技术的快速发展,AR智能眼镜成为了科技领域的热门方向。设计和开发一款优秀的AR智能眼镜,需要综合考虑硬件选型、功能集成以
    的头像 发表于 11-05 20:27 260次阅读
    <b class='flag-5'>AR</b>智能<b class='flag-5'>眼镜</b>定制_<b class='flag-5'>ar</b><b class='flag-5'>眼镜</b>PCBA硬件设计与<b class='flag-5'>AI</b>赋能

    成都汇阳投资关于芯片+AI 眼镜核心公司

    视觉图像, 实现流畅交互体验。其低功耗特性也至关重要, 可延长 AI 眼镜续航, 保障长时间使用。市场中一些公司同时布局芯片与 AI 眼镜领域。它们能依据
    的头像 发表于 07-01 09:28 810次阅读

    结构可视化:利用数据编辑器剖析数据内在架构​

    结构可视化聚焦于展示数据的内部结构和各部分之间的关系,使企业能够深入理解数据的组织方式和层次体系,从而更好地进行数据管理和分析。通过结构可视化,企业可以清晰地看到数据的层次结构、关联关系以及数据流
    的头像 发表于 05-07 18:42 408次阅读

    VirtualLab Fusion应用:3D系统可视化

    描述和F-Theta透镜的应用示例。 光学系统的3D-可视化 VirtualLab Fusion提供的工具可以实现光学系统的3D可视化,因此可以用于检查元件的位置,以及快速了解系统内部的光传播情况
    发表于 04-30 08:47

    可视化组态物联网平台是什么

    可视化组态物联网平台是物联网技术与组态技术相结合的产物,是通过提供丰富的图形组件和可视化元素,让用户能够以直观、便捷的方式对物联网数据进行监控、分析和管理的平台。以下是其具体介绍: 定义 组态
    的头像 发表于 04-21 10:40 694次阅读

    谷东AR+AI智能眼镜如何改变生活

    这不是科幻电影,而是一副AR+AI眼镜正在发生的“魔法”。今天,我们带大家走进这款即将改变生活的未来科技——谷东AR+AI智能眼镜
    的头像 发表于 04-14 12:50 977次阅读

    智能眼镜AI需求倒逼芯片革命,看高通、ST芯片方案如何适配

    但不限于语音识别与控制、实时翻译、图像识别与增强现实(AR)等。为了支持上述高级功能,智能眼镜对其主控芯片提出了更高的要求。     智能眼镜AI
    的头像 发表于 04-12 00:54 4015次阅读
    智能<b class='flag-5'>眼镜</b><b class='flag-5'>AI</b>需求倒逼芯片革命,看高通、ST芯片方案如何适配

    AI智能眼镜给存储带来的机遇与挑战

    人工智能(AI)逐渐走入人们的日常生活,AI智能眼镜的问世更是引发了行业内外的强烈关注。AI智能眼镜拥有强大的功能和出色的设计,
    的头像 发表于 03-22 10:16 1399次阅读

    VirtualLab Fusion中的可视化设置

    摘要 VirtualLab Fusion中的全局选项对话框可以轻松定制软件的外观和感觉。还可以保存和加载全局选项文件,以便可以轻松地将偏好设置从一个设备转移到另一个设备。本文档说明了与可视化和结果
    发表于 02-25 08:51

    VirtualLab Fusion应用:光波导k域布局可视化(“神奇的圆环”)

    ,光可以TIR(全反射)作用下传播,并与光导表面上不同类型的光栅结构相结合,以耦合光进出。VirtualLab Fusion中,k-Layout可视化工具提供了一种k域中强大的图
    发表于 02-21 08:53

    行业集结:共同定制 RK3566 集成 AI 眼镜的前沿 AR 方案

    服务器)· 视频录制和保存· 实时翻译显示· 蓝牙播放(经典蓝牙 / LE audio/Auracast)· 语音唤醒 / 命令词AI 眼镜图片 (不得转载)关键优势RK3566如何点亮A
    发表于 02-20 18:44

    七款经久不衰的数据可视化工具!

    。通过FineBI,企业能够多维度、多场景下进行灵活的数据分析,提升数据可视化效果,帮助决策者做出更加精准的决策。
    发表于 01-19 15:24

    光学系统的3D可视化

    **摘要 ** 为了从根本上了解光学系统的特性,对其组件进行可视化并显示光的传播情况大有帮助。为此,VirtualLab Fusion 提供了显示光学系统三维可视化的工具。这些工具还可用于检查元件
    发表于 01-06 08:53

    解锁个性语音交互新时代:九芯智能语音云平台,让创意声音触手可及!

    九芯智能语音云平台提供全面高效安全的智能语音服务,支持自定义语音内容,简化烧录流程,依托AI技术,助力各行业智能升级,引领
    的头像 发表于 01-02 16:51 1427次阅读
    解锁个性<b class='flag-5'>化</b><b class='flag-5'>语音</b>交互新时代:九芯智能<b class='flag-5'>语音</b>云平台,让创意<b class='flag-5'>声音</b>触手可及!

    什么是大屏数据可视化?特点有哪些?

    大屏数据可视化是指通过大屏幕展示大量数据和信息,以直观、可视化的方式帮助用户理解和分析数据。这种展示方式通常用于展示复杂的数据集、实时监控系统、企业管理仪表盘等。以下是关于 大屏数据可视化 的详细
    的头像 发表于 12-16 16:59 1001次阅读