0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用自然语言语音指令创建 XR 体验:Project Mellon 应用测试

NVIDIA英伟达企业解决方案 来源:未知 2023-04-08 00:30 次阅读

Project Mellon 是一个轻量级的 Python 软件包,能够利用强大的语音 AI(NVIDIA Riva)和大型语言模型(LLMs)(NVIDIA NeMo 服务),简化沉浸式环境中的用户交互。NVIDIA 在 GTC 2023 上宣布,Project Mellon 现已支持开发者进行测试。基于此,开发者可开始探索如何创建由自然语言语音指令控制的、解放双手的扩展现实(XR)体验。

正如 J·R·R·托尔金(J.R.R.Tolkien)在《都林之门(Doors of Durin)》中的谜语—“请说,朋友,而后进入”所示,文字可以移山倒海。Project Mellon 背后蕴含着一个基本理念,即以更实用有效的方式来利用语音 AI 和 LLM 之力打开虚拟世界的大门,并在其中完成更多的事情。

在 XR 中,用户界面可能非常复杂且难以使用,会破坏虚拟、混合和增强现实的本质—即沉浸式体验的自然感。Project Mellon 可赋能多类应用程序(无论是 XR 还是平板生态)开发者,轻松地将自然语言理解作为以人为本且可解放双手的新型用户界面,添加至其开发的软件之中。

Project Mellon 平台包含以下组成部分:

  • Project Mellon SDK(软件开发套件)

  • NVIDIA Riva(ASR 、TTS 、NMT)

  • NeMo 服务(其他 LLM 也可获取支持)

Project Mellon 1.0 发布的主要功能包括:

  • 轻量且易于集成的 Python 库

  • 保持自然语言理解准确性的 LLM

  • 无需特定指令进行训练的零样本语言模型

  • 具有对话和视觉上下文的自然语言指令支持

  • 支持询问有关指令和情境的问题,并提供自然语言回答

  • 用于理解和执行指令的简单 Python API

  • 基于 Web 的测试应用程序

  • 可以在本地或远程托管 ASR、TTS、LLM 和神经网络机器翻译(NMT),以实现低延迟响应

ESI 集团解决方案和技术专家 Jan Wurster 在 GTC 主题演讲—“在虚拟现实中与 AI 协作:沉浸式数字助手(会议代码:[S51355])中表示:“我们发现,通过集成对话式 AI 与 NVIDIA Project Mellon,可以降低使用 XR 展开协作的技术门槛,并为 IC.IDO Weave 用户提供更加人性化的体验。通过输入自然语音,我们的虚拟 AI 助手可以帮助团队完成复核任务、查询可用情况或发现相关问题,这些功能无需记住特定指令、仅需输入自然语言就可使用。”

(2023 年 4 月 10 日前登录 GTC 官网,即可观看演讲回放,了解其团队如何在动态、协作的 XR 环境中,在使用对话式 AI 的过程中受益)

Project Mellon 现已可供开发人员使用。观看 Project Mellon 相关演示,了解如何利用自然语音指令,驱动设计审查、更改实时配置、控制机器人以及操纵相机和场景元素。

了解如何启用 Project Mellon 进行开发

人工智能正在改变人类与工作及工具进行交互的方式。开发人员可以通过语音 AI 和 Project Mellon,简化并提升用户体验的人性化水平,且不再需要培训用户操作虚拟现实(VR)中的每一项功能。用户可以在虚拟现实应用程序中,用自己的语言来控制 XR 体验。

点击“阅读原文”,申请试用 Project Mellon。

0f42f7e0-d561-11ed-bfe3-dac502259ad0.png  

扫描海报二维码,即可观看 NVIDIA 创始人兼首席执行官黄仁勋 GTC23 主题演讲重播!

0f48be1e-d561-11ed-bfe3-dac502259ad0.jpg


原文标题:使用自然语言语音指令创建 XR 体验:Project Mellon 应用测试

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3332

    浏览量

    87803

原文标题:使用自然语言语音指令创建 XR 体验:Project Mellon 应用测试

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    微软拟在Win11引入强大AI文件管理功能

    按照微软的愿景,用户与文件管理器的交互将不再受限于传统的鼠标点击操作,而是可通过自然语言语音指令实现更为便捷和高效的查询体验。
    的头像 发表于 03-06 10:48 221次阅读

    离线语音自然说”让风扇更智能

    离线语音自然说”技术是一种先进的语音识别技术,它能够在没有网络连接的情况下识别用户的语音指令,实现对智能风扇的控制。这意味着用户无需连接网络,即可随时随地通过
    的头像 发表于 11-27 10:48 192次阅读
    离线<b class='flag-5'>语音</b>“<b class='flag-5'>自然</b>说”让风扇更智能

    硬件加速自然语言理解解决方案

    电子发烧友网站提供《硬件加速自然语言理解解决方案.pdf》资料免费下载
    发表于 09-13 10:45 0次下载
    硬件加速<b class='flag-5'>自然语言</b>理解解决方案

    自然语言处理和人工智能的区别

      自然语言处理(Natural Language Processing,NLP)是人工智能(AI)中的一个分支,它利用计算机技术对自然语言进行处理,使得电脑能够理解和操作人类语言自然语言
    发表于 08-28 17:32 935次阅读

    自然语言处理和人工智能的概念及发展史 自然语言处理和人工智能的区别

    自然语言处理(Natural Language Processing, NLP)的定义是通过电脑软件程序实现人们日常语言的机器自动处理。为了帮助计算机理解,掌握自然语言处理的基本原理,需要涉及到
    发表于 08-23 18:22 534次阅读

    自然语言处理的概念和应用 自然语言处理属于人工智能吗

      自然语言处理(Natural Language Processing)是一种人工智能技术,它是研究自然语言与计算机之间的交互和通信的一门学科。自然语言处理旨在研究机器如何理解人类语言
    发表于 08-23 17:31 854次阅读

    自然语言处理的优缺点有哪些 自然语言处理包括哪些内容

    自然语言处理(Natural Language Processing)是一种人工智能的技术及领域,它致力于让计算机理解及处理人类语言。它可以帮助计算机对人类语言进行处理、理解和生成,使得计算机可以像人类一样与人们进行交互,如智能
    发表于 08-23 17:26 2608次阅读

    亚马逊云科技结合大语言模型和自然语言问答,加速的数据决策

    任务,包括: 基于Amazon QuickSight Q全新的视觉创作体验功能,在几秒钟内创建数据可视化图表; 使用自然语言微调和格式化图表效果; 无需学习
    的头像 发表于 08-14 19:04 394次阅读
    亚马逊云科技结合大<b class='flag-5'>语言</b>模型和<b class='flag-5'>自然语言</b>问答,加速的数据决策

    自然语言处理包括哪些内容 自然语言处理技术包括哪些

    自然语言处理(Natural Language Processing, NLP)一般包括以下内容: 语音识别(Speech Recognition):将人类语言转换为计算机可以理解的形式。
    的头像 发表于 08-03 16:22 3930次阅读

    智能语音香薰灯:离线语音控制技术的优势与应用

    离线语音控制技术是指在不需要连接互联网的情况下,通过语音指令直接控制设备的技术。这种技术主要运用了语音识别和自然语言处理技术,使设备能够听懂并执行用户的
    的头像 发表于 07-11 15:09 756次阅读
    智能<b class='flag-5'>语音</b>香薰灯:离线<b class='flag-5'>语音</b>控制技术的优势与应用

    言语音数据在方言语音识别中的关键作用

    言语音识别是一项重要的技术,它能够将方言语音转化为文字或指令,从而实现对方言用户的理解和响应。而方言语音数据在方言语音识别中起到了关键作用
    的头像 发表于 06-24 10:06 708次阅读

    PyTorch教程-16.5。自然语言推理:使用注意力

    16.5。自然语言推理:使用注意力¶ Colab [火炬]在 Colab 中打开笔记本 Colab [mxnet] Open the notebook in Colab Colab
    的头像 发表于 06-05 15:44 346次阅读
    PyTorch教程-16.5。<b class='flag-5'>自然语言</b>推理:使用注意力

    PyTorch教程16.4之自然语言推理和数据集

    电子发烧友网站提供《PyTorch教程16.4之自然语言推理和数据集.pdf》资料免费下载
    发表于 06-05 10:57 0次下载
    PyTorch教程16.4之<b class='flag-5'>自然语言</b>推理和数据集

    PyTorch教程16.7之自然语言推理:微调BERT

    电子发烧友网站提供《PyTorch教程16.7之自然语言推理:微调BERT.pdf》资料免费下载
    发表于 06-05 10:52 0次下载
    PyTorch教程16.7之<b class='flag-5'>自然语言</b>推理:微调BERT

    PyTorch教程16.5之自然语言推理:使用注意力

    电子发烧友网站提供《PyTorch教程16.5之自然语言推理:使用注意力.pdf》资料免费下载
    发表于 06-05 10:49 0次下载
    PyTorch教程16.5之<b class='flag-5'>自然语言</b>推理:使用注意力