0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

「揭秘」Speech AI 技术发展与前沿应用

NVIDIA英伟达企业解决方案 来源:未知 2022-11-10 11:00 次阅读

Speech AI 线上技术研讨会

精彩议程抢先看



自二十世纪下半叶第一个基于计算机的语音合成系统诞生,至以隐马尔可夫模型为代表的统计机器学习合成语音占据主流,再到近十年来基于神经网络的语音合成快速发展,计算机语音合成技术如今已能媲美真人发声,并走向大规模的商业化落地阶段。


Gartner 技术成熟度曲线表明,语音识别和语音合成技术如今已经达到稳步爬升恢复期和生产成熟期。国内的智能语音市场也形成了比较成熟的格局,智能语音科技企业和互联网企业成为主导。因此,要实现差异化竞争,企业也在纷纷思考如何从单一的智能语音技术提供商转型为提供全方位的人工智能技术和应用的服务商。此外,尽管技术已经趋近成熟,门槛大大降低,开发和运行可落地的语音人工智能服务仍然是一项复杂而艰巨的任务,通常需要面临实时性、可理解性、自然性、低资源、鲁棒性等挑战。


在智能语音市场的竞争格局中,一大空缺是算法、通用类芯片和云端 AI 芯片。借助以 GPU 为代表的通用类芯片上的技术优势,NVIDIA 进军了智能语音领域。基于自动语音识别( ASR )和语音合成( TTS ),NVIDIA Riva 简化了开发语音 AI 服务的端到端流程,并为语音交互提供实时性能。此外,包括 NVIDIA TensorRTTriton 推理服务器在内的诸多 NVIDIA 技术也帮助各种 Speech AI 工作负载进行大幅的降本增效。不论是 AI 呼叫中心、虚拟主力语音接口,还是视频会议中的实时字幕等应用,NVIDIA GPU 及 NVIDIA 加速技术都在帮助用户进一步为技术落地降低门槛,为自动驾驶、医疗等场景的智能语音应用创新赋能。


2022 年 10 月 25 日和 27 日,NVIDIA 在 DataFun 直播间,举办 Speech AI 线上技术研讨会,由资深专家介绍 NVIDIA NeMo / RIVA 构建语音应用的工作流GPU 加速和部署 Speech AI 任务全流程的最佳实践,更荣幸邀请到了 WeNet 开源社区发起人为我们分享 WeNet 社区的最新技术进展


议题介绍


NVIDIA NeMo 工具介绍,以及如何利用 NeMo 进行语音相关任务的训练


NeMo 是 NVIDIA 推出的一款主打GPU 训练的工具,可以支持常见的 Speech AI 相关的任务,例如ASR、NLP、TTS、Speaker Recognition 等。将以中文语音识别为例,介绍如何利用 NeMo 快速地完成该任务的训练。同时也会介绍 NeMo 中目前已有的一些功能,例如 VAD、说话人日志等。


通过本次演讲您将收获以下内容:


  • 如果利用 NeMo 训练 ASR 模型?


  • NeMo 对中文语音任务的支持有哪些?


  • NeMo 支持其他哪些 Speech processing 的任务?



演讲嘉宾


丁文 NVIDIA 解决方案架构师

毕业于上海交通大学,导师为俞凯教授。毕业后曾就职于头部互联网公司语音交互部门,主要负责流式 ASR 的迭代与优化、粤语 ASR 等。目前就职于 NVIDIA,负责 Riva 中文 ASR 模型迭代,中文 ASR 模型 GPU 部署方案落地与优化等。


使用 NVIDIA Riva 部署企业级 ASR 服务


NVIDIA Riva 提供了最先进的 GPU 优化部署解决方案,用于构建和部署完全可定制的实时语音识别服务,用于诸如呼叫中心代理协助、虚拟助理、数字化身、品牌语音和视频会议转录等应用程序。


本次分享将为大家介绍 NVIDIA Riva 的主要特性,包括高精度的预训练语音模型,高性能推理模型,以及高可扩展的推理服务。


通过本次演讲您将收获以下内容:


  • 如何使用 NVIDIA Riva 在 GPU 上快速部署语音识别服务?


  • Riva 是如何针对 GPU 进行优化加速的?


  • 怎样进行定制化达到更好的语音识别精度?



演讲嘉宾


齐家兴 NVIDIA 解决方案架构师

德国亚琛工业大学博士,目前于英伟达企业解决方案部门担任高级架构师,多年来从事自然语言处理和语音识别等方向研究,助力多家企业基于 GPU 平台实现高效易用的训练和推理平台。他是英伟达 NeMo,Riva 语音识别训练推理平台的中文模型开发者之一。


利用 Triton Inference Server 和 TensorRT 加速语音 AI 在云端的运行效率


演讲将主要介绍云上部署端到端 ASR 服务最佳实践以及云上部署端到端 TTS 服务最佳实践。


通过本次演讲您还将收获以下内容:


  • 了解如何加速语音 AI 模型


  • 了解如何节省语音 AI服务的部署成本



演讲嘉宾


刘川 NVIDIA 资深解决方案架构师

NVIDIA 中文语音解决方案主要负责人,对基于 GPU 的语音识别和语音合成在云上的部署有丰富经验。


WeNet 在 Speech AI 的应用与探索


演讲将主要介绍开源极简史、语音开源简史、WeNet 开源社区以及基于 GPU 的语音识别实践。


通过本次演讲您将收获以下内容:


  • 了解 WeNet 开源社区


  • WeNet 社区中如何支持和使用 GPU



演讲嘉宾


张彬彬 WeNet 开源社区发起人

硕士毕业于西北工业大学音频语音与语音处理研究组。WeNet 开源社区发起人,主导了业界领先的开源端到端语音识别项目 WeNet 和大规模多领域中文语音识别开源数据集 WenetSpeech 的开发。现任地平线语音算法专家,曾先后在微软、出门问问等公司从事语音识别算法和产品研发。



参与方式


精彩连续,点击“阅读原文”扫描下方海报二维码,马上注册预约!



原文标题:「揭秘」Speech AI 技术发展与前沿应用

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3332

    浏览量

    87809

原文标题:「揭秘」Speech AI 技术发展与前沿应用

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    揭秘气候技术发展的关键平台Earth-2的核心—CorrDiff

    在全球变暖背景下,NVIDIA Earth-2 已成为推动气候技术发展的关键平台。针对因气候变化而日益加重的灾难性极端天气影响,该平台能够生成可供执行的洞察。
    的头像 发表于 04-20 09:23 200次阅读

    岩土工程中的振弦采集仪技术发展与前景展望

    岩土工程中的振弦采集仪技术发展与前景展望 河北稳控科技振弦采集仪是一种常用的岩土工程监测仪器,用于测量土壤或岩石的振动特性。随着岩土工程领域的发展技术的进步,振弦采集仪技术也得到了不
    的头像 发表于 03-01 10:57 149次阅读
    岩土工程中的振弦采集仪<b class='flag-5'>技术发展</b>与前景展望

    高通在2024 MWC展示AI领域新突破

    在2024年巴塞罗那世界移动通信大会(2024 MWC)上,高通技术公司展现了其在AI领域的最新成果,从全新的高通®AI Hub到前沿研究突破,再到
    的头像 发表于 02-27 10:57 411次阅读

    MWC2024:高通推出全新AI Hub及前沿多模态大模型

    2024年世界移动通信大会(MWC)上,高通再次展现其技术领导力,通过发布全新的高通AI Hub和展示前沿的多模态大模型技术,推动了5G和AI
    的头像 发表于 02-26 16:59 749次阅读

    AI大模型加速落地! 西部数据助力数据中心智能化升级

    面对AI大模型的发展和普及,西部数据作为全球数据存储解决方案提供商,如何看待这种浪潮到来,生成式AI技术发展对现有基础设施部署工作带来哪些挑战?对存储产品带来了哪些新的
    的头像 发表于 02-18 00:03 4066次阅读
    <b class='flag-5'>AI</b>大模型加速落地! 西部数据助力数据中心智能化升级

    AI加速智能家居分布式语音技术发展

    中的任何地方通过语音命令来控制智能设备,实现更具有体验性的居家生活。   什么是分布式语音技术?   分布式语音技术,也称为DSR(Distributed Speech Recognition),是一种将语音识别任务分布到多个计
    的头像 发表于 02-01 00:16 3442次阅读

    小微间距器件技术发展方向

    “当下,P1间距以内COB产品占比增长迅速,而新技术MiP的入场,势必导致P1以下小间距产品竞争愈加激烈。”东山精密产品经理黄耀辉在谈及小微间距器件技术发展方向时抛出了自己的观点。
    的头像 发表于 12-12 16:25 275次阅读

    情感语音识别:技术发展与跨文化应用

    一、引言 情感语音识别是人工智能领域的前沿研究领域,它通过分析人类语音中的情感信息,实现更加智能化和个性化的人机交互。随着技术的不断发展,情感语音识别正逐渐应用于跨文化领域,为不同文化背景下的用户
    的头像 发表于 11-22 10:54 261次阅读

    Small Cell技术发展的趋势、亮点及挑战

    电子发烧友网站提供《Small Cell技术发展的趋势、亮点及挑战.pdf》资料免费下载
    发表于 11-10 15:05 0次下载
    Small Cell<b class='flag-5'>技术发展</b>的趋势、亮点及挑战

    低功耗WiFi模块的技术发展

    随着物联网的迅速发展,对于低功耗设备和技术的需求日益增加。低功耗WiFi模块应运而生,为连接大量设备提供了更长的电池寿命和更可持续的能源解决方案。本文将深入研究低功耗WiFi模块的技术发展,探讨其在物联网和移动设备领域的关键作用
    的头像 发表于 11-02 16:34 350次阅读

    揭秘 NVIDIA DPU &amp; DOCA》 开讲啦!

    NVIDIA DOCA 软件框架,从 DPU 的技术发展背景,价值定位,到用户案例,DOCA 服务及安装部署等角度全方位揭秘,以帮助企业正确认识 NVIDIA DPU 的价值,同时助力开发人员利用
    的头像 发表于 06-08 20:55 364次阅读
    《<b class='flag-5'>揭秘</b> NVIDIA DPU &amp; DOCA》 开讲啦!

    深度解读工控安全技术发展现状与应用趋势

    本文将分析工控安全技术发展现状,盘点国内外工控安全主流厂商发展态势,分析我国工控安全市场发展现状,展望未来工控安全技术发展与应用趋势。
    发表于 05-25 10:42 2929次阅读
    深度解读工控安全<b class='flag-5'>技术发展</b>现状与应用趋势

    半导体工艺与制造装备技术发展趋势

    摘 要:针对半导体工艺与制造装备的发展趋势进行了综述和展望。首先从支撑电子信息技术发展的角度,分析半导体工艺与制造装备的总体发展趋势,重点介绍集成电路工艺设备、分立器件工艺设备等细分领域的
    发表于 05-23 15:23 1057次阅读
    半导体工艺与制造装备<b class='flag-5'>技术发展</b>趋势

    近红外光谱技术发展及原理

    近红外光谱技术发展 20世纪50年代,近红外光谱技术开始用于分析农副产品产品成分,限于当时的计算机水平不能发挥出来近红外的优势,因此关注度不高。 20世纪60年代,计算机技术发展使得
    的头像 发表于 05-22 07:03 1157次阅读
    近红外光谱<b class='flag-5'>技术发展</b>及原理

    中国开源未来发展峰会“问道 AI 分论坛”即将开幕!

    发展,一个好的 AI 技术产品该如何迭代与运营…… 为了能够与广大开发者一起更好地拥抱 AI 技术
    发表于 05-09 09:49