当涉及到高质量的合成语音开发和定制时,深度学习被证明是一个强大的工具。一家总部位于多伦多的初创公司, NVIDIA Inception 成员类似人工智能正在利用一种新的生成语音工具增加赌注,该工具能够创建高质量的合成人工智能语音。
这项技术可以在 50 多种最流行的语言中生成跨语言和自然说话的声音,通过相似填充,用户可以创建编程音频,编辑和替换音频片段中的单词。
构建、部署和扩展现实人工智能语音的能力将帮助众多行业。应用范围广泛,从为广告创建人工智能生成的文本,到交互式语音应答系统,再到视频游戏开发。
自 2020 年 7 月以来,相似人工智能团队与 NVIDIA 的对话人工智能团队密切合作,将 NVIDIA riva多模态对话人工智能 SDK 集成到他们的语音管道中。据人工智能创始人兼首席执行官佐哈伊布·艾哈迈德( Zohaib Ahmed )称,这种经历让他们在整个人工智能对话管道中融入了独特的 i NSight 。
“ NVIDIA Inception 计划有助于为对话人工智能领域提供关键 i NSight 以及为我们作为产品的每项工作推荐 GPU 计算提供技术支持,” Ahmed 说。
为了训练他们的语音模型和推理能力,该团队正在使用 Amazon 弹性 Kubernetes 服务( Amazon EKS )和 NVIDIA T4 GPU s 集群。然后,他们使用 NVIDIA Triton 推理服务器在生产中大规模部署他们训练有素的人工智能模型。
最近一个与 NVIDIA Omniverse Audio2Face集成的类似人工智能合成语音演示展示了组合技术如何从单一音频源创建富有表情的面部动画和声音。
Ahmed 说:“ Audio2Face 是一个很好的例子,它是一个强大的工具,可以很容易地与生成性人工智能语音相结合,在几秒钟内产生结果,否则需要几天时间。”。
公司 已经发展到拥有超过 150000 个用户,建立了超过 60000 个语音。迄今为止, 类似人工智能在电信、金融、通讯中心、教育、游戏、媒体和娱乐等行业拥有 240 多个付费客户。
关于作者
Michelle Horton 是 NVIDIA 的高级开发人员通信经理,拥有通信经理和科学作家的背景。她在 NVIDIA 为开发者博客撰文,重点介绍了开发者使用 NVIDIA 技术的多种方式。
审核编辑:郭婷
-
NVIDIA
+关注
关注
14文章
5496浏览量
109095 -
人工智能
+关注
关注
1813文章
49740浏览量
261549
发布评论请先 登录
微软与新思科技分享智能体人工智能技术的行业影响
四维图新亮相2025国际前瞻人工智能安全与治理大会
标贝科技参编《人工智能高质量数据集建设指南》
TTS文字合成语音芯片的使用场景
大模型时代,如何推进高质量数据集建设?
挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器
挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!
最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)
明远智睿SSD2351开发板:语音机器人领域的变革力量
人工合成石墨片与天然石墨片的差别
浅析:数字经济时代,高质量数据集对AI产业带来哪些新的变化
大模型时代的新燃料:大规模拟真多风格语音合成数据集
传统工厂如何利用人工智能技术实现运筹优化与效率提升
智慧路灯如何应用人工智能技术
喜报丨阿丘科技荣登苏州市人工智能大模型与高质量数据集双项榜单

采用人工智能技术的高质量合成语音开发和定制
评论