0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软在文本到语音合成方面达到了一个新的里程碑

DPVg_AI_era 来源:未知 作者:李倩 2018-09-26 09:09 次阅读

微软在Ignite会议上推出新的神经文本-语音合成(TTS)利器!这项新服务生成的语音在节奏、语调和顿挫感上都几乎和真人一样,具备人类语音一样的自然韵律和词汇清晰度。目前该服务已经发布预览版,开发者可申请尝鲜!

微软在文本到语音合成方面达到了一个新的里程碑,利用深度神经网络,使计算机合成的声音几乎与真人的录音无法区分。合成的声音具备和人类语音一样的自然韵律和明确的词汇清晰度,用户在与AI系统进行交互时,可以显著降低听觉疲劳。

微软技术院士、语音和语言团队负责人黄学东(Xuedong Huang)表示:

语音是推动环境计算开发的新界面,因为语音识别已经改变了我们的日常生活,从数字化助理、电子邮件和文档内容的听写、再到记录演讲和会议内容。由于微软多年来在语音识别方面的研究,以及一直处于最前沿的神经网络技术的跨越式进步,这些方案在今天仍然可行。

随着微软Azure GPU加速的虚拟机规模的不断扩展,如ND v2使用的8路互联NVIDIA Tesla V100 GPU以及基于Skylake的处理器,我们有可能快速提高大规模语音识别模型的训练速度,为Cortana,Skype翻译,Windows和Office提供支持。期待这些服务的发布!“

黄学东

新文本-语音合成服务已经可预览,开发者可尝鲜

黄学东表示,微软的团队本周在佛罗里达州奥兰多举行的Microsoft Ignite会议上展示了这个神经网络驱动的文本到语音合成功能。该功能目前可通过Azure Cognitive Services语音服务进行预览。

该功能可以让聊天机器人和虚拟助理的交互更自然、更具吸引力,比如将电子书等数字化文本转换为有声读物,让车载导航系统的功能更加强大等。

这项文本-语音转换功能是微软在过去两年中取得的一系列突破之一,其他技术突破还包括在会话语音识别和机器翻译中达到与人类大体相当的水平。

神经文本到语音合成(TTS):声音和真人一样

微软此次发布的文本到语音合成技术,利用深度神经网络来克服传统的文本到语音转换系统的局限性,匹配口语中的语音顿挫和语调模式和韵律,并将语音单元合成为计算机语音。

传统的文本到语音系统将韵律分解为单独的语言分析和声学预测,这些步骤分别由独立模型控制。这可能导致合成后的语音结果过于低沉和嘈杂。微软的系统能够同时进行韵律预测和语音合成,合成的声音更加流畅自然。

利用微软Azure的计算能力,该服务可以提供实时流,这对于与聊天机器人或虚拟助手进行交互等场景是非常有用的。

微软将在Azure Kubernetes服务中提供该功能。这可以确保了这一功能具备较高的高可扩展性和可用性,让客户能够从单个端点使用基于神经网络的文本到语音转换和传统的文本到语音转换服务。

目前预览版的服务提供两种预先构建的英语文本-语音转换服务,有男女两种声音(Jessa和Guy)。未来即将推出更多语言,以及49种语言的定制服务,为希望构建针对其特定需求而优化语音的客户提供定制化服务。

文本-语音转换服务的典型应用场景

提高可访问性:文本-语音转换技术使得内容所有者和发布者能够响应人们与其内容交互的不同方式。凭借该技术,视力有障碍或阅读困难的人也能够通过听觉来消费内容。语音输出还能使人们在上下班或锻炼时更容易通过移动设备上获取文本内容,比如报纸或博客。

多任务场景下的反应:文本-语音转换技术让人们能够在驾驶时、或不便阅读的环境中快速舒适地吸收重要信息。该领域的常见应用是导航服务。

增强多模式学习:不同的人有不同的最佳学习方式。在线学习专家发现,同时提供语音和文本有助于让信息更加易于学习。

开发认知机器人和助理:对话能力可能是智能聊天机器人或虚拟助手的重要组成部分。越来越多的公司正在开发聊天机器人,为客户提供引人入胜的服务体验。该技术为聊天机器人和数字化助理的响应方式增加了一个新的维度。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6201

    浏览量

    103058
  • 神经网络
    +关注

    关注

    42

    文章

    4558

    浏览量

    98607

原文标题:微软文本-语音合成转换技术新里程碑!完美再现真人声调

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    语音合成技术在智能驾驶中的创新与应用

    的发展趋势。 二、语音合成技术的创新 语音质量的提升:随着深度学习等技术的不断发展,语音合成技术的语音
    的头像 发表于 02-01 18:09 340次阅读

    科普语音芯片和语音合成芯片的不同之处

     可发声芯片分为语音芯片和语音合成芯片,二者在技术和用途上不同。语音合成芯片能将任意文字实时转换并朗读出来,支持所有中文
    的头像 发表于 10-31 15:42 253次阅读

    TTS技术赋能对讲机,迎来智能语音革新

    随着语音合成技术的快速发展,对讲机的智能语音升级已经到来。作为文本语音的核心技术,TTS(文本
    的头像 发表于 10-20 14:53 266次阅读
    TTS技术赋能对讲机,迎来智能<b class='flag-5'>语音</b>革新

    VisionFive 2成功集成Android开源项目(AOSP)!

    非常高兴地向各位宣布,赛昉VisionFive 2上已成功集成了Android开源项目(AOSP),为用户带来了更多的软件解决方案以及与Android软件生态系统的无缝集成。这一里程碑源于与开源社区
    发表于 10-16 13:11

    语音合成技术的简介与未来发展

    语音合成是一种通过计算机技术生成人类可听的语音的技术。它将文本转换为语音,从而实现语音交互。本文
    的头像 发表于 09-15 18:17 741次阅读

    让文字会说话,启英泰伦离线语音合成(TTS)技术全面升级!

    为生动自然的语音输出,为人们的生活带来了许多便利。启英泰伦离线语音合成技术基于启英泰伦自研智能语音芯片,可以在无网环境下,将文本快速
    的头像 发表于 09-04 16:27 519次阅读
    让文字会说话,启英泰伦离线<b class='flag-5'>语音</b><b class='flag-5'>合成</b>(TTS)技术全面升级!

    贸泽电子荣获Amphenol 2022年度里程碑

    Adrianne Kincade与Kevin Penner,他们在贸泽与Amphenol的双赢合作中做出了杰出贡献,并且在POS方面达成了重要的里程碑。   贸泽电子亚太
    发表于 07-07 16:58 297次阅读

    语音合成技术与语音合成数据,赋予声音新的可能性

    随着科技的不断进步,语音合成技术成为人机交互和智能应用领域的重要创新。在这个领域中,语音合成数据扮演着至关重要的角色,为技术的发展提供了关键的支持和驱动力。
    的头像 发表于 06-28 23:56 326次阅读

    了解独特的文本语音应用

    虚拟助手在用户发出命令后就会作出语音回复。而生成语音回复的技术被称为 文本语音(TTS) 。 TTS 应用能够让辅助器具使用者访问更多内容,因此非常实用。最新的 TTS 技术可以从一
    的头像 发表于 06-28 21:10 268次阅读
    了解独特的<b class='flag-5'>文本</b>转<b class='flag-5'>语音</b>应用

    TTS语音合成技术的挑战和未来发展

    ,TTS语音合成技术的语音质量还需要进一步提高,尤其是对于长文本的处理。此外,由于TTS语音合成
    的头像 发表于 06-24 03:18 619次阅读

    语音合成数据的重要性:打造自然流畅的语音合成体验

    语音合成技术的快速发展为我们带来了更多便利和丰富的语音交互体验。然而,要实现高质量、自然流畅的语音合成
    的头像 发表于 06-24 03:07 335次阅读

    TTS语音合成技术及其应用

    TTS语音合成技术是一种将文本转换为自然语音的技术,它利用计算机技术和人工智能技术来模拟人声的发音和语调。该技术通过将文本转换为音素序列,并
    的头像 发表于 06-24 02:28 828次阅读

    语音合成数据定制服务:为智能化语音应用赋能

    在数字化时代,语音技术的应用越来越广泛,语音合成作为其中的重要组成部分,为智能化语音应用提供了强有力的支持。语音
    的头像 发表于 06-18 21:26 282次阅读

    语音合成数据的重要性:训练高质量语音合成模型的关键

    语音合成是一种将文本转换为语音的技术,它在智能客服、智能助手、语音广告等多个领域有着广泛的应用。而要实现高质量的
    的头像 发表于 05-15 09:27 637次阅读

    语音合成技术是如何应用在我们生活中的

    随着科技的不断发展,语音合成技术越来越成为我们生活中不可或缺的一部分。语音合成技术是一种将文本转化为语音
    的头像 发表于 04-24 10:41 1349次阅读