0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

微软在人工智能TTS语音合成技术上的最新进展

微软科技 来源:微软科技 作者:微软科技 2022-02-08 09:27 次阅读

小编说:在这个技术快速更迭的时代,人工智能的可能性在逐渐拓宽。为了让大家可以更好的理解人工智能在智能语音方面的强大能力,今天小编就来详细为大家介绍微软在人工智能TTS语音合成(Text-to-Speech)技术上的一些最新进展。

不同对话场景

用户期待不同语气的拟人 AI 语音

TTS 语音已被越来越多地用于支持人机对话或机器辅助的日常交流——例如人与人之间对话的同声传译。在这些场景中,人们普遍期待能够实现更自然、更口语化的对话风格。我们不妨从以下三个典型场景中,来理解用户对于对话声音和风格的不同需求。

客服机器人:语气要自然、友好且专业

很多企业正在使用支持语音的聊天机器人或 IVR(互动式语音应答)系统,为客户带来相比传统方式更为高效、体贴的客户服务。例如国际移动通讯网络公司沃达丰就成功地创建了一个拥有自然语音的客服机器人 TOBi。Azure 的人工智能和自然语言处理功能赋予了 TOBi 鲜明的个性,使客户与 TOBi 之间的人机对话变得轻松自然,让客户更乐于与之交流。

设想这样的情景:在客户对 TOBi 报出姓名后,当 TOBi 需要了解客户的地址以便提供进一步服务时,TOBi 并不会生硬地接着发问:「请说出您的地址。」而是会这样表达:「嘿,好名字!接下来我还需要了解一下您住在哪里?」此时此刻,客户一定希望 AI 能够以听起来热情、友好、温暖,且又专业的声音来说出这句话。类似的需求不仅体现在 AI 解答客户疑问时,还适用于 AI 语音向客户打招呼,或表达共情态度时。个人助理:表情符号、重点强调要读懂

随着虚拟助手和虚拟现实技术的兴起,使用 Neural TTS 来支持闲聊和日常对话功能的客户数量正在不断增加。想要让 AI 与人类的对话更加自然,最主要的挑战之一在于如何让 AI 理解包含特殊字符在内的聊天用语——比如「呵呵」、「哈哈」、「哎哟」这类词汇。

这类表情符号,还有重复字母如「soooo good」——然后再以自然的语气提供即时响应。此外,让 AI 能使用不同的信息来表达相应情感,从而表现出对人类感受的共鸣感,也正在成为一种越来越普遍的用户需求。同声传译:翻译前后说话风格、语气要一致

语音互译是又一个对话式 AI 语音可支持的典型场景。Azure Neural TTS 已覆盖 110 多种不同语言,被应用于多种翻译场景中。不过,如何在翻译的同时保持讲话者的原始语气风格,一直都是个挑战。尤其是在较为随意的对话场景中,讲话者往往会使用语气上的细微差别来与听众建立情感联系。在这种情况下,如果 AI 语音可在提供同步翻译的同时,又能捕捉并理解讲话者的风格,就能使不同语言之间的对话依然生动且具有吸引力。

Azure Neural TTS

进化:多国语言皆可栩栩如生户

Sara(英语):更能表现自然情感的聊天机器人语音

Sara 是一个新近推出的美式英语音色,尤其擅长轻松的对话。「她」有着轻松自然的年轻女性声线,能够胜任各种需要聊天机器人的场景。Sara 拥有三种情绪:快乐、悲伤和气愤。她在阅读表情符号时,可以发出笑声、叹息或气愤语气,而且还能发出「太~(拉长语调)好了」这种人类特有的语调。播放下面的语音,亲耳感受一下效果。

下面这段录音,来自 Sara 作为聊天机器人与人类用户之间的自然对话。(此示例来自机器人和人类用户之间的闲聊,对话很随意,可能包含错误。)

除了预设的几种「情绪」,用户还可以通过 SSML 让 Sara 在常规交流、欢快、悲伤和愤怒等几种语气风格之间随意切换。

晓辰和晓颜(中文普通话):专为日常对话及客服场景而优化的全新中文语音

晓辰和晓颜是专为中文用户提供的普通话语音。其中晓辰擅长逼真的自然语气,晓颜与客户服务场景更匹配。晓辰和晓颜最显著的特征,在于能逼真模仿人类在日常场合下的交流。与朗诵、播音这类「严肃」场合不同,人们的日常对话中除了语气随意,韵律多变,而且常常出现词语发音不完整,句子语法不像课本那么严谨,且会出现重复、不完整、或者啰嗦等情况。借助先进的建模技术,晓辰和晓颜的 AI 语音能够学习并活用这些人类表达的「缺陷」,并逼真地还原这些「不完美」,使合成语音听起来更加真实亲切。在下面这段客服场景模拟对话中,晓颜是客服助理,晓辰是客户。您可以从中感受到他们如同真人一般轻松、自然的对话语气。

Nanami(日语):元气满满的东瀛女声

Nanami 是拥有动听女性声线的日语语音。「她」有着三种不同语音风格:聊天风格、客服风格和开朗风格,让合成语音在各种场景中都更具吸引力。

来听一听 Nanami 元气满满的声音:

现在就来感受

Azure Neural TTS 拟人语音的动人表现力吧!

微软不断倾听全球用户对于 Azure Neural TTS 在不同情况下语音发音准确性的反馈,以负责任的 AI 及公平、可靠和安全、隐私和保障、包容、透明、负责的六项人工智能准则为前提,进行了这次更新,为用户带来表达更自然、语义更清晰的语音体验。现在,微软的文本转语音可以支持超过 110 种语言的 270 多种 AI 语音。如果想亲身感受 Azure Neural TTS 的强大,就来 Azure 官网亲自体验吧!还有声音定制平台可以即刻为企业创建多种语言和风格的独特品牌语音。

原文标题:什么!跟我说话的竟然是AI!

文章出处:【微信公众号:微软科技】欢迎添加关注!文转载请注明出处。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6248

    浏览量

    103077
  • AI
    AI
    +关注

    关注

    87

    文章

    26458

    浏览量

    264072
  • 人工智能
    +关注

    关注

    1776

    文章

    43871

    浏览量

    230621

原文标题:什么!跟我说话的竟然是AI!

文章出处:【微信号:mstech2014,微信公众号:微软科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    WT3000T8-TTS语音合成芯片及应用场景介绍

    TTS语音合成芯片是一种能够将文本信息转化为自然语音的专用芯片。它通过内置的语音合成算法和音频处
    的头像 发表于 04-18 18:03 394次阅读

    百度首席技术官王海峰解读文心大模型的关键技术最新进展

    4月16日,以“创造未来”为主题的Create 2024百度AI开发者大会在深圳国际会展中心成功举办。百度首席技术官王海峰以“技术筑基,星河璀璨”为题,发表演讲,解读了智能体、代码、多模型等多项文心大模型的关键
    的头像 发表于 04-18 09:20 236次阅读
    百度首席<b class='flag-5'>技术</b>官王海峰解读文心大模型的关键<b class='flag-5'>技术</b>和<b class='flag-5'>最新进展</b>

    玩转语音合成芯片(TTS芯片),看这一篇就够了

    什么是语音合成芯片:语音合成芯片也称为TTS芯片,即文字转语音芯片,是一种能够将输入的文字信息转
    的头像 发表于 03-19 18:13 247次阅读
    玩转<b class='flag-5'>语音</b><b class='flag-5'>合成</b>芯片(<b class='flag-5'>TTS</b>芯片),看这一篇就够了

    两家企业有关LED项目的最新进展

    近日,乾富半导体与英创力两家企业有关LED项目传来最新进展
    的头像 发表于 01-15 13:37 347次阅读

    语音识别技术最新进展:视听融合的多模态交互成为主要演进方向

    电子发烧友网报道(文/李弯弯)所谓“模态”,英文是modality,用通俗的话说,就是“感官”,多模态即将多种感官融合。多模态交互技术是近年来人工智能领域的一项重要创新。随着语音识别技术
    的头像 发表于 12-28 09:06 1541次阅读
    <b class='flag-5'>语音</b>识别<b class='flag-5'>技术</b><b class='flag-5'>最新进展</b>:视听融合的多模态交互成为主要演进方向

    TTS技术赋能对讲机,迎来智能语音革新

    随着语音合成技术的快速发展,对讲机的智能语音升级已经到来。作为文本转语音的核心
    的头像 发表于 10-20 14:53 277次阅读
    <b class='flag-5'>TTS</b><b class='flag-5'>技术</b>赋能对讲机,迎来<b class='flag-5'>智能</b><b class='flag-5'>语音</b>革新

    VisionFive 2 AOSP最新进展即将发布!

    非常开心地在这里和大家提前预告,我们即将发布VisionFive 2 集成 AOSP的最新进展!请大家多多期待吧~ 此次通过众多社区成员的支持和贡献(https://github.com
    发表于 10-08 09:15

    思必驰TTS技术上线语音编辑功能

    “苏州街站到了,请带好随身物品准备下车。” “巴沟站到了,请带好随身物品准备下车。” ——地铁语音播报编辑站名 随着人工智能技术的发展,智能语音已融入我们日常生活的方方面面。在人机共生
    的头像 发表于 09-10 11:23 1020次阅读

    让文字会说话,启英泰伦离线语音合成TTS技术全面升级!

    “•A01,请用餐•请001号到03号窗口办理业务•本次列车即将到达火车南站,请提前准备下车”语音合成TTS技术作为人工智能领域的一项重
    的头像 发表于 09-04 16:27 529次阅读
    让文字会说话,启英泰伦离线<b class='flag-5'>语音</b><b class='flag-5'>合成</b>(<b class='flag-5'>TTS</b>)<b class='flag-5'>技术</b>全面升级!

    三大MLED项目“动起来” Mini LED项目传来最新进展

    日前,博敏电子与穿越光电等企业有关Mini LED的项目传来最新进展
    的头像 发表于 08-14 14:15 1077次阅读

    常温超导最新进展 韩国室温超导体“LK-99”撤回论文

    常温超导最新进展 韩国室温超导体“LK-99”撤回论文 有业界人士认为超导跟人工智能一样都能被视为第四次工业革命的奇点,近期室温超导概念非常火爆,我们一起看看常温超导最新进展。 上一次室温超导
    的头像 发表于 08-02 17:22 2309次阅读

    ASML***的最新进展

    、与 Mike在SEMICON 上的一些讨论以及 ASML 最近的财报电话会议中的一些内容。以分享了ASML光刻机的最新进展
    的头像 发表于 07-30 10:39 1835次阅读
    ASML***的<b class='flag-5'>最新进展</b>

    【AI简报20230714期】人工智能在日常生活中的应用,国产AI芯片最新进展公布!

    1. 大模型时代,国产AI芯片最新进展!算力集群化是必然趋势 原文: https://mp.weixin.qq.com/s/k-InpBMMJTUltuMcB2hKSg 在刚过去的2023世界人工智能
    的头像 发表于 07-14 20:40 798次阅读
    【AI简报20230714期】<b class='flag-5'>人工智能</b>在日常生活中的应用,国产AI芯片<b class='flag-5'>最新进展</b>公布!

    TTS语音合成技术的挑战和未来发展

    TTS语音合成技术在实现过程中面临着一些挑战和问题。 首先,TTS语音
    的头像 发表于 06-24 03:18 641次阅读

    TTS语音合成技术及其应用

    TTS语音合成技术是一种将文本转换为自然语音技术,它利用计算机
    的头像 发表于 06-24 02:28 844次阅读