0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能公司思必驰语音合成技术表现如何?

思必驰 来源:思必驰 作者:思必驰 2021-06-04 16:06 次阅读

语音合成,是对话式人工智能的最后一环,也是关键一环,它的效果直接影响着人机语音交互的体验。思必驰作为国内领先的对话式人工智能平台公司,它的语音合成技术表现究竟如何?

语音合成的“前世今生”

语音合成(Text to Speech,TTS)又称文本语音转换技术,顾名思义,是把文本信息转化成语音信息。人的语音,本质上是发音器官震动,产生声波传出。

模仿人声,最古老的方法是使用乐器。到 19 世纪,就可以用机械方法产生语音了。那时,科学家们会制作出一些精巧的气囊和风箱去搭建发声系统,合成出一些元音和单音。

进入电子时代的 1939 年,贝尔实验室 H · 杜德利制作出第一台电子合成器,这是用共振峰原理制作的语音合成器,该技术使用固定频率,以电子复制我们改变口型时所发出的元音声,也这正是英国剑桥大学著名物理学家斯蒂芬·霍金教授所使用的声音合成器。

上世纪 90 年代,随着计算和存储能力大幅度提升,基于大语料库的单元挑选与波形拼接合成方法出现,可以合成出高质量的自然人语音。

进入21世纪,随着深度学习技术的兴起和快速发展,以语音合成为代表的语音处理技术得到了极大的飞跃。神经网络语音合成在近几年来取得了显著突破,合成⾳的⾳质和⾃然度越来越⾼,运⾏速度也越来越快。思必驰目前所使用的,也正是这种方法。

思必驰TTS,魅力何在?

早在2007年于英国剑桥大学创立时,思必驰关于语音合成技术研究就已开启,该项工作由思必驰联合创始人兼首席科学家、上海交通大学教授俞凯领头。

语音合成系统主要分为文本处理、声学模型、声码器三个部分。文本处理负责对文本进行转写和phoneme序列转换;声学模型使用深度神经网络,可以在文本特征与声学特征之间学习到更复杂的非线性关系;声码器负责将声学模型输出的声学特征,通过卷积运算,转换成音频

经过10多年的研究积累,思必驰在建模方法上,涵盖了从传统的统计参数模型到最新的基于神经网络的方法;对声码器的研究,涵盖了从传统的基于信号处理的方法到最新的基于神经网络的方法。

语音合成的质量与效果,既有赖于语音厂商算法模型,还取决于音频语料的质量,即数据质量。思必驰有着丰富的声优资源以及声优挑选的经验,在苏州建设有专业录⾳棚并与国内多个城市的录⾳棚有着长久合作关系。与此同时,思必驰数据团队也对数据标注有着严格的质量把控。

经过多年的技术积累,思必驰已逐步形成了⼀套成熟的技术⽅案,业务涵盖了⼤数据语⾳定制、⼩数据快速定制、声⾳克隆、歌声合成、⼩语种合成、⽅⾔合成、情感合成等,可选公有云、私有云以及离线三种部署⽅式,经典⾳⾊可在思必驰官⽹实时体验。

2017年、2020年,思必驰还先后参与国家标准《中文语音合成互联网服务接口规范》与行业标准《中文语音合成服务系统评估规范》的制定,并成为全国首批通过评估测评的公司之一,获得“TTS-4S(Standard Similarity Scene System)服务证书”。该测评从合成质量、定制能力、场景表现力和系统安全可靠等维度,全面评估合成水平和服务能力。

未来世界,百“声”争鸣

为能快速提供语音合成定制服务,思必驰全程提供音色选择、录音指导、音频处理、模型训练、服务部署等专业服务,赋予产品开口讲话的能⼒。

截至目前,思必驰语音合成已建设的⾳⾊库内包含音色接近200个,涵盖多种⾓⾊、多种风格,以及各个年龄层次。

思必驰语音合成服务,也已在车载、⽩电、机器⼈、智能客服等诸多领域成功落地,为众多终端产品赋予声的魅力,使得万物皆可沟通,并逐渐走入人们的工作与生活。

当你在家里“躺平”,来自如影智能的语音管家“Edison”,用他温暖、绅士的声音(文章开头的音频A),为你带来踏实与慰藉;当你在爱车中驰骋,车萝卜的语音助理“萝卜”清脆、简明的声音,如同车水马龙路途中的一股清流;当你接起顺丰95338服务热线的外呼电话,智能客服“丰小蜜”亲切又不失严谨的声音,配合高效的工作能力,带给你最省心省力的服务体验……

镜头切换到泛娱乐领域,思必驰团队打造的“小驰机器人”在央视《机智过人》中,现场用撒贝宁的声音生成了一曲《好久不见》。在《经典咏流传》中,思必驰携手栏目组共同推出 “读诗成曲”线上互动小工具,提供实时读诗成曲的能⼒。用户仅需读几句简单的诗词,便可快速生成有腔有韵的歌声,互动总量超过821万人次。

在个性化定制上,思必驰不仅可以提供普通话定制、歌声定制,还可以通过迁移学习方法,提供更高难度的方言、小语种TTS定制,如粤语、上海语、四川话、⼭东话、东北话、德语、法语等。

而思必驰的情感合成技术,则赋予美妙音色丰沛的情绪,让声音更具表现力与感染力。

此外,思必驰声音复刻技术也已在斑马智能、爱驰汽车、岚图汽车、仙豆智能等车联网客户以及IoT领域落地,仅需录音20句话约400汉字,10分钟之内便可以完成模型生产,MOS 合成音/录音达到90%,相似度合成音/录音达到80%。

人类的声音,是人类语言的物质外壳,却承载着重要的信息和真挚的情感,拥有着无穷的魅力。人工智能突飞猛进地发展正不断催化人机交互方式的巨变,“万物可沟通、万事可打理”的语音互联未来世界,正加速到来……

原文标题:做道听力题,检验下思必驰TTS技术

文章出处:【微信公众号:思必驰】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43824

    浏览量

    230574
  • 思必驰
    +关注

    关注

    4

    文章

    241

    浏览量

    14150

原文标题:做道听力题,检验下思必驰TTS技术

文章出处:【微信号:思必驰,微信公众号:思必驰】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    5G智能物联网课程之Aidlux下人工智能开发

    ://t.elecfans.com/v/25653.html 人工智能 5G AIoT技术实践入门与探索(1) 15分34秒 https://t.elecfans.com/v/27207.html
    发表于 04-01 10:40

    嵌入式人工智能的就业方向有哪些?

    。 国内外科技巨头纷纷争先入局,在微软、谷歌、苹果、脸书等积极布局人工智能的同时,国内的BAT、华为、小米等科技公司也相继切入到嵌入式人工智能的赛道。那么嵌入式AI可就业的方向有哪些呢? 嵌入式AI开发
    发表于 02-26 10:17

    语音合成技术智能驾驶中的创新与应用

    一、引言 随着智能驾驶技术的不断发展,人机交互变得越来越重要。语音合成技术作为人机交互的重要手段,在智能
    的头像 发表于 02-01 18:09 353次阅读

    语音合成技术智能驾驶中的应用与展望

    一、引言 随着科技的飞速发展,语音合成技术逐渐成为人机交互领域的重要分支。在智能驾驶环境中,语音合成
    的头像 发表于 02-01 17:50 238次阅读

    语音数据集在人工智能中的应用与挑战

    一、引言 随着人工智能技术的快速发展,语音数据集在各种应用中发挥着越来越重要的作用。语音数据集是AI语音技术的基石,对于
    的头像 发表于 12-14 15:00 267次阅读

    ai人工智能机器人

    随着时间的推移,人工智能的发展越来越成熟,智能时代也离人们越来越近,近几年人工智能越来越火爆,人工智能的应用已经开始渗透到各行各业,与生活交融,成为人们无法拒绝,无法失去的一个重要存在
    发表于 09-21 11:09

    《通用人工智能:初心与未来》-试读报告

    作者给出的结论。整体读下来,可以给我们关于通用人工智能全面的了解。作者也反复强调了通用人工智能与专用智能的区别。尤其是人们错误的认为一堆专用智能堆砌起来就是通用
    发表于 09-18 10:02

    语音合成技术的应用与挑战

    语音合成技术是一种通过计算机技术生成人类可听的语音技术,它已经广泛应用于各个领域。本文将介绍
    的头像 发表于 09-16 14:46 725次阅读

    让文字会说话,启英泰伦离线语音合成(TTS)技术全面升级!

    “•A01,请用餐•请001号到03号窗口办理业务•本次列车即将到达火车南站,请提前准备下车”语音合成(TTS)技术作为人工智能领域的一项重要技术
    的头像 发表于 09-04 16:27 525次阅读
    让文字会说话,启英泰伦离线<b class='flag-5'>语音</b><b class='flag-5'>合成</b>(TTS)<b class='flag-5'>技术</b>全面升级!

    如何将人工智能应用到效能评估系统软件中去解决

    ,我们可以将其应用到效能评估系统中,进一步提高效能评估的准确性和实用性。   华盛恒辉可以利用人工智能技术,通过对大量数据的分析,来识别和评估各个业务环节的表现,从而对效能进行评估和监测。此外,我们还可
    发表于 08-30 12:58

    安卓有人工智能

    首先,可以说安卓系统本身就含有一些人工智能方面的技术和应用。例如,谷歌语音助手,提供了语音识别和语音合成
    的头像 发表于 08-13 16:44 901次阅读

    啥是人工智能人工智能难吗?

    ,以实现各种功能和任务,例如图像识别、语音识别、自然语言处理、机器翻译、语音合成智能推荐等。 AI的发展历程可追溯到二十世纪中叶,但直至近年来人们才开始真正关注和重视这一领域。当今,
    的头像 发表于 08-12 16:20 599次阅读

    TTS语音合成技术及其应用

    TTS语音合成技术是一种将文本转换为自然语音技术,它利用计算机技术
    的头像 发表于 06-24 02:28 838次阅读

    【书籍评测活动NO.16】 通用人工智能:初心与未来

    已经变得越来越复杂而强大,但计算机科学还远未创造出通用人工智能(General AI)。作者结合人类自然智能的认知机理以及人工智能发展的初心与使命,带我们从不同方面细致分析了当前人工智能技术
    发表于 06-21 14:41

    语音识别技术的概念及应用前景

    力来进行识别和语义处理,一个常见的智能语音处理流程如下图所示。 ​ 启英泰伦是行业内首家将人工智能语音处理技术运用到芯片上的
    发表于 05-27 09:41