语音合成系统和语音合成方法 - 语音合成系统研究

语音合成系统和语音合成方法

　　一种语音合成系统，其包括：分割单元，其被配置成将对应于目标语音的音位串分割为多个节段，来产生第一节段序列;

　　选择单元，其被配置成基于第一节段序列通过组合多个语音单元产生对应于第一节段序列的多个第一语音单元串，并从所述多个第一语音单元串中选择一个语音单元串;和连接单元，其被配置成连接包含在所选择语音单元串中的多个语音单元，以产生合成语音，选择单元包括检索单元，其被配置成反复实施第一处理和第二处理，该第一处理基于对应于第二节段序列的最多W个(W为预定值)第二语音单元串产生对应于第三节段序列的多个第三语音单元串，所述第二节段序列作为第一节段序列中的部分序列，所述第三节段序列作为通过将节段添加给第二节段序列而获得的部分序列，第二处理从所述多个第三语音单元串中选择最多W个第三语音单元串，第一计算单元，其被配置成计算所述多个第三语音单元串中每个的总成本，第二计算单元，其被配置成基于涉及语音单元数据获取速度的限制来为所述多个第三语音单元串中的每个计算对应于总成本的惩罚系数，其中惩罚系数依赖于接近所述限制的程度，和第三计算单元，其被配置成通过使用惩罚系数修正总成本来计算所述多个第三语音单元串中每个的估计值，其中检索单元基于所述多个第三语音单元串中每个的估计值从所述多个第三语音单元串中选择最多W个第三语音单元串。

　　常用语音合成方法的比较

　　“未来的十年是语音技术的时代”。随着语音技术研究的突破，其对计算机发展和社会生活的重要性日益凸现出来。语音合成技术是语音技术中十分实用的一项重要技术，它能解决人民大众的实际需求，能够深入到社会的各行各业中去。

　　语音合成技术经历了一个逐步发展的过程，从参数合成到拼接合成，再到两者的逐步结合，其不断发展的动力是人们认知水平和需求的提高。目前，常用的语音合成方法主要有：共振峰合成、LPC合成、PSOLA拼接合成和LMA声道模型技术。它们各有优缺点，人们在应用过程中往往将多种技术有机地结合在一起，或将一种技术的优点运用到另一种技术上，以克服另一种技术的不足。

　　共振峰合成

　　语音合成的理论基础是语音生成的数学模型。该模型语音生成过程是在激励信号的激励下，声波经谐振腔(声道)，由嘴或鼻辐射声波。因此，声道参数、声道谐振特性一直是研究的重点。习惯上，把声道传输频率响应上的极点称之为共振峰，而语音的共振峰频率(极点频率)的分布特性决定着该语音的音色。

　　音色各异的语音具有不同的共振峰模式，因此，以每个共振峰频率及其带宽作为参数，可以构成共振峰滤波器。再用若干个这种滤波器的组合来模拟声道的传输特性(频率响应)，对激励源发出的信号进行调制，再经过辐射模型就可以得到合成语音。这就是共振峰合成技术的基本原理。基于共振峰的理论有以下三种实用模型。

　　1)级联型共振峰模型

　　在该模型中，声道被认为是一组串联的二阶谐振器。该模型主要用于绝大部分元音的合成。

　　2)并联型共振峰模型

　　许多研究者认为，对于鼻化元音等非一般元音以及大部分辅音，上述级联型模型不能很好地加以描述和模拟，因此，构筑和产生了并联型共振峰模型。

　　3)混合型共振峰模型

　　在级联型共振峰合成模型中，共振峰滤波器首尾相接;而在并联型模型中，输入信号先分别通过幅度调节再加到每一个共振峰滤波器上，然后将各路的输出叠加起来。将两者比较，对于合成声源位于声道末端的语音(大多数的元音)，级联型合乎语音产生的声学理论，并且无需为每一个滤波器分设幅度调节;而对于合成声源位于声道中间的语音(大多数清擦音和塞音)，并联型则比较合适，但是其幅度调节很复杂。基于此种考虑，人们将两者结合在一起，提出了混和型共振峰模型。

　　共振峰模型是基于对声道的一种比较准确的模拟，因而可以合成出自然度比较高的语音，另外由于共振峰参数有着明确的物理意义，直接对应于声道参数，因此，可以容易利用共振峰描述自然语流中的各种现象，并且总结声学规则，最终用于共振峰合成系统。

　　但是，人们同时也发现该技术有明显的弱点。首先由于它是建立在对声道的模拟上，因此，对于声道模型的不精确势必会影响其合成质量。另外，实际工作表明，共振峰模型虽然描述了语音中最基本最主要的部分，但并不能表征影响语音自然度的其他许多细微的语音成分，从而影响了合成语音的自然度。另外，共振峰合成器控制十分复杂，对于一个好的合成器来说，其控制参数往往达到几十个，实现起来十分困难。

　　基于这些原因，研究者继续寻求和发现其他新的合成技术。人们从波形的直接录制和播放得到启发，提出了基于波形拼接的合成技术，LPC合成技术和PSOLA合成技术是其中的代表。与共振峰合成技术不同，波形拼接合成是基于对录制的合成基元的波形进行拼接，而不是基于对发声过程的模拟。

　　LPC参数合成

　　波形拼接技术的发展与语音的编、解码技术的发展密不可分，其中LPC技术(线性预测编码技术)的发展对波形拼接技术产生了巨大的影响。LPC合成技术本质上是一种时间波形的编码技术，目的是为了降低时间域信号的传输速率。

　　LPC合成技术的优点是简单直观。其合成过程实质上只是一种简单的解码和拼接过程。另外，由于波形拼接技术的合成基元是语音的波形数据，保存了语音的全部信息，因而对于单个合成基元来说能够获得很高的自然度。

　　但是，由于自然语流中的语音和孤立状况下的语音有着极大的区别，如果只是简单地把各个孤立的语音生硬地拼接在一起，其整个语流的质量势必是不太理想的。而LPC技术从本质上来说只是一种录音+重放，对于合成整个连续语流LPC合成技术的效果是不理想的。因此，LPC合成技术必须和其他技术相结合，才能明显改善LPC合成的质量。

阅读全文

本文导航

第 1 页：语音合成系统研究
第 2 页：语音合成系统和语音合成方法
第 3 页：PSOLA合成技术

语音合成(15920) 语音合成(15920)
语音合成系统(6326) 语音合成系统(6326)

基于RFID的车辆自动化智能管理系统研究

电子发烧友网站提供《基于RFID的车辆自动化智能管理系统研究.pdf》资料免费下载

2023-10-24 10:52:12

基于Android平台的智能云导游系统研究

电子发烧友网站提供《基于Android平台的智能云导游系统研究.pdf》资料免费下载

2023-10-24 09:20:43

基于嵌入式的车辆偏离预警系统研究

电子发烧友网站提供《基于嵌入式的车辆偏离预警系统研究.pdf》资料免费下载

2023-10-20 09:36:32

基于群智感知的智慧城市交通系统研究

电子发烧友网站提供《基于群智感知的智慧城市交通系统研究.pdf》资料免费下载

2023-10-19 11:47:06

基于嵌入式的车辆偏离预警系统研究

电子发烧友网站提供《基于嵌入式的车辆偏离预警系统研究.pdf》资料免费下载

2023-10-18 10:38:33

基于ARM的WEB远程监控系统研究与应用

电子发烧友网站提供《基于ARM的WEB远程监控系统研究与应用.pdf》资料免费下载

2023-10-18 10:31:09

基于DSG的传输网综合管理系统研究与实现

电子发烧友网站提供《基于DSG的传输网综合管理系统研究与实现.pdf》资料免费下载

2023-10-08 14:27:36

语音合成技术的应用与挑战

语音合成技术是一种通过计算机技术生成人类可听的语音的技术，它已经广泛应用于各个领域。本文将介绍语音合成技术的应用以及所面临的挑战。一、语音合成技术的应用语音合成技术已经广泛应用于各个领域，如智能

2023-09-16 14:46:51

123

语音合成技术的简介与未来发展

语音合成是一种通过计算机技术生成人类可听的语音的技术。它将文本转换为语音，从而实现语音交互。本文将介绍语音合成技术的概念、现状以及未来的发展趋势。一、语音合成技术的概念和分类语音合成是通过

2023-09-15 18:17:44

164

AI语音处理-文字合成语音功能

这篇文章就介绍华为云提供的语音合成服务使用方法，利用提供的API接口完成语音合成功能，将合成的语音下载下来。

2023-07-08 09:50:35

1159

语音合成技术与语音合成数据，赋予声音新的可能性

随着科技的不断进步，语音合成技术成为人机交互和智能应用领域的重要创新。在这个领域中，语音合成数据扮演着至关重要的角色，为技术的发展提供了关键的支持和驱动力。语音合成技术的目标是将文本转化为自然流畅

2023-06-28 23:56:51

124

TTS语音合成技术的挑战和未来发展

，TTS语音合成技术的语音质量还需要进一步提高，尤其是对于长文本的处理。此外，由于TTS语音合成技术涉及到个人隐私等方面的问题，如何保护个人隐私也是TTS语音合成技术需要考虑的问题之一。为了应对这些挑战和问题，研究人员正在积极探索新的

2023-06-24 03:18:54

277

语音合成数据的重要性：打造自然流畅的语音合成体验

语音合成技术的快速发展为我们带来了更多便利和丰富的语音交互体验。然而，要实现高质量、自然流畅的语音合成，语音合成数据的重要性不可忽视。本文将探讨语音合成数据的重要性，并阐述它如何为语音合成技术的发展

2023-06-24 03:07:27

175

TTS语音合成技术及其应用

TTS语音合成技术是一种将文本转换为自然语音的技术，它利用计算机技术和人工智能技术来模拟人声的发音和语调。该技术通过将文本转换为音素序列，并使用声学模型对每个音素进行参数化，最终生成自然语音

2023-06-24 02:28:12

330

语音合成数据的重要性：训练高质量语音合成模型的关键

语音合成是一种将文本转换为语音的技术，它在智能客服、智能助手、语音广告等多个领域有着广泛的应用。而要实现高质量的语音合成，就需要大量的语音合成数据。

2023-05-15 09:27:55

383

乐鑫语音助手框架ESP-Skainet的中文语音合成例程

今天，我们来研究乐鑫的语音助手框架ESP-Skainet其中的中文语音合成的例程。

2022-05-31 09:48:12

1434

15205

达芬奇技术的视频采集系统研究

达芬奇技术的视频采集系统研究

2017-10-26 11:20:18

多DSP的高速通用并行处理系统研究与设计

多DSP的高速通用并行处理系统研究与设计

2017-10-23 15:19:06

基于DSP技术的图像采集系统研究设计

基于DSP技术的图像采集系统研究设计

2017-10-23 14:11:53

基于达芬奇技术的视频采集系统研究

基于达芬奇技术的视频采集系统研究

2017-10-21 09:50:36

SLA蓄电池的模糊控制充电系统研究

SLA蓄电池的模糊控制充电系统研究

2017-09-26 09:09:37

基于Cortex和_COS的SD卡文件系统研究

基于Cortex和_COS的SD卡文件系统研究

2017-09-25 12:57:56

基于ARM的RFID公交自动报站系统研究

基于ARM的RFID公交自动报站系统研究

2017-09-25 09:04:19

大功率光伏逆变系统研究

大功率光伏逆变系统研究

2017-09-14 09:57:36

基于直流供电技术的电压暂降保护系统研究

基于直流供电技术的电压暂降保护系统研究

2017-09-08 15:50:29

基于SVPWM的变频系统研究

基于SVPWM的变频系统研究

2017-06-30 09:51:42

储能电池管理系统研究

储能电池管理系统研究.pdf

2017-06-14 16:56:17

基于ZIGBEE技术的无线定位系统研究

电子发烧友网站提供《基于ZIGBEE技术的无线定位系统研究.pdf》资料免费下载

2017-04-27 09:10:00

基于CDMA技术的FBG传感系统研究_陈韩彬

基于CDMA技术的FBG传感系统研究_陈韩彬

2017-03-19 19:07:17

基于Internet的水仓SCADA系统研究_周志光

2017-03-18 09:49:28

基于RIASOA的企业级应用系统研究崔楠

基于RIA_SOA的企业级应用系统研究_崔楠

2017-03-17 08:00:00

基于语音特征聚类的HMM语音识别系统研究姚敏锋

基于语音特征聚类的HMM语音识别系统研究_姚敏锋

2017-03-15 08:00:00

基于物联网的智能停车系统研究设计_王中生

基于物联网的智能停车系统研究设计_王中生

2017-02-27 19:07:37

基于DAI的FMS智能检测监控系统研究_孙宇

基于DAI的FMS智能检测监控系统研究_孙宇

2017-02-07 16:52:22

MTPA控制的直接转矩控制系统研究

MTPA控制的直接转矩控制系统研究

2017-01-21 11:54:39

基于CAN总线的EPS通信系统研究

基于CAN总线的EPS通信系统研究

2017-01-14 11:27:12

基于RFID的不停车收费系统研究

基于RFID的不停车收费系统研究

2017-01-12 22:16:11

相控阵快速校准系统研究

相控阵快速校准系统研究_黄蕾

2017-01-03 18:00:37

地铁隧道风力发电系统研究_孙振刚

地铁隧道风力发电系统研究_孙振刚

2016-12-30 14:38:20

非分散红外CO气体检测系统研究

非分散红外CO气体检测系统研究，下来看看。

2016-12-17 11:16:51

基于SocketCan的机器人焊接控制系统研究

基于SocketCan的机器人焊接控制系统研究_李鹏

2016-12-17 11:11:23

超宽带引信系统研究

超宽带引信系统研究，又需要的下来看看。

2016-12-14 16:57:07

基于FPGA的图像调焦系统研究

基于FPGA的图像调焦系统研究，下来看看

2016-08-29 23:23:04

高帧频CMOS相机图像采集系统研究

高帧频CMOS相机图像采集系统研究下来看看

2016-08-29 15:02:03

USB 协议及其系统研究论文

电子论文USB 协议及其系统研究论文（学位论文）

2016-08-25 15:52:39

基于DSP的SVPWM交流调速系统研究与设计

基于DSP的SVPWM交流调速系统研究与设计

2016-06-17 16:48:12

DSC控制的SVPWM单相逆变系统研究

DSC控制的SVPWM单相逆变系统研究。

2016-05-06 15:13:28

基于DSP的直流无刷电机控制系统研究

基于DSP的直流无刷电机控制系统研究，下来看看

2016-05-05 11:37:39

电动转向器控制系统研究

电动转向器控制系统研究，有兴趣的同学可以下载学习

2016-04-26 17:53:46

单片机的步进电机控制系统研究

单片机的步进电机控制系统研究，下来看看，

2016-04-25 10:10:07

基于SVPWM的模糊滑模DTC系统研究

基于SVPWM的模糊滑模DTC系统研究。

2016-04-18 10:28:46

基于SVPWM的变频系统研究

基于SVPWM的变频系统研究，下来看看。

2016-04-18 10:13:45

基于SVPWM的PMSM矢量控制伺服系统研究

基于SVPWM的PMSM矢量控制伺服系统研究。

2016-04-18 10:02:17

基于dsPIC的SVPWM交流变频调速系统研究

基于dsPIC的SVPWM交流变频调速系统研究

2016-04-15 18:29:16

基于DSP的SVPWM异步电机控制系统研究

基于DSP的SVPWM异步电机控制系统研究

2016-04-15 18:29:16

电压源型SVPWM变频调速系统研究

电压源型SVPWM变频调速系统研究，下来看看

2016-04-15 17:49:14

AVR实现的SVPWM变频调速系统研究

AVR实现的SVPWM变频调速系统研究。

2016-04-13 16:12:11

DSC控制的SVPWM单相逆变系统研究

DSC控制的SVPWM单相逆变系统研究。

2016-04-13 16:12:11

关磁阻电机模糊PID控制系统研究

关磁阻电机模糊PID控制系统研究，下来看看。

2016-04-01 15:56:08

自动焊接模糊控制系统研究

自动焊接模糊控制系统研究-2005，下来看看。

2016-04-01 15:02:19

基于Android校园即时信息系统研究

基于Android校园即时信息系统研究..

2016-01-04 15:31:55

基于数字信号处理器的中文语音合成系统设计

本文介绍的就是一种基于DSP的中文语音合成系统的实现方法。随着语音信号处理技术的不断发展与成熟，语音合成正逐步成为信息技术中人机接口的关键技术。

2015-12-28 09:32:05

1607

1134

已全部加载完成

搜索历史

语音合成系统和语音合成方法 - 语音合成系统研究

本文导航

评论