0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

【解读】VTX316 TTS语音合成芯片几个很实用的应用技巧

智能语音 来源:智能语音 作者:智能语音 2024-05-13 16:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

前言
VTX316是北京宇音天下科技有限公司最新推出的一款更具性价比的中文TTS语音合成芯片,采用QFN32(4*4mm)封装,体积更加精巧,文本合成一次高达500字节数据(250个汉字),支持8种发音风格,支持低功耗模式(2uA)等等……
但大家在开发过程中,往往还会忽略一些比较实用的小技巧,认识这些将给您的开发带来极大的便利,下面给大家细致讲解。

一、芯片回传数据
回传数据是TTS语音合成芯片主动或被动告诉上位机自己当前所处的状态,方便开发者根据这些数据来判断要执行的任务。
但很多开发者对于数据回传理解不是很透彻,造成语音合成芯片不能按照设计执行下一步任务。
1、初始化回传:0x4A
芯片在上电或是复位后,会主动回传带有”0x4A“的数据,只有接收到该数据,表示语音芯片已经初始化完成,可以开始执行任务了。
注意:当MCU没有收到TTS芯片回传的“0x4A”数据时,芯片是不会执行任何指令的!
2、命令接收成功回传:0x41
当上位机给TTS语音芯片发送指令后,会主动回传一个单字节数据“0x41”,代表命令接收成功,开始执行。
3、命令接收失败回传:0x45
如TTS芯片接收到错误命令帧时,会主动回传一个单字节数据“0x45”,这时就需要开发者们查看命令帧是否准确了,或是因其它干扰因素影响,需要重新发送指令。
4、芯片状态回传:0x4E、0x4F
VTX316 TTS语音合成芯片有2种工作状态:空闲状态、忙时状态,可通过软件“芯片忙闲查询命令”,进行查询。
命令帧:0xFD 0x00 0x01 0x21

忙时状态:指芯片正在合成播音中,任务还未结束,此时查询状态会回传一个单字节数据“0x4E”。
注意:芯片在忙时状态下,用户很容易犯这样一个错误
例如:当前TTS芯片正在合成播音,此时MCU向TTS芯片发送一条指令,语音芯片会立即中断当前的合成任务,从而执行刚刚发来的新任务。为避免此类事件的发生,可以在发送指令前先查询一下芯片的状态,如回传“0x4F”(代表芯片处于空闲状态)再发送下一条指令。

空闲状态:也称待机状态,此时查询状态会回传一个单字节的数据“0x4F”。
注意:当合成播音结束时,也会主动回传一个单字节数据“0x4F”,表示合成完毕,进入待机状态了。

另外也可通过硬件查询TTS芯片第6引脚“R/B”的电平来判断语音合成芯片的忙闲状态。
忙时状态:“R/B”为高电平。
空闲状态:“R/B”为低电平。

二、低功耗模式
对于要求极低功耗的应用场景,开发者可选择将TTS语音芯片进入低功耗模式。
1、物理断电
通常情况下开发者会采用上位机通过电源管理芯片控制语音合成芯片的供电脚“VCC”的通断电(即工作完断电,工作前上电)方案。
注意:采用此方案时需注意,芯片VCC管脚断电后,要防止电流倒灌现象;另外,还要注意芯片上电后,待接收到TTS芯片回传的“0x4A”后,再开始执行任务。

2、DeepSleep模式
针对于上位机IO紧张的情况下,开发者也可以采用让芯片进入DeepSleep模式(睡眠模式),该模式下芯片功耗为2uA。
命令帧:FD 00 01 22
注意:TTS芯片进入睡眠模式后,需先将芯片唤醒才能正常工作

唤醒方法有2种:
软唤醒:唤醒命令帧0xFD 0x00 0x01 0xFF,其它指令也可以将语音合成芯片唤醒
硬唤醒:芯片15引脚(WAKEUP)下降沿信号唤醒
注意:芯片在睡眠时,可能因串口抖动,造成误唤醒;同样还要注意芯片上电后,待接收到TTS芯片回传的“0x4A”后,再开始执行任务。

三、配置参数实时存储
VTX316语音合成芯片的合成参数配置是实时存储在芯片内部的(掉电不会丢失),开发者们无需每次开机都重新配置其参数,只需配置一次即可。

四、特殊参数配置
特殊参数配置是应对不同功放芯片时序差异,解决上电和断电时产生的POP杂音和句首丢音的问题。
本语音合成芯片支持修改3个特殊参数:
1、去上电POP音延时参数
遇到上电有POP杂音时,可增加此延时参数去除。
默认值为0,调整范围:0~200,即0~200ms。
注意:数值越小,芯片启动越快。

2、去句首丢音延时参数
遇到句首丢音时,可增加此延时参数解决。
默认值为0,调整范围:0~250,即0~250ms。
注意:数值越小,出音响应越快。

3、去句尾POP音延时参数
遇到句尾有POP杂音时,可通过增加此延时参数去除。
默认值为50,调整范围:0~300,即0~300ms。
注意:值越小,合成播音完毕返回“0x4F”(空闲状态)越快。

五、提示音连播
VTX316TTS语音芯片预置多首提示音效(有些开发者称为铃声),提示音效一般用于在语音播报前,起到前导提示的作用。
而大多的提示音效时长较短,我们可以通过多次播放同一提示音来实现一个较长提示音的效果,例如:“sound901”提示音,音效为蜂鸣器“滴”,时长为50ms。
如果我们想实现先播报3次“滴”,每次间隔100ms,再播报其它内容,可以这样做:
发送文本内容:sound901[p100]sound901[p100]sound901,欢迎使用宇音天下语音合成芯片
注意:[p100]=100ms

希望这些小技巧能帮助广大开发者们更好地理解和应用VTX316 TTS语音合成芯片。如果有任何疑问或需要进一步帮助,请随时告诉我们。

审核编辑 黄宇


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    语音报警器:TTS语音播报,云平台逻辑自控

    TTS语音播报报警器是一种集成了传统报警器和TTS(文本转语音)技术的智能设备。清晰、准确地用人类语言播报报警原因、位置、状态等具体信息。 工作原理 文本
    的头像 发表于 10-29 16:31 453次阅读

    基于开源鸿蒙的语音识别及语音合成应用开发样例

    本期内容由AI Model SIG提供,介绍了在开源鸿蒙中,利用sherpa_onnx开源三方库进行ASR语音识别与TTS语音合成应用开发的流程。
    的头像 发表于 08-25 14:26 3581次阅读
    基于开源鸿蒙的<b class='flag-5'>语音</b>识别及<b class='flag-5'>语音</b><b class='flag-5'>合成</b>应用开发样例

    TTS文字合成语音芯片的使用场景

    TTS文字合成语音播报芯片的使用场景非常广泛,可以适用于各行各业,主要应用于复杂的语音播报场景,下面小编带大家一起来了解一下。 传统的语音
    的头像 发表于 08-22 17:11 825次阅读

    开源TTS应用:打破技术垄断,让语音合成成为每个人的创造力工具

    传统语音合成技术往往被巨头垄断,成本高且定制难。开源TTS应用的诞生,彻底改变游戏规则。其开放源代码让中小企业、个人开发者乃至普通用户都能低成本接入并改造语音技术,将
    的头像 发表于 08-15 14:03 418次阅读
    开源<b class='flag-5'>TTS</b>应用:打破技术垄断,让<b class='flag-5'>语音</b><b class='flag-5'>合成</b>成为每个人的创造力工具

    一颗TTS语音芯给产品增加智能语音播报能力

    一颗TTS语音芯片给产品增加智能语音播报能力 传统语音播报芯片可以设置一些固定的
    的头像 发表于 08-14 16:33 458次阅读

    从开发工程师视角看TTS语音合成芯片

    从开发工程师视角看TTS语音合成芯片语音交互领域,TTS
    的头像 发表于 08-13 14:52 642次阅读

    Air8000 TTS开源,语音合成从此“零距离”!

    技术不应有围墙,创新需要共生长。Air8000宣布TTS应用源代码全面开放,开发者可自由定制语音风格、优化合成效果,让文字与声音的对话,不再受限于黑箱算法。 TTS (Text-to-
    的头像 发表于 07-03 16:33 448次阅读
    Air8000 <b class='flag-5'>TTS</b>开源,<b class='flag-5'>语音</b><b class='flag-5'>合成</b>从此“零距离”!

    智能收银语音交互新标杆—WT3000T8语音合成芯片TTS技术应用解析

    一、行业应用背景在零售业态智能化转型的浪潮中,收银设备正经历从功能型向服务型转变的关键阶段。WT3000T8语音合成芯片应运而生,专为满足新零售场景下智能收银终端的语音交互需求而设计。
    的头像 发表于 04-24 08:45 619次阅读
    智能收银<b class='flag-5'>语音</b>交互新标杆—WT3000T8<b class='flag-5'>语音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b><b class='flag-5'>TTS</b>技术应用解析

    芯资讯|WT3000T8语音合成芯片TTS在智能收款机中的创新应用设计方案介绍

    体验的关键模块。厂家广州唯创电子推出的WT3000T8作为新一代高性能语音合成芯片,凭借其优异的处理能力和灵活的功能配置,正在为收款机智能化升级提供核心技术支持。
    的头像 发表于 04-15 08:55 627次阅读
    芯资讯|WT3000T8<b class='flag-5'>语音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b><b class='flag-5'>TTS</b>在智能收款机中的创新应用设计方案介绍

    【CW32模块使用】语音合成播报模块

    SYN6288E 中文语音合成芯片是北京宇音天下科技有限公司在 2010 年初推出的一款性/价比更高的 SYN6288 芯片的基础上更改封装方式的,效果更自然的一款中高端
    的头像 发表于 03-29 17:25 986次阅读
    【CW32模块使用】<b class='flag-5'>语音</b><b class='flag-5'>合成</b>播报模块

    WT3000T8-32N语音合成TTS芯片:小体积、强性能,重塑智能语音交互体验

    在万物互联的智能化浪潮中,语音交互已成为人机交互的核心入口。广州唯创电子推出的WT3000T8-32N语音合成芯片,凭借其4×4mm超小封装、240MHz超强算力与多场景
    的头像 发表于 03-21 09:20 802次阅读
    WT3000T8-32N<b class='flag-5'>语音</b><b class='flag-5'>合成</b><b class='flag-5'>TTS</b><b class='flag-5'>芯片</b>:小体积、强性能,重塑智能<b class='flag-5'>语音</b>交互体验

    在线VS离线TTS语音合成芯片)有哪些优势-AIOT智能语音产品方案

    离线 TTS 存在语音质量欠佳、音色选择有限、语言支持单一更新困难、占用资源多、适应性差、难以个性化定制等痛点 01更新维护困难 由于是离线模式,难以及时获取最新的语音数据和算法更新
    的头像 发表于 02-25 17:08 680次阅读
    在线VS离线<b class='flag-5'>TTS</b>(<b class='flag-5'>语音</b><b class='flag-5'>合成</b><b class='flag-5'>芯片</b>)有哪些优势-AIOT智能<b class='flag-5'>语音</b>产品方案

    TTS语音播报控制器能做什么?

    TTS(Text-to-Speech)语音播报控制器,作为一种能够将文本信息转换为语音输出的技术设备,在现代社会的各个领域中展现出了广泛的应用前景。TTS技术的出现,丰富人机交互的方式
    的头像 发表于 02-20 18:18 1101次阅读

    TTS语音播报模块简介

    在现代科技日新月异的时代,语音技术作为人工智能领域的重要分支,正以前所未有的速度改变着我们的生活方式。其中,TTS(Text To Speech,文本转语音)语音播报模块作为连接数字世
    的头像 发表于 02-18 16:16 1881次阅读

    云打印机基于唯创知音语音播报+TTS语音合成)+离在线识别技术的五大语音方案

    AUTUMN前言当下打印机使用越来越广泛,品种也日益增多,从企业到商家到用户,不同的客户群体都有不同的需求。就拿语音播报来说,早先的打印机只做简单的文本打印功能,不带语音播报提示,后来逐步加上语音
    的头像 发表于 12-31 17:34 1385次阅读
    云打印机基于唯创知音<b class='flag-5'>语音</b>播报+<b class='flag-5'>TTS</b>(<b class='flag-5'>语音</b><b class='flag-5'>合成</b>)+离在线识别技术的五大<b class='flag-5'>语音</b>方案