0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云打印机基于唯创知音语音播报+TTS(语音合成)+离在线识别技术的五大语音方案

WT-深圳唯创知音电子有限公司 2024-12-31 17:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AUTUMN前言

当下打印机使用越来越广泛,品种也日益增多,从企业到商家到用户,不同的客户群体都有不同的需求。就拿语音播报来说,早先的打印机只做简单的文本打印功能,不带语音播报提示,后来逐步加上语音提示,如开机音效:欢迎使用xx品牌、提示语打印机缺纸等,及随着网络的发展,加入4G或WIFI的功能,通过TTS技术,进行实时文本播报。

本文则对打印机引入在线TTS+AI对话方案及唯创其他语音方案做了综合介绍。

AUTUMN方案介绍

以下将介绍唯创语音IC在打印机行业的方案运用:

01方案一

普通语音播报系列打印机,WTN6/WT588F02B型号,语音提前放到芯片内置空间,指令控制播报提示。应用框图如下:

5d66a90c-c75a-11ef-9434-92fbcf53809c.png

方案优势:

性价比高,应用简单;可擦写版本,提供配套工具方便更新语音,快速调试

原理及技术特点:

唯创标准一线/二线控制协议,支持音量、播放、停止、循环模式指令设置

02方案二

普通语音播报系列打印机,WT2003H系列,支持挂载TF卡或者U盘播放,除提示音外,可存放更多音乐文件,支持MP3/WAV格式,支持USB连接电脑更换音频。应用框图如下:

5d760776-c75a-11ef-9434-92fbcf53809c.png

方案优势:

MP3音质效果,支持8-44.1KHz/8-320kbps音频码率播放,支持USB接口快速更换音频

原理及技术特点:

唯创标准UART串口控制协议,支持挂载SPI Flash、TF卡、U盘播放,支持音量、播放暂停、循环模式、插播等指令设置

03方案三

支持语音更新系列打印机,WT3000A,BLE透传更新本地音频及自定义音效,无需接线,配合手机app或微信小程序,无线更新音频到WT3000A外置存储中。APP SDK可打包外发,嵌入到用户APP中或开发微信小程序应用。应用框图如下:

5d88cce4-c75a-11ef-9434-92fbcf53809c.png

方案优势:

· 解决多语种需求,设备本地无需预存多国音频,减少了本地储存成本,解决本地音频更换难,文本合成音频繁等问题

· 支持语种:全球 16 个语种,包括中文、英文、中英混合、法语、泰语、意大利语、韩语、日语、印尼语、德语、西班牙语、俄语、越南语、马来语、菲律宾语;同时还支持 6 个国内方言,即粤语、东北话、天津话、台湾话、四川话、湖南话

原理及技术特点:

· 音频格式:MP3,8-44KHz,8-320Kbps,上传后APP端都会压缩16KHz/18Kbps单声道MP3音频下发到本地;

· 传输速率:10KByte/秒左右;

· TTS合成:支持16 国语种 6 种国内方言,可配置选择,支持文本+背景音乐合成;支持语速、语调、音量等参数调节;

· APP录音:限制时长1分钟,录完点击设备写入,自动下发;

· 本地音频上传:数量无限制,取决于外置SPI Flash容量,最大可外挂128Mbit;

· APP开发:SDK可打包外发,可定制开发;

· 微信小程序开发:支持定制;

· 工具包:说明书、硬件资料、操作视频、测试工具。

04方案四

支持离线文本合成播报打印机,针对带WIFI类打印机,打印时可根据打印状态,实时提示播报,语音内容无需再固化内置,WT3000T离线TTS系列配合客户MCU即可实现该功能。应用框图如下:

5d98b80c-c75a-11ef-9434-92fbcf53809c.png

05方案五

支持离在线文本合成播报打印机,针对带WIFI类打印机,或者不带WIFI打印机,配套WT3000A M系列模组,上面自带WIFI+语音芯片,可实现文本合成超拟人的音色,还支持自定义添加背景音乐及效果,可带来生动有趣、富有感染力的听觉体验。应用框图如下:

5db325a2-c75a-11ef-9434-92fbcf53809c.png

方案四和五对比优势:

参数对比

传统离线TTS

离在线TTS

语种中文、中英文支持16国语种,6种国内方言
音质音色相对偏机械音色更丰富,支持超拟人音色
实时性MCU下发UART文本合成指令,离线速度相比在线更快点合成速度会存在1-2秒的延时,与WIFI网络稳定性及缓存有关
本地音频播放以WT3000T为例,除TTS合成文本播放外,A版本可内置30秒固定音播放,D版本可内置500秒固定音播放WT3000A本地本地音频播放,时长与挂载存储器容量有关,如32Mbit flash可内置16kbps的音频约34分钟
AI扩展不支持可引入AI对话,服务器部署产品知识库,在文本合成的基础上,增加产品的售前问答,趣味性对话等,更具个性化服务
开发调试工具配套样片/协议/Demo板,开发快提供服务器部署支持、手机app demo、测试板、样片/IC控制协议
项目成本优势唯创离线版TTS,同级别效果,价格有优势WT3000A离在线TTS方案对比市面上在线TTS方案,价格更具吸引力,可扩展定制自定义功能

离在线TTS原理及技术特点:

· 主要组成为MCU+语音IC、WIFI芯片+服务器这几大核心部分,分为上下位机来做描述:

-上位机主要由两部分组成,APP(配合Demo板操作演示)、服务器

· APP:一键蓝牙配网,文本合成下发,设置语种、音色、音调、音量;

· 服务器:文本音频合成下发、可接入AI大模型对话;

-下位机:主要由三部分组成,MCU、WT3000A+功放、WIFI芯片

· MCU:客户自有主控部分,驱动外设(实现本身产品的功能、交互)、通过UART接口下发文本信息(文本格式支持GB2312、UTF-8等格式)、控制本地音频播放、发起配网请求等;

· WT3000A+功放:与MCU/WIFI模组通讯、解码播放;

· WIFI芯片:联网、音频数据传输,当前传输采用MQTT协议,本司私有协议,建立订阅后,根据不同的主题,发布相关内容,详情请参考本司相关资料。

AUTUMN总结

基于打印机方案,唯创可提供多种语音播报类方案,如简单语音播报、语音更新方案(USB/UART/蓝牙更新....)、离在线TTS方案等。如需要IC样品或Demo板测试体验,及更多技术交流,可联系本司业务人员,或官网留言,欢迎交流分享!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音合成
    +关注

    关注

    2

    文章

    94

    浏览量

    16718
  • 语音播报
    +关注

    关注

    1

    文章

    39

    浏览量

    15042
  • TTS
    TTS
    +关注

    关注

    0

    文章

    62

    浏览量

    11449
  • 语音方案
    +关注

    关注

    1

    文章

    15

    浏览量

    2861
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    语音报警器:TTS语音播报平台逻辑自控

    TTS语音播报报警器是一种集成了传统报警器和TTS(文本转语音)技术的智能设备。清晰、准确地用人
    的头像 发表于 10-29 16:31 446次阅读

    革新电梯语音播报体验:广州WTN6170-8S语音芯片应用解析

    ,传统播报器常因音质不清、播报错误、维护复杂等问题影响用户体验。针对这一痛点,广州电子推出的WTN6170-8S语音芯片,以其卓越性能与
    的头像 发表于 09-05 09:06 439次阅读
    革新电梯<b class='flag-5'>语音</b><b class='flag-5'>播报</b>体验:广州<b class='flag-5'>唯</b><b class='flag-5'>创</b>WTN6170-8S<b class='flag-5'>语音</b>芯片应用解析

    基于开源鸿蒙的语音识别语音合成应用开发样例

    本期内容由AI Model SIG提供,介绍了在开源鸿蒙中,利用sherpa_onnx开源三方库进行ASR语音识别TTS语音合成应用开发的
    的头像 发表于 08-25 14:26 3561次阅读
    基于开源鸿蒙的<b class='flag-5'>语音</b><b class='flag-5'>识别</b>及<b class='flag-5'>语音</b><b class='flag-5'>合成</b>应用开发样例

    TTS文字合成语音芯片的使用场景

    TTS文字合成语音播报芯片的使用场景非常广泛,可以适用于各行各业,主要应用于复杂的语音播报场景,下面小编带大家一起来了解一下。 传统的
    的头像 发表于 08-22 17:11 821次阅读

    一颗TTS语音芯给产品增加智能语音播报能力

    一颗TTS语音芯片给产品增加智能语音播报能力 传统语音播报芯片可以设置一些固定的
    的头像 发表于 08-14 16:33 449次阅读

    从开发工程师视角看TTS语音合成芯片

    从开发工程师视角看TTS语音合成芯片 在语音交互领域,TTS 语音
    的头像 发表于 08-13 14:52 641次阅读

    广州电子WT6/WTV/WT588F系列语音芯片:赋能外卖打印机智能化升级

    在快节奏的外卖行业中,订单处理的效率与准确性直接影响商家口碑与运营效率。传统外卖打印机仅靠指示灯或静默出单,在高峰期极易造成漏单、操作失误等问题。广州电子推出的WT6/WTV/WT588F系列
    的头像 发表于 07-21 08:53 372次阅读
    广州<b class='flag-5'>唯</b><b class='flag-5'>创</b>电子WT6/WTV/WT588F系列<b class='flag-5'>语音</b>芯片:赋能外卖<b class='flag-5'>打印机</b>智能化升级

    5大语音芯片方案,​适配全系打印机,扫清企业出海“语言关”!

    仅仅是一次简单的语音播报,更是打印机品牌商在打印机智能化道路上的一次关键突破。国内领先的打印设备制造商,通常会致力于为全球商户提供高品质的
    的头像 发表于 06-26 12:05 492次阅读
    <b class='flag-5'>唯</b><b class='flag-5'>创</b>5大<b class='flag-5'>语音</b>芯片<b class='flag-5'>方案</b>,​适配全系<b class='flag-5'>打印机</b>,扫清企业出海“语言关”!

    芯资讯|智能打印机—广州电子五大语音芯片IC应用方案解析

    随着物联网技术与智能硬件的深度融合,打印机行业正经历从单一功能向智能化服务的转型升级。广州电子凭借在语音交互领域20余年的
    的头像 发表于 04-27 09:13 575次阅读
    芯资讯|智能<b class='flag-5'>云</b><b class='flag-5'>打印机</b>—广州<b class='flag-5'>唯</b><b class='flag-5'>创</b>电子<b class='flag-5'>五大</b><b class='flag-5'>语音</b>芯片IC应用<b class='flag-5'>方案</b>解析

    广州电子WT3000A在线TTS语音提示器芯片IC设计方案深度解析

    在线方案又依赖网络稳定性,难以满足复杂场景需求。广州电子WT3000A在线
    的头像 发表于 04-25 09:13 590次阅读
    广州<b class='flag-5'>唯</b><b class='flag-5'>创</b>电子WT3000A<b class='flag-5'>离</b><b class='flag-5'>在线</b><b class='flag-5'>TTS</b><b class='flag-5'>语音</b>提示器芯片IC设计<b class='flag-5'>方案</b>深度解析

    智能收银语音交互新标杆—WT3000T8语音合成芯片TTS技术应用解析

    性的TTS技术集成,解决了传统收银系统语音播报存在的多语言支持不足、资源占用过高、语音定制不灵活等行业痛点。二、芯片核心特性多模态
    的头像 发表于 04-24 08:45 615次阅读
    智能收银<b class='flag-5'>语音</b>交互新标杆—WT3000T8<b class='flag-5'>语音</b><b class='flag-5'>合成</b>芯片<b class='flag-5'>TTS</b><b class='flag-5'>技术</b>应用解析

    TTS语音播报控制器能做什么?

    TTS(Text-to-Speech)语音播报控制器,作为一种能够将文本信息转换为语音输出的技术设备,在现代社会的各个领域中展现出了广泛的应
    的头像 发表于 02-20 18:18 1097次阅读

    TTS语音播报模块简介

    在现代科技日新月异的时代,语音技术作为人工智能领域的重要分支,正以前所未有的速度改变着我们的生活方式。其中,TTS(Text To Speech,文本转语音)
    的头像 发表于 02-18 16:16 1868次阅读

    TTS语音播报控制器应用场景

    TTS(Text-to-Speech)语音播报控制器,作为一种能够将文本信息转换为语音输出的技术设备,在现代社会的各个领域中都展现出了广泛的
    的头像 发表于 02-18 16:15 1275次阅读

    HarmonyOS NEXT 应用开发练习:AI智能语音播报

    (Text-To-Speech,文本转语音技术将文本转换为语音进行播报。 当然除了基本的文本输入和播报功能外,我们还增加了
    发表于 01-06 15:33