1 概述¶
随着人们生活水平的提高,都追求舒适的体验感,特别是对操控性的要求越来越高。目前带功能的茶吧机产品的控制方式有以下几类:
- 按键控制:传统控制方式,每次要走到茶吧机边才行,操作麻烦;
- 遥控控制:采用红外遥控或者蓝牙遥控,方便远距离控制,但遥控器容易丢,放置也麻烦。且遥控器上按键较少,当茶吧机功能多的时候无法用单次按键控制全部的功能,组合按键不符合人们使用习惯;
- 手机APP控制:每次控制需要打开手机APP,需要联网,同时需配网,操作繁琐;
- 智能音箱控制:通过如天猫精灵等智能音箱直接控制,相对方便,但音箱需联网状态下才可使用,识别时有隐私安全问题,网络延时大时控制的实时性不好。
为了解决以上痛点,可以采用纯离线语音识别进行控制,在成本增加不大的情况下,为产品带来更多的亮点和竞争力。启英泰伦针对该产品领域,已开发了整套离线语音茶吧机方案,下面对该方案进行介绍。
2 方案优势¶
启英泰伦离线语音茶吧机相对传统茶吧机方案,可让用户通过语音控制茶吧机设备,替换传统遥控器或按钮控制的方式,该方案有以下优势:
- 可以直接使用语音控制茶吧机,且无需联网,自然方便,识别率可达95%以上;
- 语音控制响应快,一般在0.2~0.8s内完成;
- 可远场识别,安静情况下可达10米;
- 方案功耗低,工作功耗仅为0.2W左右;
- 可靠性好,芯片方案已通过双85测试,满足格力、美的等家电巨头要求;
- 整套产品技术已成熟,具有完整的软件、硬件、结构设计方案,节省开发周期,降低开发难度;
- 配合我司语音AI平台开发,可灵活定制唤醒词和命令词,不需要再专门收集语料训练。
3 应用描述¶
启英泰伦离线语音茶吧机方案适用于各类需控制的茶吧机。 语音茶吧机产品的使用场景为普通家居环境,在安静和中低噪音下可以达到良好的识别率。其中安静环境的环境底噪在35dB ~ 45dB之间,属于中低噪音环境;开启茶吧机后环境噪音可达45dB ~ 65dB之间。该噪音环境下可以直接选用我司单麦克风语音模块,如CI-B0XGS01S或CI-B0XGS01S-H模块,以达到比较好的性价比。
特别注意,不同的茶吧机运行过程中,因为齿轮位置、进出水口等差异,运行产生的噪声大小也有不小的差异,为了达到最好的语音识别效果,在设计茶吧机整机结构时,因注意控制麦克风噪音小于65dB、具体参照下面结麦克风结构设计。
4 产品设计流程¶
一个基于我司芯片的标准语音产品设计流程如下图所示:
该流程主要针对我司新用户开发产品使用,包含了前期购买样品Demo进行验证,硬件选型,语音对话逻辑、软硬件方案和结构设计,设计完成后的测试,以及生产测试准备和后续批量采购等步骤。如果是已经熟悉我司方案的老用户,可以直接从中间步骤开始,不用再重复进行Demo测试等工作。
下面针对新用户的开发,对上述流程中的各个步骤逐一描述。
4.1 DEMO测试¶
针对新用户,可以先从我司授权的经销商或直接从我司官网 ☞样品购买 处购买对应的模块或开发板套件,进行识别效果测试,相关的软硬件技术文档可以从本文档中心处获取。用户测试满意后,可以进行硬件选型。
4.2 选型指南¶
用户硬件选型可以直接参考 ☞硬件选型 ,如果用户想快速产品化,推荐直接使用我司已设计好的标准模块;如果现有标准模块无法满足产品的结构需求,也可以选用合适的芯片进行硬件板的设计。
4.3 方案设计¶
选择好合适的芯片或模块后,可根据产品的功能进行下述设计:
- 语音UI(唤醒词和命令词)设计:设计方法可参考 ☞语音UI设计参考;
- 硬件设计:设计方法可参考 ☞硬件设计参考;
- 结构设计:设计方法可参考 ☞产品结构设计;
- 软件开发:设计方法可参考 ☞软件开发。
如用户为首次进行语音方案开发,建议到 ☞启英泰伦语音AI平台 上获取基于相关芯片的语音产品方案设计Checklist文档,进行逐一检查以确保设计效果。如有技术支持需求请联系我司技术支持人员。
4.4 测试验收¶
产品方案设计完成形成样品后,建议对该样品进行相关的识别测试,相关测试方法和标准可参考 ☞识别效果测试。同时,还建议根据产品质量的要求进行各类硬件测试,静电测试、防水测试等。为了保证最终的识别效果,还建议进行硬件底噪的测试及产品装机后的整机功能测试。
4.5 生产测试¶
样机测试完成后,会转入后续产线批量生产阶段。我司为产品的批量生产做了完善的解决方案,用户可以参考 ☞生产测试 获取更多信息。用户如需要生产测试的相关技术支持,请联系我司技术人员。
4.6 下单采购¶
用户如果要采购我司产品,请点击 ☞样品和批量采购 获取更多信息。
5 茶吧机设计方案介绍¶
5.1 方案特点¶
用户可以用我司的芯片设计语音控制板,和原产品的电控板通过串口进行通讯,可以实现语音茶吧机的产品设计。该方式开发相对简单,可以快速对接完成产品,但成本略高,适用于需快速出产品的的方案或者第一次接触语音识别的方案。
该方案的设计框图如下,语音模块与电控模块需要4根线的串口连接,语音模块进行语音识别及根据茶吧机的状态进行信息播放,控制由电控模块完成。
5.2 硬件设计参考¶
用户可以使用我司芯片设计需要要求的语音模块,但为快速开发,推荐直接使用我司的以下标准模块:
- CI-B02GS03T:适合空间比较高,纵深长的结构,串口接口电平为3.3V;
- CI-B02GS01S:适合空间比较矮的结构,串口接口电平为3.3V;
- CI-B02GS01J:适合有空间放置固定语音模块的结构,原来的茶吧机硬件改动较小,串口接口电平为5V。
用户直接使用我司标准语音模块时,有以下注意事项:
- 将语音模块板的串口跟电控串口对接,注意电控的供电需要大于500mA;
- 注意串口的电平要匹配,CI-B02GS01J支持5V电平,其他的模块支持3.3V,如果电控板使用5V电平,CI-B02GS01J可以对接直接串口,其它模块需要增加电平转换电路,如下图所示:
5.3 串口通讯方式¶
语音模块与电控模块通过串口进行信息交互,主要有两种方式,一种为语音模块主动播放,同时将信息发电控模块;另一种为语音模块被动播放,其分别描述如下:
语音模块主动播放模式
主动播放方式主要执行以下动作:
- 识别到词条;
- 主动播放反馈声音;
- 将此条信息串口告知电控模块;
- 电控模块执行动作。
该方式的优点在于控制方式简单,由语音模块单线输出信息给电控模块。但缺点在于无法根据茶吧机的情况及按键情况进行语音反馈。
语音模块被动播放模式
被动播放方式主要执行以下动作:
- 语音模块识别到词条;
- 将词条信息串口告知电控模块;
- 电控模块执行相关动作;
- 告知语音模块需要播放的内容;
- 语音模块根据电控模块反馈进行播放。
该方式的优点在于语音模块根据电控模块的状态进行播放对应内容,可以进行最合适的反馈,体验感好;同时如果电控模块通过按键或者遥控进行控制,语音模块也可以进行状态播放。缺点在于会多一次串口通信的过程。
5.4 SDK包说明和模块串口通讯协议¶
我司为用户提供了串口通讯方案完整的SDK包,用户可以到 ☞启英泰伦语音AI平台 上获取相关SDK开发包。
模块的串口通讯建议使用我司标准协议,具体格式请参考 ☞串口协议 。
注意:
- ASR语言模型中文建议选择SE159,其他语种请使用对应语种的模型。茶吧机产品自带运行噪音,如果茶吧机本身噪音大于60db,建议打开降噪功能。
-
串口设置:
- 波特率:9600
- 停止位:1
- 数据位:8
- 奇偶校验:无
- 代码中通过判断 “命令+语音ID”获取是什么指令和功能。
- 发送的串口信息建议要检查完整性,可以用以下的checksum参考代码来实现。
6 产品结构相关注意事项¶
6.1 麦克风结构设计¶
茶吧机产品在设计结构时,针对麦克风应当注意以下事项:
- 麦克风布局尽量远离茶吧机的电机,进出水管等噪音处;
- 麦克风需要防水防尘处理,至少选择IP65规格的;
- 麦克风放在茶吧机的正面的位置,避免遮挡,保证拾音最大范围;
- 分贝仪测试运行时,麦克风处的稳态噪声需小于65dB;
- 麦克风连线较长可选择带屏蔽的线;
- 麦克风线扎捆远离电机或电控线。
下图以常用智能茶吧机为例,讲述麦克风结构开孔及位置的建议方式,固定麦克风的结构件也需要考虑麦克风线方便引出导线和避免干扰。
6.2 喇叭结构设计¶
茶吧机产品在设计结构时,针对喇叭应当注意以下事项:
- 考虑到音质,喇叭功率不能太小,建议选用1W以上喇叭,带音腔的喇叭效果会更好一点,同时注意硬件板上的功放驱动能力要匹配喇叭型号;
- 喇叭放置位置以美观及结构布局方便为主,但注意尽量避免和麦克风放在同一位置;
- 不带音腔喇叭可以在结构上做一个音腔密封后能增大音量输出。
下图是一个喇叭规格及开孔的建议。
6.3 其它注意事项¶
- 建议选择-32dB±3dB,信噪比大于70dB以上,性价比高的全向模拟麦克风;
- 若茶吧机电机震动比较大,选择较厚的麦克风胶套减缓震动,可减小对识别效果的影响;
- 茶吧机处理潮湿环境,最好板子刷三防漆,推荐选择IP65防水防尘的麦克风,;
- 特别注意禁止直接点热溶胶用于固定麦克风头;
- 将麦克风完全插入固定孔内部,避免歪斜,拾音孔中心孔对准麦克风的中心;
- 茶吧机内部接线多容易扯松,插头配插座带卡扣会更牢固;
- 选择符合环保RoHS要求的RTV硅胶,推荐常用的硅胶有703/704/737等,或其它有机材料、单组分室温固化硅胶等;
- 多数硅橡胶灌胶厚度小于3mm以内实温完全固化时间为8 ~ 12小时,灌胶厚度 > 3mm以上完全固化时间更长,可分层多次浇灌,确保完全固化稳定密封;
- 生产工艺可把固定麦克风工序提前,另外特别注意麦克风接线在重力拉扯下,未完全固化前容易导致麦克风扯歪,也需注意将麦克风插线固定好。
7 相关参考资料列表¶
编号 | 参考资料描述 | 获取方式 |
---|---|---|
1 |
标准离线SDK CI110X_SDK_ASR_Offline |
请到 ☞启英泰伦语音AI平台 上获取 |
2 |
茶吧机SDK Demo: 串口通讯方案SDK |
请到 ☞启英泰伦语音AI平台 上获取 |
3 | 测试固件 | 到 ☞启英泰伦语音AI平台 上获取 |
4 | 我司芯片和模块的选型指南 | 请点击 ☞硬件选型指南 查看 |
5 | 我司芯片硬件设计方法参考 | 请点击 ☞硬件设计参考 查看 |
6 | 麦克风和喇叭器件选型 | 请点击 ☞外围器件兼容列表 查看 |
7 | 产品结构设计 | 请点击 ☞产品结构设计 查看 |
8 | 软件开发方法和标准SDK说明 | 请点击 ☞软件开发 查看各部分内容 |
9 | 产品识别性能测试方法 | 请点击 ☞识别效果测试 查看 |
10 | 生产测试的方法 | 请点击 ☞生产测试 查看 |
用户如遇到使用问题,请到启英泰伦语音AI平台上提交技术工单,或直接联系我司技术人员获取协助。
审核编辑:符乾江
评论
查看更多