【四旋翼飞行器】76小时吃透四轴算法!史上最强软硬结合实战项目,👉戳此立抢👈

家电遥控器中的那些语音识别技术盘点

电子设计 2018-01-13 08:08 次阅读

介绍一种适合家电遥控器应用的语音识别算法,该算法使用双模块和两级端点检测方法,能有效地提高识别和稳健性;介绍利用该技术实现的一种新型学习型遥控器,展现了语音识别技术在家电领域的广阔前景。 关键词:语音识别 DTW FED FRED 学习型遥控器 家用电器发展的一个重要方面是让用户界面更加人性化,更加方便自然,做到老年人和残疾人可以无障碍地使用。利用语音识别技术实现语音控制是提高家电产品用户界面质量的一条重要途径。

本文以语音控制遥控器为例,说明语音识别技术如何应用在家电器领域。 适合家用电器应用的语音识别嵌入式系统结构如图1所示,它由四个部分组成。第一部分为模/数转换部分,其输入端接收输入的语音信号,并将其转化成数字芯片可处理的数字采集信号;在输出端将解码后的语音数字信号转换为音频模拟信号,通过扬声器放声。第二部分为语音识别部分,它的作用是对输入的数字语音词条信号进行分析,识别出词条信号所代表的命令,一般由DSP完成。第三部分语音提示和语音回放部分,它一般也是在DSP中完成的,其核心是对语音信号进行数字压缩编码和解码,目的是提示用户操作并对识别语音的响应,完成人机的语音交互。第四部分是系统控制部分,它将语音识别结果转换成相应的控制信号,并将其输出转换成物理层操作,完成具体功能。语音识别与系统控制的有机结合是完成声控交互的关键,下面将对语音识别算法及遥控系统控制部分作详细的讨论。

1 语音识别算法 目前,常以单片机MCU)或DSP作炎硬件平台的实现消费类电子产品中的语音识别。这类语音识别主要为孤立词识别,它有两种实现方案:一种是基于隐含马尔科夫统计模型(HMM)框架的非特定人识别;另一种是基于动态规划(DP)原理的特定人识别。它们在应用上各有优缺点。HMM非特定人员的优点是用户无需经过训练,可以直接使用;并且具良好的稳定性(即对使用者而言,语音识别性能不会随着时间的延长而降低)。但非特定人语音识别也有其很难克服的缺陷。首先,使用该方法需要预先采集大量的语料库,以便训练出相应的识别模型,这就大大提高了应用此技术的前期成本;其次,非特定人语音识别很难解决汉语中不同方言的问题,限制了它的使用区域;另外还有一个因素也应予以考虑,家电中用于控制的具体命令词语最好不要完全固定,应当根据的用户的习惯而改变,这一点在非特定人识别中几乎不可能实现。因此大多数家电遥控器不适合采用此方案。

DP特定人识别的优点是方法简单,对硬件资源要求较低;此外,这一方法中的训练过程也很简单,不需预先采集过多的样本,不仅降低了前期成本,而且可以根据用户习惯,由用户任意定义控制项目的具体命令语句,因而适合大多数家电遥控器的应用。DP特定识别的严重缺点是它的稳健性不理想,对有些人的语音识别率高,有的人识别率却不高;刚训练完时识别率较高,但随着时间的推迟而识别率降低。些缺点往往给用户带来不便。为克服这些缺陷,对传统方法作为改进,使识别性能和稳健性都有显著的提高,取得令人满意的结果。 1.1 端点检测方法 影响孤立词识别性能的一个重要因素是端点检测准确性。在10个英语数字的识别测试中,60毫秒的端点误差就使识别率下降3%。

对于面向消费类应用的语音识别芯片系统,各种干扰因素更加复杂,使精确检测端点问题更加困难。为此,提出了称为FRED(Frame-based Readl_time Endpoint Detection)算法[3]的两级端点检测方案,提高端点检测的精度。第一级对输入语音信号,根据其能量和过零率的变化,进行一次简单的实时端点检测,以便去掉静音得到输入语音的时域范围,并且在此基础上进行频谱特征提取工作。第二级根据输入语音频谱的FFT分析结果,分别计算出高频、中频和低频段的能量分布特性,用来判别轻辅音、浊辅音和元音;在确定了元音、浊音段后,再向前后两端扩展搜索包含语音端点的帧。FRED端点检测算法根据语音的本质特征进行端点检测,可以更好地适应环境的干扰和变化,提高端点检测的精度。 在特定人识别中,比较了常用的FED(Fast Endpoint Detection)[5]和FRED两种端点检测算法的性能。两种算法测试使用相同的数据库,包括7个人的录音,每个人说100个人名,每个人名读3遍。测试中的DP模板训练和识别算法为传统的固定端点动态时间伸缩(DTW)模板匹配算法[4]。两种端点检测算法的识别率测试结果列在表1中。 表1 比较FED和FRED端点检测算法对DTW模板匹配识别率的影响 端点检测算法第1人第2人第3人第4人第5人第6人第7人平均 FED 92.5% 87% 92.6% 95.6% 96.2% 96.8% 100% 94.4% FRED 94.3% 89.9% 93.2% 99.4% 99.4% 98.8% 100% 96.4% 测试结果说明:使用FRED端点检测算法,所有说话人的识别率都有了不同程度的提高。因此,本系统采用这种两级端点检测方案。 1.2 模拟匹配算法 DTW是典型的DP特定人算法,为了克服自然语速的差异,用动态时间规整方法将模板特征序列和语音特征序列进行匹配,比较两者之间的失真,得出识别判决的依据。 假设存储的一个词条模板包括M帧倒谱特征R={r(m);m=1,2,∧,M};识别特征序列包括N帧倒谱特征T={t(n);n=1,2, ∧,N}。在r(i)和t(i)之间定义帧局部失真D(i,j),D(i,j)=|r(i)-t(i)| 2,通过动态规划过程,在搜索路径中找到累积失真最小的路径,即最优的匹配结果。采用对称形式DTW: 其中S(i,j)是累积失真,D(i,j)是局部失真。 当动态规划过程计算到固定结点(N,M)时,可以计算出该模板动态匹配的归一化距离,识别结果即该归一化距离最小的模板词条:x=argmin{S(N,Mx)}。 为了提高DTW识别算法的识别性能和模板的稳健性,提出了双模板策略,即x=argmin{S(N,M2x)}。第一次输入的训练词条存储为第一个模板,第二次输入的相同训练词条存储为第二个模板,希望每个词条通过两个较稳健的模板来保持较高的识别性能。与上面测试相同,也利用7个人说的100个人名,每个人名含3遍的数据库,比较DTW单模板和双模板的性能差别,结果更在表2中。 表2 DTW不同模板数的识别率比较 DTW 第1人第2人第3人第4人第5人第6人第7人平均 单模板 94.3% 89.9% 93.2% 99.4% 99.4% 98.8% 100% 96.4% 双模板 99.4% 96.6% 98.5% 100% 100% 98.8% 100% 99.0% 测试结果说明:通过存储两个模板,相当大地提高了DTW识别的性能,其稳健性也有很大的提高。因此,对特定人识别系统,采用DTW双模板是简单有效的策略。

综上所述,该嵌入式语音识别芯片系统采用了改进端点检测性能的FRED算法,12阶Mel频标倒谱参数(MFCC)作为特征参数,使用双模板训练识别策略。通过一系列测试,证明该系统对特定人的识别达到了很好的识别性能,完全可以满足家用电器中声控应用的要求。 2 语音控制遥控器设计 目前家用遥控器主要为按键式,并有两种类型:一种是固定码型,每个键对应一种或几种码型,都是生产厂家预先设定好的,用户不能更改;另一种是学习型,具有自我学习遥控码的功能,可由用户定义遥控器的每个键对应的码型,它能够将多种遥控器集于一身,用一个遥控器就可控制多个

家电,又可以作为原配遥控器的备份。由于现代家电功能不断增加,上述两种遥控器都有按键过多,用户不易记住每个键的含义等问题。将语音识别技术应用于学习型遥控器,利用语音命令代替按者对命令的记忆和使用,同时省去了大量按键,缩小了遥控器的体积。 语音控制遥控器的硬件框图如图2所示,它由两个独立的模块组成:语音信号处理模块和系统控制模块。 语音信号算是模块由DSP、快闪存储器(FLASH)、编解码器(CODEC)组成。其中DSP是整个语音识别模块的核心,负责语音识别、语音编解码,以及FLASH的读写控制。DSP的优点是运算速度快、内存空间大、数据交换速度快,可用来实现复杂的算法,提高识别率,减小反应延时,得到较高的识别性能。DSP芯片选用Analog Devices公司的AD2186L,它具有如下特点:①运算速度达40MIPS,且均为高效的单调周期指令;②提供了40K字节的片内RAM,其中8K字(16Bit/字)为数据RAM,8K字(24Bit/字)为程序RAM,最大可达4兆字节的存储区,用于存储数据或程序;③3.3V工作电压,具有多种省电模式。AD2186L既能完成与语音信号算是相关的算法,又适合使用电池作能源的遥控器。FLASH和CODEC也都选用3.3V工作电压的芯片。

FLASH为美国ATMEL公司的AT29LV040A(4M Bit),它作为系统的存储器,主要用于存放以下内容:提示语音合成所需的参数,特定人训练后的码本数据,DSP系统的应用程序和学习和遥控码数据。CODEC选用美国TI公司的TLV320AC37,用来进行A/D、D/A变换、编码和解码。 系统控制模块由单片机、红外接收发送器、电源管理电路组成。单片机负责整个遥控器的系统控制。单片机作为主控芯片,进行键盘扫描,根据用户通过键盘输入的指令,分别完成学习遥控码;控制DSP进行语音训练、回放、识别;将识别结果转换成相应的遥控码,通过红外发光管发射出去。单片机与DSP之间通过标准的RS232串行协议通讯。

系统的控制软件流程图如图3所示。在使用前,按“学习键”进入学习状态,用户先对学习型遥控器训练语音命令,并使其学习与各语音命令相对应的原理控码型。使用时按“识别键”,进入语音识别状态,等待语音处理模块返回结果,若返回正确的识别结果,则把相应的遥控码发射出去。例如,原电视遥控器数字键“1”对应中央1台,用户的训练命令为“中央1台”,学习了原遥控器的数字键“1”的遥控码,并使其与训练命令“中央1台”对应起来。于是使用时只需对着学习型遥控器的麦克风说出“中央1台”,电视就会切换到中央1台。

这样用户不需要记住每个电视台与台号的对应关系,相对于枯燥的频道数字,用户自定义的命令更容易记住。 若连续的30秒无正确的命令则遥控器进入休眠状态,单片机控制电源管理电路切换DSP和FLASH电源,单片机本身也进入休眠状态,直至用户按键,唤醒单片机,再由单片机控制恢复DSP和FLASH供电,重新开始工作。这是因为整个系统中,DSP的功耗最大,长时间不用时,关闭语音信号处理模块,可以显著地降低整个系统的功耗。 从实验室走向市场的过程中,可靠性与成本是遇到的最大挑战。采用双模板的DTW和两组端点检测FRED算法,可在系统资源和反应延时增加极小的情况下,有效地提高识别率和稳健性。该项技术成功地运用在学习型遥控器上,展现了语音识别技术在家电领域的广阔前景。

收藏 人收藏
分享:

评论

相关推荐

2018年Q3中国最火的智能音箱!秘密竟然是远场语音技术

最新一年百度在语音技术上两大进展:一次唤醒多次交互技术,技术特点是信号尾点和语义尾点联合优化模型;第....
的头像 章鹰 发表于 01-19 00:01 321次 阅读
2018年Q3中国最火的智能音箱!秘密竟然是远场语音技术

ZLG推出了基于Onsemi BR262麦克风降噪芯片方案,从而提高通话质量

BR262内置DSP,出厂时集成算法在内部,对于常规的项目直接使用就行,通过外围电路的配置可以轻松调....
的头像 周立功单片机 发表于 01-17 17:42 325次 阅读
ZLG推出了基于Onsemi BR262麦克风降噪芯片方案,从而提高通话质量

爱思唯尔发布了《人工智能:知识的创造、转移与应用》报告

报告显示在全球范围内,人工智能研究在过去五年(2013年至2017年)以每年接近13%的速度快速增长....
的头像 人工智能学家 发表于 01-17 16:46 119次 阅读
爱思唯尔发布了《人工智能:知识的创造、转移与应用》报告

YS-V0.7语音识别模块芯片LD3320的原理图免费下载

本文档的主要内容详细介绍的是YS-V0.7语音识别模块芯片LD3320的原理图免费下载。
发表于 01-16 08:00 20次 阅读
YS-V0.7语音识别模块芯片LD3320的原理图免费下载

探析语音识别技术的发展历史及应用

在人际交往中,言语是最自然并且最直接的方式之一。随着技术的进步,越来越多的人们也期望计算机能够具备与....
的头像 传感器技术 发表于 01-15 16:45 219次 阅读
探析语音识别技术的发展历史及应用

中国语音产业的江湖史

1993年,在中科大召开的全国语音识别与合成研讨会上,王仁华教授提出了试用播音员录音的基因片段加处理....
的头像 电子发烧友网工程师 发表于 01-15 15:18 1030次 阅读
中国语音产业的江湖史

爱思唯尔研究报告:中国将在人工智能研究领域成为全球领导者

中国医科大学党委书记朱京海表示,学校与科大讯飞联合建立医学人工智能实验室,是“校企强强联合”的重要举....
的头像 高工智能未来 发表于 01-14 16:22 510次 阅读
爱思唯尔研究报告:中国将在人工智能研究领域成为全球领导者

AI录音笔亮相,科大讯飞翻译拿下创新奖

在CES2019上,科大讯飞带着升级之后的讯飞翻译机,讯飞智能录音笔系列出席,再一次获得CES创新奖....
的头像 独爱72H 发表于 01-11 11:03 857次 阅读
AI录音笔亮相,科大讯飞翻译拿下创新奖

微信之父张小龙4小时历史最长演讲火热出炉!

微信和很多产品不一样的一些点,会在很多地方体现出来。比如,很多 APP 到了春节等特定节日的时候,就....
的头像 电子发烧友网工程师 发表于 01-11 09:33 490次 阅读
微信之父张小龙4小时历史最长演讲火热出炉!

中国智能语音服务产业,最快冲过终点的将是谁呢?

当前业界商用语音合成系统 (红框标识) 合成语音与录音 (Recording) 相似度大约在85~%....
的头像 新智元 发表于 01-11 09:00 293次 阅读
中国智能语音服务产业,最快冲过终点的将是谁呢?

AI电视1.0时代:既“做事”又能“做秀”,语音识别技术成了厂商的“小红旗”

2013年, 老牌电视厂商TCL,发布了全球首款专为儿童定制的迪士尼儿童电视。酷开也早在前几年便进军....
的头像 电子发烧友网 发表于 01-10 11:28 806次 阅读
AI电视1.0时代:既“做事”又能“做秀”,语音识别技术成了厂商的“小红旗”

智能音箱代表的,是否为足够浩瀚的蓝海市场?

为搭上音箱智能化的顺风车,传统音响设备商业适时推出众多产品。他们将卖点定位在音质表现,融合语音识别功....
的头像 AI聂潜 发表于 01-08 15:48 875次 阅读
智能音箱代表的,是否为足够浩瀚的蓝海市场?

谷歌2019年的第一个AI实验室要开门了

这座AI实验室位于帕尔默广场1号(1 Palmer Square),成员由从教职员工、研究生和本科生....
的头像 新智元 发表于 01-07 09:06 321次 阅读
谷歌2019年的第一个AI实验室要开门了

院士邬贺铨:深度神经网络实际上是个分类器

在语音识别方面,人工智能已经超过了人,一般人类语音识别的错误率是5.1%,现在百度对汉语的语音识别,....
的头像 电子发烧友网工程师 发表于 01-06 11:12 2415次 阅读
院士邬贺铨:深度神经网络实际上是个分类器

智能驾驶舱的交互时代已经到来

抬头显示(HUD)技术推广曾一度受阻,如今又成为热点。IHS Market对该市场颇为乐观,其在20....
的头像 Thundersoft中科创达 发表于 01-04 15:22 229次 阅读
智能驾驶舱的交互时代已经到来

Silicon Mitus亮相2019年美国消费电子展(CES)展示HiFi音频IC

电源管理集成电路(PMIC)技术专家Silicon Mitus, Inc.将于1月9日至12日在20....
的头像 人间烟火123 发表于 01-04 09:41 1300次 阅读
Silicon Mitus亮相2019年美国消费电子展(CES)展示HiFi音频IC

如何使用生成少数类技术进行深度自动睡眠分期模型设计说明

针对现阶段可用睡眠脑电数据皆为类不平衡小数据集,深度学习模型的直接迁移应用所取得的分期效果较差的问题....
发表于 01-03 16:07 46次 阅读
如何使用生成少数类技术进行深度自动睡眠分期模型设计说明

一文解读语音识别的运行原理

今天的文章将向您展示如何构建可以识别 10 个不同字词的基本语音识别网络。需要注意的是,真正的语音和....
的头像 TensorFlow 发表于 01-01 10:19 303次 阅读
一文解读语音识别的运行原理

各大公司智能语音助手测评

市场上有许多的语音助手,哪个最好哪个最差呢?每年Loup Ventures都会测试一下,帮我们找到答....
的头像 独爱72H 发表于 01-01 09:41 1184次 阅读
各大公司智能语音助手测评

国内最值得关注的10家人工智能语音识别公司

在谈人工智能的时候,一定不能不谈语音识别,语音识别是人机交互的入口,是指机器/程序接收、解释声音,或....
的头像 Carol Li 发表于 12-29 15:28 2543次 阅读
国内最值得关注的10家人工智能语音识别公司

如何设计一个有限状态转换器的端到端中文语音识别系统

针对隐马尔可夫模型( HMM)在语音识别中存在的不合理条件假设,进一步研究循环神经网络的序列建模能力....
发表于 12-28 16:01 204次 阅读
如何设计一个有限状态转换器的端到端中文语音识别系统

改变智能家居的五种方式

智能家居一直在变得越来越聪明,但是和科技一样,一旦我们实现了一个愿望(为什么我不能直接和灯泡通话来打....
的头像 物联之家网 发表于 12-26 08:39 590次 阅读
改变智能家居的五种方式

骨传导智能眼镜可以听音乐接电话

Lucyd 公司的Lucyd Loud智能眼镜“soundglasses”在成功兑现之前承诺功能的同....
的头像 CINNO 发表于 12-25 09:32 823次 阅读
骨传导智能眼镜可以听音乐接电话

探访之旅:探寻骨传导技术的过去和未来

韶音科技表示自己拥有「全球唯一解决骨传导音质和漏音的技术方案」。如果在其他场合听到这句话你可能会产生....
的头像 OFweek可穿戴设备网 发表于 12-24 09:51 333次 阅读
探访之旅:探寻骨传导技术的过去和未来

智能客户服务中心推动进入"AI+"时代

创新人机协作服务方式,构建智能数据运营体系,形成决策辅助管理模式,促进传统客户服务中心向知识运营中心....
的头像 CTI论坛 发表于 12-23 15:02 1080次 阅读
智能客户服务中心推动进入"AI+"时代

两个扬声器不同输入功率,其他条件相同,请问怎么把频响曲线换成统一标准来比较?

两个扬声器不同输入功率,其他条件相同,怎么把频响曲线换成统一标准来比较?...
发表于 12-22 16:55 162次 阅读
两个扬声器不同输入功率,其他条件相同,请问怎么把频响曲线换成统一标准来比较?

如何将语音识别、计算机视觉和自然语言处理结合起来帮助精神健康患者

在临床实践中,医生首先通过面对面临床问诊测量抑郁症症状的严重程度,以此来甄别患者的抑郁症症状。在这些....
的头像 人工智能 发表于 12-22 15:49 530次 阅读
如何将语音识别、计算机视觉和自然语言处理结合起来帮助精神健康患者

2019年即将引领汽车座舱电子发展的三大主流趋势

抬头显示(HUD)技术推广曾一度受阻,如今又成为热点。IHS Market对该市场颇为乐观,其在20....
的头像 PCB商情 发表于 12-21 15:44 1990次 阅读
2019年即将引领汽车座舱电子发展的三大主流趋势

如何使用MATLAB进行语音识别算法研究的论文资料免费下载

本论文介绍了双门限语音端点检测理论,研究了语音特征参数地提取过程,特征参数包括:线性预测系数(LPC....
发表于 12-21 15:03 197次 阅读
如何使用MATLAB进行语音识别算法研究的论文资料免费下载

如何采用MCU定制一个属于自己的语音识别应用

TI还发布了一个用C语言代码编写的语音识别器库,这个库使得基于MSP432 MCU的应用能够识别用户....
发表于 12-20 16:14 257次 阅读
如何采用MCU定制一个属于自己的语音识别应用

微软院士:Speech DDK技能太强了,语音识别超专业翻译人士水平

【导读】2016年152层残差网络图像识别精准率96%,2017年语音识别基准测试误差率5.1%,2....
的头像 行业观察 发表于 12-19 16:53 3325次 阅读
微软院士:Speech DDK技能太强了,语音识别超专业翻译人士水平

【PYNQ-Z2申请】基于pynq的语音识别和新闻报道系统

项目名称:基于pynq的语音识别和新闻报道系统 试用计划:申请理由 本人在Zynq如那件无线电方向有三年多的学习和开发经验,曾...
发表于 12-19 11:38 216次 阅读
【PYNQ-Z2申请】基于pynq的语音识别和新闻报道系统

iPhone7怎样更换扬声器

iPhone7换后置摄像头的图文教程,简单概述iPhone7是怎么样换扬声器的。
的头像 39度创意研究所 发表于 12-19 10:14 1654次 阅读
iPhone7怎样更换扬声器

人工智能推广应用会怎么走 靠算法的不断提升吗

人脸识别、语音识别是人工智能应用最为人熟知的两个领域。智能音箱、人脸门禁也已经走进不少人的生活。去年....
的头像 1号机器人网 发表于 12-18 09:55 969次 阅读
人工智能推广应用会怎么走 靠算法的不断提升吗

ibm发布了其嵌入式viavoice4.4软件包 采用了一种创新的语音识别技术

ibm日前发布了其嵌入式viavoice4.4软件包,其中采用了任意指令识别和一种创新的语音识别技术....
发表于 12-17 15:32 455次 阅读
ibm发布了其嵌入式viavoice4.4软件包 采用了一种创新的语音识别技术

如何使用多特征i-vector进行短语音说话人识别算法说明

当测试语音时长充足时,单一特征的信息量和区分性足够完成说话人识别任务,但是在测试语音很短的情况下,语....
发表于 12-14 13:42 158次 阅读
如何使用多特征i-vector进行短语音说话人识别算法说明

索尼推出一款无线可穿戴式扬声器SRS-WS1 续航时间达7个小时左右官方售价1999元

颈挂式耳机已经比较普遍了,可颈挂式音箱你见过吗?今天索尼推出了一款无线可穿戴式扬声器SRS-WS1,....
发表于 12-13 15:26 367次 阅读
索尼推出一款无线可穿戴式扬声器SRS-WS1 续航时间达7个小时左右官方售价1999元

便携产品音频I/O接口电路IC

便携式信息技术(IT)产品的输入/输出(I/O)接口电路IC如附图所示。该电路的核心是AN2906FJM单片IC。左/右...
发表于 12-13 09:52 175次 阅读
便携产品音频I/O接口电路IC

华北工控推出面向语音识别系统打造的一款高性能嵌入式板卡方案

通过语音信号处理和模式识别让机器自动识别和理解人类口述语言,让机器通过识别和理解过程把语音信号转变为....
发表于 12-11 16:42 162次 阅读
华北工控推出面向语音识别系统打造的一款高性能嵌入式板卡方案

人工智能语音识别发展带动MEMS麦克风的需求增长

人工智能(AI)语音识别发展起飞,进一步带动MEMS麦克风的需求,然而在这波需求的背后,不仅是MEM....
的头像 MEMS 发表于 12-11 16:21 618次 阅读
人工智能语音识别发展带动MEMS麦克风的需求增长

2019将这10项人工智能技术值得关注

自然语言生成是一个AI子学科,它将数据转换为文本,使计算机能够以完美的准确度交流思想。
的头像 人间烟火123 发表于 12-09 11:34 978次 阅读
2019将这10项人工智能技术值得关注

扬声器声音小怎么办

手机扬声器都会有很多小孔,就是为了让声音能够更好的扩散出去。然而手机长时间的使用会使灰尘进入到手机扬....
的头像 发烧友学院 发表于 12-04 16:54 928次 阅读
扬声器声音小怎么办

众麦通信智能客服解决方案基于众麦通信统一通信平台应用语音识别等技术

核心技术优势:众麦通信智能客服可以方便地调用各项HCI核心能力,且各项能力针对语音导航领域知识库进行....
的头像 CTI论坛 发表于 12-04 16:01 632次 阅读
众麦通信智能客服解决方案基于众麦通信统一通信平台应用语音识别等技术

音箱的组成和原理的详细资料简介

音响指除了人的语言、音乐之外的其他声响,包括自然环境的声响、动物的声音、机器工具的音响、人的动作发出....
发表于 12-04 08:00 499次 阅读
音箱的组成和原理的详细资料简介

AI起航 协助多项领域落地

人工智能热潮由深度学习技术推动,如今智能客服、语音识别等领域已经与商业场景应用相结合,赋能各个行业,....
的头像 人间烟火123 发表于 12-02 10:29 1783次 阅读
AI起航 协助多项领域落地

科大讯飞5.0语音软件的安装和操作要领资料说明

语音识别接口是InterReco 提供的最重要的对外接口,是应用开发人员使用识别引擎进行语音识别开发....
发表于 11-30 10:41 346次 阅读
科大讯飞5.0语音软件的安装和操作要领资料说明

HT8320D类双通道音频功率放大器的数据手册免费下载

HT8320是嘉兴禾润电子推出的一款双声道,内置高效自适应电荷泵升压,防失真的功放IC,支持AB类/....
发表于 11-30 08:00 118次 阅读
HT8320D类双通道音频功率放大器的数据手册免费下载

语音识别中为什么会出现带宽失配如何进行补偿分析资料概述

目前的语音识别系统在训练环境与测试环境匹配的情况下具有很高的识别率,而当环境失配时,其性能将急剧下降....
发表于 11-28 15:21 46次 阅读
语音识别中为什么会出现带宽失配如何进行补偿分析资料概述

状态变量滤波器可调分频测试系统的详细资料说明

“再也不是十字路口!”——我几乎可以听到痛苦的哭喊声。但是这个是不同的,因为它在很宽的范围内是连续变....
发表于 11-27 14:26 96次 阅读
状态变量滤波器可调分频测试系统的详细资料说明

双向扬声器模拟有源分频解决方案

描述    此 TI 验证设计针对双向扬声器实施了模拟有源分频解决方案,适用于录音室或家庭高保真系统。低音扬声器信...
发表于 11-27 11:34 451次 阅读
双向扬声器模拟有源分频解决方案

探析智能语音交互应用和技术

北京声加科技CEO邱锋海受邀以《声加万物、聆听未来:智能语音交互应用和技术》为题,分享了目前正在爆发....
的头像 MEMS 发表于 11-23 09:54 762次 阅读
探析智能语音交互应用和技术

国外新闻 Siri创始人称苹果没开放语音助手是错误 特斯拉需要职业经理人

Siri的联合创始人、前首席执行官达格基特劳斯(Dag Kittlaus)周二对媒体表示,Siri在....
发表于 11-21 15:46 660次 阅读
国外新闻 Siri创始人称苹果没开放语音助手是错误 特斯拉需要职业经理人

汽车音响改装低音喇叭:AD-F12

汽车音响中扬声器作为还原设备对声音进行还原,而音质的好坏直接由扬声器来表现,也就是说整个音响系统即使再复杂,最终我们听到...
发表于 11-21 11:17 2042次 阅读
汽车音响改装低音喇叭:AD-F12

lm386增益恒定了,无法调节

用ne555与lm386制作了一个电子琴。 用lm386做功放然后驱动扬声器发声。 本想能够通过改变lm386的增益来改变音量的大小,但是在...
发表于 11-21 00:18 209次 阅读
lm386增益恒定了,无法调节

普强信息金融新生态智能语音解决方案

支持对目标用户识别、用户群细分、用户行为分析并结合客户历史信息建立了预警模型,通过对营销效果的有效评....
的头像 CTI论坛 发表于 11-20 15:22 690次 阅读
普强信息金融新生态智能语音解决方案

求简单经济的语音识别方案

我想做个智能LED灯,只要识别简单的“开”“关”语音即可,求各位大佬推荐个方案 ...
发表于 11-19 09:04 138次 阅读
求简单经济的语音识别方案

语音识别是什么

语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来1....
的头像 发烧友学院 发表于 11-18 09:28 709次 阅读
语音识别是什么

扬声器保护电路分享

发表于 11-16 16:26 260次 阅读
扬声器保护电路分享

频谱分析仪N9340B上的扬声器如何激活

你好先生和夫人我想问一下如何激活频谱分析仪N9340B上的扬声器图标。 每次我使用频谱分析仪N9340B进行场强测量时,即使我尝...
发表于 11-15 16:36 104次 阅读
频谱分析仪N9340B上的扬声器如何激活

不再只为听到更大的声音,意大利AD-F10测评

Ernst W. Siemens (Siemens & Halske公司创始人)于1874年1月20日,申请了电动式扬声器原型专利,让带支撑系统的音圈处于磁场...
发表于 11-05 17:05 2396次 阅读
不再只为听到更大的声音,意大利AD-F10测评