电子发烧友网 > 人工智能 > 正文

全球语音识别技术发展有四大问题待解决

2018年01月31日 19:31 次阅读

  语音识别的意思是将人说话的内容和意思转换为计算机可读的输入,例如按键、二进制编码或者字符序列等。与说话人的识别不同,后者主要是识别和确认发出语音的人而非其中所包含的内容。语音识别的目的就是让机器听懂人类口述的语言,包括了两方面的含义:第一是逐字逐句听懂而不是转化成书面的语言文字;第二是对口述语言中所包含的命令或请求加以领会,做出正确回应,而不仅仅只是拘泥于所有词汇的正确转换。

  自从1952年,AT&TBell实验室的Davis等人研制了第一个可十个英文数字的特定人语音增强系统一Audry系统1956年,美国普林斯顿大学RCA实验室的Olson和Belar等人研制出能10个单音节词的系统,该系统采用带通滤波器组获得的频谱参数作为语音增强特征。1959年,Fry和Denes等人尝试构建音素器来4个元音和9个辅音,并采用频谱分析和模式匹配进行决策。这就大大提高了语音识别的效率和准确度。从此计算机语音识别的受到了各国科研人员的重视并开始进入语音识别的研究。60年代,苏联的MaTIn等提出了语音结束点的端点检测,使语音识别水平明显上升;Vintsyuk提出了动态编程,这一提法在以后的识别中不可或缺。60年代末、70年代初的重要成果是提出了信号线性预测编码(LPC)技术和动态时间规整(DTW)技术,有效地解决了语音信号的特征提取和不等长语音匹配问题;同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。语音识别技术与语音合成技术结合使人们能够摆脱键盘的束缚,取而代之的是以语音输入这样便于使用的、自然的、人性化的输入方式,它正逐步成为信息技术中人机接口的关键技术。

  一:语音识别技术发展现状-语音识别系统的分类

  语音识别系统可以根据对输入语音的限制加以分类。如果从说话者与识别系统的相关性考虑,可以将识别系统分为三类:

  (1)特定人语音识别系统。仅考虑对于专人的话音进行识别。

  (2)非特定人语音系统。识别的语音与人无关,通常要用大量不同人的语音数据库对识别系统进行学习。

  (3)多人的识别系统。通常能识别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对要识别的那组人的语音进行训练。

  如果从说话的方式考虑,也可以将识别系统分为三类:

  (1)孤立词语音识别系统。孤立词识别系统要求输入每个词后要停顿。

  (2)连接词语音识别系统。连接词输入系统要求对每个词都清楚发音,一些连音现象开始出现。

  (3)连续语音识别系统。连续语音输入是自然流利的连续语音输入,大量连音和变音会出现。

  如果从识别系统的词汇量大小考虑,也可以将识别系统分为三类:

  (1)小词汇量语音识别系统。通常包括几十个词的语音识别系统。

  (2)中等词汇量的语音识别系统。通常包括几百个词到上千个词的识别系统。

  (3)大词汇量语音识别系统。通常包括几千到几万个词的语音识别系统。随着计算机与数字信号处理器运算能力以及识别系统精度的提高,识别系统根据词汇量大小进行分类也不断进行变化。目前是中等词汇量的识别系统,将来可能就是小词汇量的语音识别系统。这些不同的限制也确定了语音识别系统的困难度。

  二:语音识别技术发展现状-语音识别的方法汇总分析

  目前具有代表性的语音识别方法主要有动态时间规整技术(DTW)、隐马尔可夫模型(HMM)、矢量量化(VQ)、人工神经网络(ANN)、支持向量机(SVM)等方法。

  动态时间规整算法(Dynamic TIme Warping,DTW)是在非特定人语音识别中一种简单有效的方法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别技术中出现较早、较常用的一种算法。在应用DTW算法进行语音识别时,就是将已经预处理和分帧过的语音测试信号和参考语音模板进行比较以获取他们之间的相似度,按照某种距离测度得出两模板间的相似程度并选择最佳路径。

  隐马尔可夫模型(HMM)是语音信号处理中的一种统计模型,是由Markov链演变来的,所以它是基于参数模型的统计识别方法。由于其模式库是通过反复训练形成的与训练输出信号吻合概率最大的最佳模型参数而不是预先储存好的模式样本,且其识别过程中运用待识别语音序列与HMM参数之间的似然概率达到最大值所对应的最佳状态序列作为识别输出,因此是较理想的语音识别模型。

  矢量量化(Vector QuanTIzaTIon)是一种重要的信号压缩方法。与HMM相比,矢量量化主要适用于小词汇量、孤立词的语音识别中。其过程是将若干个语音信号波形或特征参数的标量数据组成一个矢量在多维空间进行整体量化。把矢量空间分成若干个小区域,每个小区域寻找一个代表矢量,量化时落入小区域的矢量就用这个代表矢量代替。矢量量化器的设计就是从大量信号样本中训练出好的码书,从实际效果出发寻找到好的失真测度定义公式,设计出最佳的矢量量化系统,用最少的搜索和计算失真的运算量实现最大可能的平均信噪比。

  在实际的应用过程中,人们还研究了多种降低复杂度的方法,包括无记忆的矢量量化、有记忆的矢量量化和模糊矢量量化方法。

  人工神经网络(ANN)是20世纪80年代末期提出的一种新的语音识别方法。其本质上是一个自适应非线性动力学系统,模拟了人类神经活动的原理,具有自适应性、并行性、鲁棒性、容错性和学习特性,其强大的分类能力和输入—输出映射能力在语音识别中都很有吸引力。其方法是模拟人脑思维机制的工程模型,它与HMM正好相反,其分类决策能力和对不确定信息的描述能力得到举世公认,但它对动态时间信号的描述能力尚不尽如人意,通常MLP分类器只能解决静态模式分类问题,并不涉及时间序列的处理。尽管学者们提出了许多含反馈的结构,但它们仍不足以刻画诸如语音信号这种时间序列的动态特性。由于ANN不能很好地描述语音信号的时间动态特性,所以常把ANN与传统识别方法结合,分别利用各自优点来进行语音识别而克服HMM和ANN各自的缺点。近年来结合神经网络和隐含马尔可夫模型的识别算法研究取得了显著进展,其识别率已经接近隐含马尔可夫模型的识别系统,进一步提高了语音识别的鲁棒性和准确率。

  支持向量机(Support vector machine)是应用统计学理论的一种新的学习机模型,采用结构风险最小化原理(Structural Risk Minimization,SRM),有效克服了传统经验风险最小化方法的缺点。兼顾训练误差和泛化能力,在解决小样本、非线性及高维模式识别方面有许多优越的性能,已经被广泛地应用到模式识别领域。

  三:语音识别技术发展现状-国外研究

  语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,它是第一个可以识别十个英文数字的语音识别系统。

  但真正取得实质性进展,并将其作为一个重要的课题开展研究则是在60年代末70年代初。这首先是因为计算机技术的发展为语音识别的实现提供了硬件和软件的可能,更重要的是语音信号线性预测编码(LPC)技术和动态时间规整(DTW)技术的提出,有效的解决了语音信号的特征提取和不等长匹配问题。这一时期的语音识别主要基于模板匹配原理,研究的领域局限在特定人,小词汇表的孤立词识别,实现了基于线性预测倒谱和DTW技术的特定人孤立词语音识别系统;同时提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。

  随着应用领域的扩大,小词汇表、特定人、孤立词等这些对语音识别的约束条件需要放宽,与此同时也带来了许多新的问题:第一,词汇表的扩大使得模板的选取和建立发生困难;第二,连续语音中,各个音素、音节以及词之间没有明显的边界,各个发音单位存在受上下文强烈影响的协同发音(Co-articulation)现象;第三,非特定人识别时,不同的人说相同的话相应的声学特征有很大的差异,即使相同的人在不同的时间、生理、心理状态下,说同样内容的话也会有很大的差异;第四,识别的语音中有背景噪声或其他干扰。因此原有的模板匹配方法已不再适用。

  实验室语音识别研究的巨大突破产生于20世纪80年代末:人们终于在实验室突破了大词汇量、连续语音和非特定人这三大障碍,第一次把这三个特性都集成在一个系统中,比较典型的是卡耐基梅隆大学(CarnegieMellonUniversity)的Sphinx系统,它是第一个高性能的非特定人、大词汇量连续语音识别系统。

  这一时期,语音识别研究进一步走向深入,其显著特征是HMM模型和人工神经元网络(ANN)在语音识别中的成功应用。HMM模型的广泛应用应归功于AT&TBell实验室Rabiner等科学家的努力,他们把原本艰涩的HMM纯数学模型工程化,从而为更多研究者了解和认识,从而使统计方法成为了语音识别技术的主流。

  统计方法将研究者的视线从微观转向宏观,不再刻意追求语音特征的细化,而是更多地从整体平均(统计)的角度来建立最佳的语音识别系统。在声学模型方面,以Markov链为基础的语音序列建模方法HMM(隐式Markov链)比较有效地解决了语音信号短时稳定、长时时变的特性,并且能根据一些基本建模单元构造成连续语音的句子模型,达到了比较高的建模精度和建模灵活性。在语言层面上,通过统计真实大规模语料的词之间同现概率即N元统计模型来区分识别带来的模糊音和同音词。另外,人工神经网络方法、基于文法规则的语言处理机制等也在语音识别中得到了应用。

  20世纪90年代前期,许多著名的大公司如IBM、苹果、AT&T和NTT都对语音识别系统的实用化研究投以巨资。语音识别技术有一个很好的评估机制,那就是识别的准确率,而这项指标在20世纪90年代中后期实验室研究中得到了不断的提高。比较有代表性的系统有:IBM公司推出的ViaVoice和DragonSystem公司的NaturallySpeaking,Nuance公司的NuanceVoicePlatform语音平台,Microsoft的Whisper,Sun的VoiceTone等。

  其中IBM公司于1997年开发出汉语ViaVoice语音识别系统,次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统ViaVoice‘98。它带有一个32,000词的基本词汇表,可以扩展到65,000词,还包括办公常用词条,具有“纠错机制”,其平均识别率可以达到95%。该系统对新闻语音识别具有较高的精度,是目前具有代表性的汉语连续语音识别系统。

  四:语音识别技术发展现状-国内研究

  我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。

  清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串)。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求。

  中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。

  五:语音识别技术发展现状-当前亟待解决的问题

  语音识别系统的性能受到许多因素的影响,包括不同说话人的发音方式、说话方式、环境噪音、传输信道衰落等等。

  具体要解决的问题有四点:

  ①增强系统的鲁棒性,也就是说如果条件状况变得与训练时很不相同,系统的性能下降不能是突变的。

  ②增加系统的适应能力,系统要能稳定连续的适应条件的变化,因为说话人存在着年龄、性别、口音、语速、语音强度、发音习惯等方面的差异。所以,系统应该有能力排除掉这些差异。达到对语音的稳定识别。

  ③寻求更好的语言模型,系统应该在语言模型中得到尽可能多的约束,从而解决由于词汇量增长所带来的影响。

  ④进行动力学建模,语音识别系统提前假定片段和单词是相互独立的,但实际上词汇和音素的线索要求对反映了发声器官运动模型特点的整合。所以,应该进行动力学建模,从而将这些信息整合到语音识别系统中去。

  六:语音识别技术发展现状-语音识别系统的最新发展

  语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统已经完全可以制成专用芯片,大量生产。在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交换机、电话机、手机已经包含了语音识别拨号功能、语音记事本、语音智能玩具等产品,同时也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息。调查统计表明,多达85%以上的人对语音识别的信息查询服务系统的性能表示满意。可以预测,在近5年内,语音识别系统的应用将更加广泛,各种各样的语音识别系统产品将不断出现在市场上。语音识别技术在人工邮件分拣中的作用也日益显现,发展前景诱人。一些发达国家的邮政部门已经使用了这一系统,语音识别技术逐渐成为邮件分拣的新技术。它可以克服手工分拣单纯依靠分拣员记忆力的不足,解决人员成本过高的问题,提高邮件处理的效率和效益。就教育领域来讲,语音识别技术的最直接的应用就是帮助用户更好地练习语言技巧。

  语音识别技术的另一个发展分支就是电话语音识别技术的发展,贝尔实验室是这方面的先驱,电话语音识别技术将能够实现电话查询、自动接线以及一些专门业务如旅游信息等的操作。银行应用了语音理解技术的声讯查询系统后,可不分昼夜地为客户提供二十四小时的电话银行理财服务。而证券业方面,若是采用电话语音识别声讯系统的话,用户想查询行情便可以直接讲出股票名称或代码,而系统确认用户的要求后,会自动读出最新的股票价,这将大大方便用户。目前在114查号台还有大量的人工服务,如果采用语音技术,就可让计算机自动接听用户的需要,然后回放查询的电话号码,从而节约了人力资源。

技术专区

关注电子发烧友微信

有趣有料的资讯及技术干货

下载发烧友APP

打造属于您的人脉电子圈

关注发烧友课堂

锁定最新课程活动及技术直播
收藏 人收藏
分享:

评论

相关推荐

R-Car H2主要特性和系统框图_汽车ADAS...

Renesas公司的R-Car H2是基于ARM® Cortex™A-15四核配置和big.LITT...

发表于 2018-04-14 17:24 37次阅读
R-Car H2主要特性和系统框图_汽车ADAS...

如何集成图灵机器人,简单实现语音聊天

图灵机器人有三个基本功能: (1)语音识别:将语音识别成相应的文本。 (2)语义理解:将文本识别成领...

发表于 2018-04-13 09:49 148次阅读
如何集成图灵机器人,简单实现语音聊天

自动驾驶、语音识别、晋升为热度最高职位

人工智能在经历了迅速发展之后,AI 领域的人才需求也发生调整。近日,猎聘联合 GMIC 发布了《 2...

发表于 2018-04-12 15:38 258次阅读
自动驾驶、语音识别、晋升为热度最高职位

深度学习如何确定最佳深度?

确定最佳深度可以降低运算成本,同时可以进一步提高精度。针对深度置信网络深度选择的问题,文章分析了通过...

发表于 2018-04-04 15:46 136次阅读
深度学习如何确定最佳深度?

语音识别在中国成身份认证的新方式

中国已使用面部识别技术来防止卫生纸被偷盗和乱穿马路行为。但很多业内表示,语音识别是更好、更便宜的身份...

发表于 2018-03-27 23:52 67次阅读
语音识别在中国成身份认证的新方式

Lumin OS、SDK和开发者端口的解读

在某一时刻,我们现在知道的Windows计算机是由MS-DOS操作系统组成的,Windows是一个在...

发表于 2018-03-26 16:58 540次阅读
Lumin OS、SDK和开发者端口的解读

深度学习如何在物联网领域大展身手

智能城市服务跨越多个物联网领域,如交通、能源、农业等。智慧城市的一个重要问题是预测群体移动模式,So...

发表于 2018-03-26 11:20 117次阅读
深度学习如何在物联网领域大展身手

人工智能操作系统和自动驾驶:AI就是最核心的目标

随着美国总统特朗普在白宫签署备忘录,将对600亿美元的中国进口商品征收大规模关税,中国商务部同样给出...

发表于 2018-03-25 07:19 749次阅读
人工智能操作系统和自动驾驶:AI就是最核心的目标

中兴通讯推出AI机顶盒

中兴通讯股份有限公司,推出其首款智能AI机顶盒S100。该机顶盒不仅能为用户打造极致的视听盛宴,还可...

发表于 2018-03-22 15:08 642次阅读
中兴通讯推出AI机顶盒

亚马逊Alexa的深度学习与语音识别的核心技术原...

亚马逊Alexa首席科学家Nikko Strom博士是语音识别领域级别最高的牛人。1997 年从瑞典...

发表于 2018-03-21 15:46 732次阅读
亚马逊Alexa的深度学习与语音识别的核心技术原...

人工智能就在你身边_你发现了吗

这是最好的AI时代。它潜伏在我们周围,为现代生活提供便利。语音识别、刷脸解锁、私人助手、图像美化、推...

发表于 2018-03-21 07:19 65次阅读
人工智能就在你身边_你发现了吗

极限元语音导航引领企业呼叫中心更加智能化

随着社会经济的发展,客户对企业服务也提出了更高的要求,传统的呼叫中心电话导航已经不能满足客户需求,企...

发表于 2018-03-20 17:21 620次阅读
极限元语音导航引领企业呼叫中心更加智能化

人工智能正在成为新的时代动力_未来100年改变世...

微软首席科学家黄学东(Xuedong Huang)表示,实际上,深度学习(即电脑从数据集学习到执行功...

发表于 2018-03-20 03:24 337次阅读
人工智能正在成为新的时代动力_未来100年改变世...

专家认为有意识的人工智能兴起还需要几十年

人们经常用与人工智能相关的术语来表示真正的人工智能。在讨论人工智能时,新闻报道会将机器学习或深度学习...

发表于 2018-03-20 01:59 101次阅读
专家认为有意识的人工智能兴起还需要几十年

一种改进的前馈序列记忆神经网络结构

最早提出的FSMN的模型结构如图1(a)所示,其本质上是一个前馈全连接神经网络,通过在隐层旁添加一些...

发表于 2018-03-19 16:26 806次阅读
一种改进的前馈序列记忆神经网络结构

这50家投资机构是人工智能领域最活跃的份子

近年来,国家鼓励股权投资助力实体经济发展,创新创业发展新经济,再加之二级市场震荡,高净值客户纷纷涌现...

发表于 2018-03-16 07:18 228次阅读
这50家投资机构是人工智能领域最活跃的份子

智能家居崛起是因为人工智能吗?智能家居的核心是什...

人工智能技术赋予了家用电器更多的功能与活力,人脸识别语音识别等技术的植入,让智能电视有了更多锦上添花...

发表于 2018-03-14 16:25 3116次阅读
智能家居崛起是因为人工智能吗?智能家居的核心是什...

谷歌前工程师开发实时AI语音APP

在2018年移动世界大会上拥有三层展台的数十亿美元技术巨头中,有一对企业家在谈论人工智能方面的突破,...

发表于 2018-03-13 18:30 123次阅读
谷歌前工程师开发实时AI语音APP

全新奥迪A6的七大核心技术解析

透过全新奥迪A6技术盘点,我想我应该解答了不少你心中的疑问。没错,它更轻、更运动,也更有科技感,甚至...

发表于 2018-03-11 01:44 396次阅读
全新奥迪A6的七大核心技术解析

分析一个案例:MSP432 MCU语音识别器库

感应应用的物理体积越来越小。无论您是设计出需要在工厂中收集的远程工业传感器节点(图1),抑或是下一个...

发表于 2018-03-08 09:18 1885次阅读
分析一个案例:MSP432 MCU语音识别器库

一个改变人机交互方式的全新切入点:语音接口

发表于 2018-03-06 18:25 594次阅读
一个改变人机交互方式的全新切入点:语音接口

为什么不看好科大讯飞

从2013年来,资本市场对于科大讯飞未来的发展前景充满了期待,特别是在“中国移动”入股以后,普遍认为...

发表于 2018-03-05 14:16 1065次阅读
为什么不看好科大讯飞

语音市场正在迅猛成长 正在改变旅游产业

EyeforTravel最新报告《Can Voice Change the Way We Trave...

发表于 2018-03-01 08:41 95次阅读
语音市场正在迅猛成长 正在改变旅游产业

一文了解人机交互中语音识别技术

语音控制和操作的游戏和玩具、帮助残疾人的语音识别系统、车辆行驶中一些非关键功能的语音控制,如车载交通...

发表于 2018-02-28 08:54 1549次阅读
一文了解人机交互中语音识别技术

未来智能家居的“Dreaam House”

而能让整个家庭都实现智能化,每样东西都能与你的各种终端设备紧密相连,这就依靠了英特尔® 物联网技术开...

发表于 2018-02-23 10:54 1176次阅读
未来智能家居的“Dreaam House”

生活中的七个语音识别经典应用

随着物联网的发展,对家庭电器的控制将会有更多的发展,而语音作为一种自然简单的方法将是一种有效便捷的控...

发表于 2018-02-19 05:10 45次阅读
生活中的七个语音识别经典应用

人工智能已在身边并渗透到生产和生活的各个领域,不...

早上,被智能音箱叫醒,同时还提醒你上午要给朋友回电话;去上班,用导航地图走了避免拥堵的路线;路上,拍...

发表于 2018-02-06 10:46 1622次阅读
人工智能已在身边并渗透到生产和生活的各个领域,不...

关于多语言及跨语言的语音识别技术叙述

在大多数传统的自动语音识别(automatic speech recognition,ASR)系统中...

发表于 2018-02-04 10:19 223次阅读
关于多语言及跨语言的语音识别技术叙述

2017年终解读:语音识别技术今年只走了一半的路

这一年的人工智能大潮,无疑让更多人关注科大讯飞,关心在这样的潮流里,一家深耕语音识别的公司如何能获得...

发表于 2018-02-04 10:10 578次阅读
2017年终解读:语音识别技术今年只走了一半的路

解析ARM语音识别系统

语音辨认单元担任辨认操作人员的操作口令;声强检测单元担任检测声强巨细并以此作为判别是哪台从设备操作人...

发表于 2018-02-02 20:30 479次阅读
解析ARM语音识别系统

小米电视4A核心技术之语音识别浅析

大屏电视成流量入口,语音识别成核心竞争力。近年来,大屏智能电视市场销量持续走俏,基于语音识别功能的互...

发表于 2018-02-02 20:27 718次阅读
小米电视4A核心技术之语音识别浅析

互联网电视约架“语音识别” 技术端实测谁更靠谱

2017年还没有过半,互联网品牌电视纷纷召开发布会,推广新品。这一年,他们都围绕了一个共同点去推广—...

发表于 2018-02-02 20:25 234次阅读
互联网电视约架“语音识别” 技术端实测谁更靠谱

智能家居可借语音识别技术打开壁垒

在新一代的消费者看来,除去环保和生活方式等的重点,家居中的“科技感”已经成为新的关注点,在家庭生活中...

发表于 2018-02-01 18:23 192次阅读
智能家居可借语音识别技术打开壁垒

国内智能语音识别产业的增长,可能源于三大技术突破

据行业预测,中国智能语音产业规模将达到101.4亿元。而智能语音产业的快速发展,将带动智能家居、智能...

发表于 2018-02-01 18:19 227次阅读
国内智能语音识别产业的增长,可能源于三大技术突破

从图像理解到语音识别 是如何研究和量化机器学习的

深度学习需要经过多层甚至数百层的处理过程,机器学习也会在不同的GPU,进行跨机器、跨设备处理,这就需...

发表于 2018-02-01 18:09 174次阅读
从图像理解到语音识别 是如何研究和量化机器学习的

基于AVR的语音识别助老助残室内行走服务系统设计...

全世界60岁以上的老年人口已达到6亿左右,人口老龄化已成为世界范围的重大社会问题。我国60岁及以上老...

发表于 2018-02-01 01:04 207次阅读
基于AVR的语音识别助老助残室内行走服务系统设计...

基于STM32实现孤立词语音识别系统

语音识别是机器通过识别和理解过程把人类的语音信号转变为相应文本或命令的技术,其根本目的是研究出一种具...

发表于 2018-01-31 19:23 508次阅读
基于STM32实现孤立词语音识别系统

10种常见的软件体系架构模式分析以及它们的用法、...

架构模式是一个通用的、可重用的解决方案,用于在给定上下文中的软件体系结构中经常出现的问题。架构模式与...

发表于 2018-01-31 12:39 868次阅读
10种常见的软件体系架构模式分析以及它们的用法、...

2018年电子展望浓缩的十大关键词

2018年已经到来,在新的一年里科技圈又将从何处去发展成为各大企业关注的目标,通过市场的调查和企业的...

发表于 2018-01-31 11:28 215次阅读
2018年电子展望浓缩的十大关键词

简要介绍语音识别技术在各领域的应用

语音识别作为信息技术中一种人机接口的关键技术,具有重要的研究意义和广泛的应用价值。介绍了语音识别技术...

发表于 2018-01-31 05:25 603次阅读
简要介绍语音识别技术在各领域的应用

美高森美推出大幅提升语音识别率的AcuEdge开...

语音识别服务需求水涨船高。 随着亚马逊(Amazon)Alexa,以及谷歌(Google)所推出的O...

发表于 2018-01-30 10:18 144次阅读
美高森美推出大幅提升语音识别率的AcuEdge开...

大联大品佳推出基于新唐科技ISD9160+Cyb...

致力于亚太地区市场的领先半导体元器件分销商---大联大控股宣布,其旗下品佳推出基于新唐科技(Nuvo...

发表于 2018-01-30 10:09 336次阅读
大联大品佳推出基于新唐科技ISD9160+Cyb...

基于Cortex-M处理器上实现高精度关键词语音...

我们可以对神经网络架构进行优化,使之适配微控制器的内存和计算限制范围,并且不会影响精度。我们将在本文...

发表于 2018-01-30 10:01 252次阅读
基于Cortex-M处理器上实现高精度关键词语音...

我们所说的“语音”是什么意思?一文读懂语音识别技...

基于语音的技术将对许多行业产生巨大影响,在短短两年内,预计50%的搜索将基于语音技术。 该项技术的普...

发表于 2018-01-26 11:16 596次阅读
我们所说的“语音”是什么意思?一文读懂语音识别技...

语音识别何时能突破智能音箱框架

以 Amazon Alexa、Google Assistants、苹果 Siri 为代表的语音助理...

发表于 2018-01-18 11:40 116次阅读
语音识别何时能突破智能音箱框架

家电遥控器中的那些语音识别技术盘点

介绍一种适合家电遥控器应用的语音识别算法,该算法使用双模块和两级端点检测方法,能有效地提高识别和稳健...

发表于 2018-01-13 08:08 1484次阅读
家电遥控器中的那些语音识别技术盘点

人机交互的方式有哪些_未来的人机交互方式浅谈

本文主要介绍了人机交互的方式有哪些_未来的人机交互方式浅谈。人机交互技术是指通过计算机输入、输出设备...

发表于 2018-01-12 16:50 2438次阅读
人机交互的方式有哪些_未来的人机交互方式浅谈

Synaptics AudioSmart远场语音...

Synaptics AudioSmart远场语音技术将带来性能无与伦比的两麦克风和四麦克风支持亚马逊...

发表于 2018-01-10 14:47 1349次阅读
Synaptics AudioSmart远场语音...

2017中国生物识别行业发展盘点回顾

(1)人脸及姿态、车牌车型、人车行为模式等数据的大规模网络采集; (2)深度学习训练CV算法; ...

发表于 2018-01-05 11:24 1914次阅读
2017中国生物识别行业发展盘点回顾

智能硬件需要哪些技术?学智能硬件必须掌握什么技能...

智能硬件需要哪些技术?学智能硬件必须掌握什么技能?在铺天盖地的“互联网+”潜移默化影响下,越来越多的...

发表于 2018-01-03 16:04 552次阅读
智能硬件需要哪些技术?学智能硬件必须掌握什么技能...

语音识别技术的发展及难点分析

与机器进行语音交流,让它听明白你在说什么。语音识别技术将人类这一曾经的梦想变成了现实。语音识别就好比...

发表于 2018-01-02 18:44 1052次阅读
语音识别技术的发展及难点分析

基于模糊神经网络的语音识别系统

语音识别技术是近年来高速发展的一项技术,由于其重要的理论价值与广阔的应用前景,受到人们的广泛重视。语...

发表于 2017-12-31 12:13 599次阅读
基于模糊神经网络的语音识别系统

对于谷歌应用传统的自动语音识别(ASR)系统的解...

目前,谷歌的各种语音搜索应用还在使用传统的自动语音识别(ASR)系统,它包括一个包括声学模型(AM ...

发表于 2017-12-31 01:22 1670次阅读
对于谷歌应用传统的自动语音识别(ASR)系统的解...

什么是智能音箱_ai音箱都有什么功能

本文主要介绍了智能音箱是什么?智能音箱究竟都有些什么功能呢?智能音箱的语音交互精准性,响应速度,复杂...

发表于 2017-12-29 13:48 1927次阅读
什么是智能音箱_ai音箱都有什么功能

几款智能音箱价格及性能对比_天猫精灵_京东叮咚

本文主要对几款智能音箱价格及性能进行了对比,智能语音音箱作为智能家庭中一个新的选择,新的接入口,各个...

发表于 2017-12-29 11:56 1119次阅读
几款智能音箱价格及性能对比_天猫精灵_京东叮咚

叮咚智能音箱哪款性价比高_叮咚智能音箱几款价格及...

本文主要介绍了叮咚智能音箱哪款性价比高_叮咚智能音箱几款价格及性能对比,叮咚A3灵动版智能音箱;叮咚...

发表于 2017-12-29 11:38 2056次阅读
叮咚智能音箱哪款性价比高_叮咚智能音箱几款价格及...

科大讯飞的叮咚智能音箱结构组成_DingDong...

本文介绍了科大讯飞的叮咚智能音箱结构组成_DingDong智能音箱大拆解。东芝THGBMBG5D1K...

发表于 2017-12-29 10:44 2487次阅读
科大讯飞的叮咚智能音箱结构组成_DingDong...

叮咚TOP智能音箱开箱评测_用语音完成交互,这是...

本文对叮咚TOP智能音箱开箱进行了评测,外观评测:简洁、创意,光圈增添了生命力;交互&APP:语音识...

发表于 2017-12-29 10:11 608次阅读
叮咚TOP智能音箱开箱评测_用语音完成交互,这是...

叮咚智能音箱联网教程_叮咚智能音箱联不上网解决办...

本文主要介绍了叮咚智能音箱联网教程_叮咚智能音箱联不上网解决办法。DingDong是一款智能wifi...

发表于 2017-12-29 09:42 5078次阅读
叮咚智能音箱联网教程_叮咚智能音箱联不上网解决办...

长虹发布AI 3.0 引领电视行业跨入AI3....

人工智能电视自诞生业界就存在这很大的争议,人工智能电视这词还只是一个很模糊的概念,范畴还无法确定。据...

发表于 2017-12-26 16:02 202次阅读
长虹发布AI 3.0  引领电视行业跨入AI3....

终端应用提速 进一步提升智能语音交互能力

为了提升未来的产业竞争力和话语权,国家将大力支持新一代口语化语音识别框架的创新技术,其中语音识别为代...

发表于 2017-12-21 16:33 111次阅读
终端应用提速 进一步提升智能语音交互能力

基于LD3220的语音识别的模块进行DIY的小车

基于LD3220的语音识别小车。

发表于 2017-12-19 17:03 2587次阅读
基于LD3220的语音识别的模块进行DIY的小车

语音识别发展的下一个蓝海市场:语义识别

在AI技术发展的过程中自然语言处理技术已经成了最重要的一大体系,随着年代的定义越加细分化语言识别逐渐...

发表于 2017-12-16 08:53 570次阅读
语音识别发展的下一个蓝海市场:语义识别

基于LD3320的语音识别智能垃圾桶设计

本设计针对当今智能垃圾桶探测距离的不足,设计基于LD3320的语音识别智能垃圾桶,利用超声波测距算法...

发表于 2017-12-15 17:15 1837次阅读
基于LD3320的语音识别智能垃圾桶设计

全球最牛语音识别技术的公司有哪些

国外Google、Apple、 MSRA语音识别的基础研究做得比较久,技术上比较好。国内专门做语音识...

发表于 2017-12-14 17:11 6167次阅读
全球最牛语音识别技术的公司有哪些

国内语音识别公司有哪些

语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分...

发表于 2017-12-14 15:59 2738次阅读
国内语音识别公司有哪些

浅谈语音识别技术的发展趋势与应用前景

本文主要描述了语音识别技术的定义、语音识别技术实现方式、语音识别技术发展遇到的困难、语音识别技术发展...

发表于 2017-12-14 08:43 4104次阅读
浅谈语音识别技术的发展趋势与应用前景

国内语音识别技术上市公司汇总_语音识别技术现状_...

语音识别技术的发展已经普遍的存在了我们生活当中,本文主要详细介绍了语音识别技术现状,语音识别原理应用...

发表于 2017-12-13 18:04 928次阅读
国内语音识别技术上市公司汇总_语音识别技术现状_...

Goolge着手医疗语音识别 将医病对话转为医疗...

Google试图藉由旗下数码助理Google Assistant、数码家庭助理Google Home...

发表于 2017-12-13 11:13 101次阅读
Goolge着手医疗语音识别 将医病对话转为医疗...

15位权威专家深度解析:2018年物联网需要关注...

毋庸置疑,物联网是 2017 年最受关注的技术之一。物联网在短短几年内就对各个行业和业务功能产生了明...

发表于 2017-12-13 10:26 2986次阅读
15位权威专家深度解析:2018年物联网需要关注...

中国引领人工智能弯道超车,语音识别和自动驾驶站稳...

当前,全球掀起了人工智能的研究浪潮,中国政府正加快人工智能的布局。与此同时,在政策支持和市场需求之下...

发表于 2017-12-02 09:37 236次阅读
中国引领人工智能弯道超车,语音识别和自动驾驶站稳...

基于嵌入式微处理器的语音识别模块设计实现及应用...

服务机器人以服务为目的,因此人们需要一种更方便、更自然、更加人性化的方式与机器人交互,而不再满足于复...

发表于 2017-12-01 16:42 278次阅读
 基于嵌入式微处理器的语音识别模块设计实现及应用...

语音识别系统中增加图像识别技术的设计应用

语音识别是机器自动语音识别(automatic speech recognition by mach...

发表于 2017-12-01 14:52 426次阅读
语音识别系统中增加图像识别技术的设计应用

创新探究:智能对话的连接与交互案例分析

自然语言理解是人工智能的 AI-Hard 问题 [1],也是目前智能对话交互的核心难题。机器要理解自...

发表于 2017-12-01 13:38 2090次阅读
创新探究:智能对话的连接与交互案例分析

三星收购人工智能Fluenty公司,弥补AI领域...

为了进一步提升自己的AI平台Bixby的技术水平,三星电子近日收购了专门从事对话式人工智能(AI)的...

发表于 2017-11-30 16:19 160次阅读
三星收购人工智能Fluenty公司,弥补AI领域...

基于AWS EC2 F1实例的自动语音识别加速解...

亚马逊AWS EC2是一种灵活的Web服务,可以在云服务器中提供安全并且大小可调的计算容量,该服务为...

发表于 2017-11-17 06:57 3039次阅读
基于AWS EC2 F1实例的自动语音识别加速解...

单片机语音识别原理

语音识别是一门交叉学科。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来1...

发表于 2017-11-14 14:48 694次阅读
单片机语音识别原理

服务机器人国内市场规模预测

随着机器人、VR/AR、和无人驾驶的发展,Visual Positioning System(VPS...

发表于 2017-11-02 08:55 6621次阅读
服务机器人国内市场规模预测

长虹声纹识别技术推动家电产业向高阶形态发展

随着互联网的普及,语音技术已经渗透至大众市场。其中最为常见的就是微信语音,通过微信客户端,我们可以将...

发表于 2017-10-25 18:18 180次阅读
长虹声纹识别技术推动家电产业向高阶形态发展

Synaptics语音及音频技术,推动下一次人机...

在前几年Synaptics只有一个支柱技术,即电容式传感技术。最早应用在笔记本电脑中,三年前收购了R...

发表于 2017-10-24 15:42 320次阅读
Synaptics语音及音频技术,推动下一次人机...

为获取AI芯片,三星第二笔国外投资花落中国企业

深鉴科技主要研究当下最热门的人工智能中的分支领域——深度学习处理器和编译器技术。深鉴科技研发的神经网...

发表于 2017-10-24 15:27 223次阅读
为获取AI芯片,三星第二笔国外投资花落中国企业

当AI的情商超过了人类,距离人类被取代的时间不远...

阿拉萨雷拉的注意力始终集中在情商算法上,因为这是其初创公司Inbot的主要业务。随着对这些算法的研究...

发表于 2017-10-17 16:25 220次阅读
当AI的情商超过了人类,距离人类被取代的时间不远...

从应用、算法、芯片角度了解语音识别技术

人工智能产业链由基础层、技术层与应用层构成。同样,智能语音识别亦由这三层组成,本文从语音识别的商业化...

发表于 2017-10-17 13:01 616次阅读
从应用、算法、芯片角度了解语音识别技术

亚马逊无人机又出新招,人脸+语音识别不够,还能随...

从亚马逊逐渐显露的无人机整体规划来看,对症下药、步步为营,尽可能绕开现有技术限制的设计着实不像一场吸...

发表于 2017-10-12 12:44 237次阅读
亚马逊无人机又出新招,人脸+语音识别不够,还能随...

亚马逊alexa语音助手识别还需要建立一个语音账...

智能语音助手和智能音箱成为时下两大热点技术领域,而谷歌(微博)和亚马逊成为这一市场最具优势的两家企业...

发表于 2017-10-12 09:10 165次阅读
亚马逊alexa语音助手识别还需要建立一个语音账...

服务机器人何时才能脱离“缺陷”的牢笼

相较于工业机器人,服务机器人在众多应用场景中与人类的互动方式更多样,面对的环境因素也就更为复杂,这也...

发表于 2017-09-29 14:08 280次阅读
服务机器人何时才能脱离“缺陷”的牢笼

市场新需求,伴读机器人刮起新浪潮

如今,在市场上,一种新的儿童伴读机器人开始掀起新热潮,或将成为本年度的科技“新星”。教育领域与机器人...

发表于 2017-09-28 13:49 359次阅读
市场新需求,伴读机器人刮起新浪潮

人工智能其实不算是一个新的话题

人工智能(AI)其实不算是一个新的话题,其实从上世纪40年代就开始引起广泛关注。而对于普通人来说,各...

发表于 2017-09-27 06:23 3021次阅读
人工智能其实不算是一个新的话题

“OK,谷歌洗碗”谷歌语音识别一句话启动洗碗机

据外媒报道,谷歌宣布,其语音助手即Google Assistant将在今年与各种家电设备整合在一起。

发表于 2017-08-31 00:07 323次阅读
“OK,谷歌洗碗”谷歌语音识别一句话启动洗碗机

MEMS麦克风技术满足音量市场的性能要求

MEMS麦克风含一个可移动的膜片和静态背板,采用常见的包括沉积和选择性蚀刻的工艺制作在硅晶圆基板上。...

发表于 2017-08-30 10:37 2048次阅读
MEMS麦克风技术满足音量市场的性能要求

基于新唐I9160FI,N572C072,N570C064语音识别方案。

发表于 2017-08-18 14:02 1066次阅读
基于新唐I9160FI,N572C072,N570C064语音识别方案。

初创公司该怎样在语音识别领域(AI)寻找到自己的乐园?

发表于 2017-07-17 12:59 447次阅读
初创公司该怎样在语音识别领域(AI)寻找到自己的乐园?

辰汉-如何实现服务机器人的运算与控制

发表于 2017-06-09 17:18 659次阅读
辰汉-如何实现服务机器人的运算与控制

辰汉-如何实现服务机器人的运算与控制

发表于 2017-06-05 13:21 551次阅读
辰汉-如何实现服务机器人的运算与控制

从零开始打造智能语音助手

发表于 2017-04-17 17:10 1689次阅读
从零开始打造智能语音助手

ISD9160单芯片非特定人语音识别方案资料下载

发表于 2017-04-08 15:08 1406次阅读
ISD9160单芯片非特定人语音识别方案资料下载

低成本的语音识别方案(离线+在线)整理一下预研思路

发表于 2017-03-20 15:56 8340次阅读
低成本的语音识别方案(离线+在线)整理一下预研思路

谁做过DSP语音识别相关的工程,交流一下!

发表于 2017-03-12 22:05 1134次阅读
谁做过DSP语音识别相关的工程,交流一下!

关于语音采集以及发送的问题想请问下大家,急!!

发表于 2017-03-11 21:09 689次阅读
关于语音采集以及发送的问题想请问下大家,急!!

【Nuvoton ISD9160语音识别试用体验】结项总结 语音识别智能抽屉控制~~~~~~~~~

发表于 2016-12-23 09:19 2638次阅读
【Nuvoton ISD9160语音识别试用体验】结项总结 语音识别智能抽屉控制~~~~~~~~~