侵权投诉

一文读懂人工智能CLDNN网络结构

Duke 2018-08-29 09:49 次阅读

作者:侯艺馨

前言

总结目前语音识别的发展现状,dnn、rnn/lstm和cnn算是语音识别中几个比较主流的方向。2012年,微软邓力和俞栋老师将前馈神经网络FFDNN(Feed Forward Deep Neural Network)引入到声学模型建模中,将FFDNN的输出层概率用于替换之前GMM-HMM中使用GMM计算的输出概率,引领了DNN-HMM混合系统的风潮。长短时记忆网络(LSTM,LongShort Term Memory)可以说是目前语音识别应用最广泛的一种结构,这种网络能够对语音的长时相关性进行建模,从而提高识别正确率。双向LSTM网络可以获得更好的性能,但同时也存在训练复杂度高、解码时延高的问题,尤其在工业界的实时识别系统中很难应用。

回顾近一年语音识别的发展,deep cnn绝对称得上是比较火的关键词,很多公司都在这方面投入了大量研究。其实 CNN 被用在语音识别中由来已久,在 12、13 年的时候 Ossama Abdel-Hamid 就将 CNN 引入了语音识别中。那时候的卷积层和 pooling 层是交替出现的,并且卷积核的规模是比较大的,CNN 的层数也并不多, 主要是用来对特征进行加工和处理,使其能更好的被用于 DNN 的分类。随着CNN在图像领域的发光发热,VGGNet,GoogleNet和ResNet的应用,为CNN在语音识别提供了更多思路,比如多层卷积之后再接 pooling 层,减小卷积核的尺寸可以使得我们能够训练更深的、效果更好的 CNN 模型。

1、语音识别为什么要用CNN

通常情况下,语音识别都是基于时频分析后的语音谱完成的,而其中语音时频谱是具有结构特点的。要想提高语音识别率,就是需要克服语音信号所面临各种各样的多样性,包括说话人的多样性(说话人自身、以及说话人间),环境的多样性等。一个卷积神经网络提供在时间和空间上的平移不变性卷积,将卷积神经网络的思想应用到语音识别的声学建模中,则可以利用卷积的不变性来克服语音信号本身的多样性。从这个角度来看,则可以认为是将整个语音信号分析得到的时频谱当作一张图像一样来处理,采用图像中广泛应用的深层卷积网络对其进行识别。

从实用性上考虑,CNN也比较容易实现大规模并行化运算。虽然在CNN卷积运算中涉及到很多小矩阵操作,运算很慢。不过对CNN的加速运算相对比较成熟,如Chellapilla等人提出一种技术可以把所有这些小矩阵转换成一个大矩阵的乘积。一些通用框架如Tensorflow,caffe等也提供CNN的并行化加速,为CNN在语音识别中的尝试提供了可能。

下面将由“浅”入“深”的介绍一下cnn在语音识别中的应用。

2、CLDNN

提到CNN在语音识别中的应用,就不得不提CLDNN(CONVOLUTIONAL, LONG SHORT-TERM MEMORY,FULLY CONNECTED DEEP NEURAL NETWORKS)[1],在CLDNN中有两层CNN的应用,算是浅层CNN应用的代表。CNN 和 LSTM 在语音识别任务中可以获得比DNN更好的性能提升,对建模能力来说,CNN擅长减小频域变化,LSTM可以提供长时记忆,所以在时域上有着广泛应用,而DNN适合将特征映射到独立空间。而在CLDNN中,作者将CNN,LSTM和DNN串起来融合到一个网络中,获得比单独网络更好的性能。

CLDNN网络的通用结构是输入层是时域相关的特征,连接几层CNN来减小频域变化,CNN的输出灌入几层LSTM来减小时域变化,LSTM最后一层的输出输入到全连接DNN层,目的是将特征空间映射到更容易分类的输出层。之前也有将CNN LSTM和DNN融合在一起的尝试,不过一般是三个网络分别训练,最后再通过融合层融合在一起,而CLDNN是将三个网络同时训练。实验证明,如果LSTM输入更好的特征其性能将得到提高,受到启发,作者用CNN来减小频域上的变化使LSTM输入自适应性更强的特征,加入DNN增加隐层和输出层之间的深度获得更强的预测能力。

2.1 CLDNN网络结构

详解卷积神经网络(CNN)在语音识别中的应用Fig 1. CLDNN Architecture

网络结构图如图1,假设中心帧为,考虑到内容相关性,向左扩展L帧,向右扩展R帧,则输入特征序列为[, . . . ,],特征向量使用的是40维的log梅尔特征。

CNN部分为两层CNN,每层256个feature maps,第一层采用9x9 时域-频域滤波器,第二层为4x3的滤波器。池化层采用max-pooling策略,第一层pooling size是3,第二层CNN不接池化层。

由于CNN最后一层输出维度很大,大小为feature-mapstimefrequency,所以在CNN后LSTM之前接一个线性层来降维,而实验也证明降维减少参数并不会对准确率有太大影响,线性层输出为256维。

CNN后接2层LSTM,每个LSTM层采用832个cells,512维映射层来降维。输出状态标签延迟5帧,此时DNN输出信息可以更好的预测当前帧。由于CNN的输入特征向左扩展了l帧向右扩展了r帧,为了确保LSTM不会看到未来多于5帧的内容,作者将r设为0。最后,在频域和时域建模之后,将LSTM的输出连接几层全连接DNN层。

借鉴了图像领域CNN的应用,作者也尝试了长短时特征,将CNN的输入特征作为短时特征直接输入给LSTM作为部分输入,CNN的输出特征直接作为DNN的部分输入特征。

2.2 实验结果

针对CLDNN结构,我们用自己的中文数据做了一系列实验。实验数据为300h的中文有噪声语音,所有模型输入特征都为40维fbank特征,帧率10ms。模型训练采用交叉熵CE准则,网络输出为2w多个state。由于CNN的输入需要设置l和r两个参数,r设为0,l经过实验10为最优解,后面的实验结果中默认l=10,r=0。

其中LSTM为3层1024个cells,project为512 ,CNN+LSTM和CNN+LSTM+DNN具体的网络参数略有调整,具体如下图,另外还增加一组实验,两层CNN和三层LSTM组合,实验验证增加一层LSTM对结果有提高,但继续增加LSTM的层数对结果没有帮助。

详解卷积神经网络(CNN)在语音识别中的应用Fig 2. CLDNN实验结构 详解卷积神经网络(CNN)在语音识别中的应用Table 1 测试集1结果 详解卷积神经网络(CNN)在语音识别中的应用Table 2 测试集2结果

3、deep CNN

在过去的一年中,语音识别取得了很大的突破。IBM、微软、百度等多家机构相继推出了自己的Deep CNN模型,提升了语音识别的准确率。Residual/Highway网络的提出使我们可以把神经网络训练的更深。尝试Deep CNN的过程中,大致也分为两种策略:一种是HMM 框架中基于 Deep CNN结构的声学模型,CNN可以是VGG、Residual 连接的 CNN 网络结构、或是CLDNN结构。另一种是近两年非常火的端到端结构,比如在 CTC 框架中使用CNN或CLDNN实现端对端建模,或是最近提出的Low Frame Rate、Chain 模型等粗粒度建模单元技术。

对于输入端,大体也分为两种:输入传统信号处理过的特征,采用不同的滤波器处理,然后进行左右或跳帧扩展。

详解卷积神经网络(CNN)在语音识别中的应用Fig 3.Multi-scale input feature. Stack 31140

第二种是直接输入原始频谱,将频谱图当做图像处理。

Fig 4. Frequency bands input

3.1 百度deep speech

百度将 Deep CNN 应用于语音识别研究,使用了 VGGNet ,以及包含Residual 连接的深层 CNN等结构,并将 LSTM 和 CTC 的端对端语音识别技术相结合,使得识别错误率相对下降了 10% (原错误率的90%)以上。

此前,百度语音每年的模型算法都在不断更新,从 DNN ,到区分度模型,到 CTC 模型,再到如今的 Deep CNN 。基于 LSTM-CTC的声学模型也于 2015 年底已经在所有语音相关产品中得到了上线。比较重点的进展如下:1)2013 年,基于美尔子带的 CNN 模型 2)2014年,Sequence Discriminative Training(区分度模型) 3)2015 年初,基于 LSTM-HMM的语音识别 4)2015 年底,基于 LSTM-CTC的端对端语音识别 5)2016 年,Deep CNN 模型,目前百度正在基于Deep CNN 开发deep speech3,据说训练采用大数据,调参时有上万小时,做产品时甚至有 10 万小时。

详解卷积神经网络(CNN)在语音识别中的应用Fig5. 百度语音识别发展

百度发现,深层 CNN 结构,不仅能够显著提升 HMM 语音识别系统的性能,也能提升 CTC 语音识别系统的性能。仅用深层 CNN 实现端对端建模,其性能相对较差,因此将如 LSTM 或 GRU的 循环隐层与 CNN结合是一个相对较好的选择。可以通过采用 VGG 结构中的 3*3 这种小 kernel ,也可以采用 Residual 连接等方式来提升其性能,而卷积神经网络的层数、滤波 个数等都会显著影响整个模型的建模能力,在不同规模的语音训练数据库上,百度需要采用不同规模的 DeepCNN 模型配置才能使得最终达到最优的性能。

因此,百度认为:1)在模型结构中,DeepCNN 帮助模型具有很好的在时频域上的平移不变性,从而使得模型更加鲁棒(抗噪性) 2)在此基础上,DeepLSTM 则与 CTC 一起专注于序列的分类,通过 LSTM 的循环连接结构来整合长时的信息。3)在 DeepCNN 研究中,其卷积结构的时间轴上的感受野,以及滤波 的个数,针对不同规模的数据库训练的语音识别模型的性能起到了非常重要的作用。4)为了在数万小时的语音数据库上训练一个最优的模型,则需要大量的模型超参的调优工作,依托多机多 GPU 的高性能计算平台,才得以完成工作。5)基于 DeepCNN 的端对端语音识别引擎,也在一定程度上增加了模型的计算复杂度,通过百度自研的硬件,也使得这样的模型能够为广大语音识别用户服务。

3.2 IBM

2015 年,IBM Watson 公布了英语会话语音识别领域的一个重大里程 :系统在非常流行的评测基准 Switchboard 数据库中取得了 8% 的词错率(WER)。到了2016年 5 月份,IBM Watson 团队再次宣布在同样的任务中他们的系统创造了6.9% 的词错率新纪录,其解码部分采用的是HMM,语言模型采用的是启发性的神经网络语言模型。声学模型主要包含三个不同的模型,分别是带有maxout激活的循环神经网络、3*3卷积核的深度卷积神经网络、双向长短期记忆网络,下面我们来具体看看它们的内部结构。

详解卷积神经网络(CNN)在语音识别中的应用Fig 6. IBM Deep CNN 框架

非常深的卷积神经网络的灵感来自2014ImageNet参赛的VGG网络,中心思想是使用较小的3*3卷积核来取代较大的卷积核,通过在池化层之前叠加多层卷积网络,采取ReLU激活函数,可以获得相同的感知区域,同时具备参数数目较少和更多非线性的优点。

如上图所示,左1为最经典的卷积神经网络,只使用了两个卷积层,并且之间包含一个池化层,卷积层的卷积核也较大,99和43,而卷积的特征面也较多,512张卷积特征面。

左2、左3、左4均为深度卷积神经网络的结构,可以注意到与经典的卷积神经网络所不同的是,卷积的特征面由64个增加到128个再增加到256个,而且池化层是放在卷积的特征面数增加之前的;卷积核均使用的是较小的33卷积核,池化层的池化大小由21增加到2*2。

最右边10-conv的参数数目与最左边的经典卷积神经网络参数数目相同,但是收敛速度却足足快了5倍,尽管计算复杂度提高了一些。

3.3 微软

2016年9月在产业标准 Switchboard 语音识别任务上,微软研究者取得了产业中最低的 6.3% 的词错率(WER)。基于神经网络的声学和语言模型的发展,数个声学模型的结合,把 ResNet 用到语音识别。

而在2016年的10月,微软人工智能与研究部门的团队报告出他们的语音识别系统实现了和专业速录员相当甚至更低的词错率(WER),达到了5.9%。5.9% 的词错率已经等同于人速记同样一段对话的水平,而且这是目前行Switchboard 语音识别任务中的最低记录。这个里程意味着,一台计算机在识别对话中的词上第一次能和人类做得一样好。系统性地使用了卷积和 LSTM 神经网络,并结合了一个全新的空间平滑方法(spatial smoothing method)和 lattice-free MMI 声学训练。

虽然在准确率的突破上都给出了数字基准,微软的研究更加学术,是在标准数据库——口语数据库 switchboard 上面完成的,这个数据库只有 2000 小时。

3.4 Google

根据 Mary Meeker 年度互联网报告,Google以机器学习为背景的语音识别系统,2017年3月已经获得英文领域95%的字准确率,此结果逼近人类语音识别的准确率。如果定量的分析的话,从2013年开始,Google系统已经提升了20%的性能。

详解卷积神经网络(CNN)在语音识别中的应用 详解卷积神经网络(CNN)在语音识别中的应用Fig 7. Google 语音识别性能发展

从近几年google在各类会议上的文章可以看出,google尝试deep CNN的路径主要采用多种方法和模型融合,如Network-in-Network (NiN),Batch Normalization (BN),Convolutional LSTM (ConvLSTM)方法的融合。比如2017 icassp会议中google所展示的结构

详解卷积神经网络(CNN)在语音识别中的应用Fig 8. [5] includes two convolutional layer at the bottom andfollowed by four residual block and LSTM NiN block. Each residual blockcontains one convolutional LSTM layer and one convolutional layer.

3.5 科大讯飞DFCNN

2016年,在提出前馈型序列记忆网络FSMN (Feed-forward Sequential Memory Network) 的新框架后,科大讯飞又提出了一种名为深度全序列卷积神经网络(Deep Fully Convolutional Neural Network,DFCNN)的语音识别框架,使用大量的卷积层直接对整句语音信号进行建模,更好地表达了语音的长时相关性。

DFCNN的结构如下图所示,它输入的不光是频谱信号,更进一步的直接将一句语音转化成一张图像作为输入,即先对每帧语音进行傅里叶变换,再将时间和频率作为图像的两个维度,然后通过非常多的卷积层和池化(pooling)层的组合,对整句语音进行建模,输出单元直接与最终的识别结果比如音节或者汉字相对应。

详解卷积神经网络(CNN)在语音识别中的应用Fig 9. DFCNN框架

首先,从输入端来看,传统语音特征在傅里叶变换之后使用各种人工设计的滤波器组来提取特征,造成了频域上的信息损失,在高频区域的信息损失尤为明显,而且传统语音特征为了计算量的考虑必须采用非常大的帧移,无疑造成了时域上的信息损失,在说话人语速较快的时候表现得更为突出。因此DFCNN直接将语谱图作为输入,相比其他以传统语音特征作为输入的语音识别框架相比具有天然的优势。其次,从模型结构来看,DFCNN与传统语音识别中的CNN做法不同,它借鉴了图像识别中效果最好的网络配置,每个卷积层使用3x3的小卷积核,并在多个卷积层之后再加上池化层,这样大大增强了CNN的表达能力,与此同时,通过累积非常多的这种卷积池化层对,DFCNN可以看到非常长的历史和未来信息,这就保证了DFCNN可以出色地表达语音的长时相关性,相比RNN网络结构在鲁棒性上更加出色。最后,从输出端来看,DFCNN还可以和近期很热的CTC方案完美结合以实现整个模型的端到端训练,且其包含的池化层等特殊结构可以使得以上端到端训练变得更加稳定。

4、总结

由于CNN本身卷积在频域上的平移不变性,同时VGG、残差网络等深度CNN网络的提出,给CNN带了新的新的发展,使CNN成为近两年语音识别最火的方向之一。用法也从最初的2-3层浅层网络发展到10层以上的深层网络,从HMM-CNN框架到端到端CTC框架,各个公司也在deep CNN的应用上取得了令人瞩目的成绩。

总结一下,CNN发展的趋势大体为:

1 更加深和复杂的网络,CNN一般作为网络的前几层,可以理解为用CNN提取特征,后面接LSTM或DNN。同时结合多种机制,如attention model、ResNet 的技术等。

2 End to End的识别系统,采用端到端技术CTC , LFR 等。

3 粗粒度的建模单元,趋势为从state到phone到character,建模单元越来越大。

但CNN也有局限性,[2,3]研究表明,卷积神经网络在训练集或者数据差异性较小的任务上帮助最大,对于其他大多数任务,相对词错误率的下降一般只在2%到3%的范围内。不管怎么说,CNN作为语音识别重要的分支之一,都有着极大的研究价值。

收藏 人收藏
分享:

评论

相关推荐

砸2亿美元!苹果收购AI初创公司的真实原因

苹果花费了大量时间,金钱和资源来使用人工智能(AI)使其设备(尤其是iPhone)变得更加智能,这已....
的头像 刘伟DE 发表于 01-19 04:43 444次 阅读
砸2亿美元!苹果收购AI初创公司的真实原因

随着人工智能时代的到来 机器人在各行各业行业中应用也越来越广泛

近日,全球最先进机器人餐厅登陆广州,引起市民热议。随着人工智能时代的到来,中国已连续两年位居世界机器....
发表于 01-18 08:55 45次 阅读
随着人工智能时代的到来 机器人在各行各业行业中应用也越来越广泛

面对数字世界的新十年 浪潮存储俨然已经蓄势待发

过去十年堪称是数据爆炸的十年。回顾2010年的行业报告时你会发现,2010年全球数据量刚刚突破1ZB....
发表于 01-17 17:43 88次 阅读
面对数字世界的新十年 浪潮存储俨然已经蓄势待发

欧盟正在考虑新的法规来约束人工智能 在公共场所禁止人脸识别应用

据国外媒体报道,一份关于人工智能“白皮书”的草案显示,欧盟正在考虑新的法规来约束人工智能的开发,以确....
发表于 01-17 17:29 708次 阅读
欧盟正在考虑新的法规来约束人工智能 在公共场所禁止人脸识别应用

人工智能和区块链技术将会给金融行业带来哪些挑战和机遇

科技进步速度超越人的想象。就在几年前,讨论科技创新这一话题时,提及最多的还是移动互联网、云计算、大数....
发表于 01-17 17:25 155次 阅读
人工智能和区块链技术将会给金融行业带来哪些挑战和机遇

IBM的模拟芯片可使智能手机更快速的识别语音

目前,IBM已经开始研发新一代人脑模拟芯片,使移动设备能更好地完成一些对人脑来说相当容易但对计算机来....
发表于 01-17 16:18 106次 阅读
IBM的模拟芯片可使智能手机更快速的识别语音

5G与AI将给数据中心带来了什么

随着2020年的到来,数据中心开始采用更新、更成熟的技术。具体来说,我们不仅将看到5G对边缘计算需求....
发表于 01-17 15:18 76次 阅读
5G与AI将给数据中心带来了什么

人工智能训狗设备,或与人类训练师效果一样

据外媒报道,训狗通常需要一位人类训狗师,但如果不是能否达到训练的目的呢?这正是这家名为Compani....
的头像 汽车玩家 发表于 01-17 15:18 317次 阅读
人工智能训狗设备,或与人类训练师效果一样

泡在水里的数据中心和永不沉淀的数据价值

数字时代不仅意味着我们会被各种终端提供的海量信息所环绕,更意味着数据中心已成为支持社会和组织运行所不....
的头像 说科技 发表于 01-17 15:11 89次 阅读
泡在水里的数据中心和永不沉淀的数据价值

人工智能发展逐步走向深入落地 头部企业增长受压明显

从2016、2017年的异军突起,到2018年的高歌猛进,2019年的人工智能似乎要“平稳”了许多。....
发表于 01-17 15:05 281次 阅读
人工智能发展逐步走向深入落地 头部企业增长受压明显

雷科智途,全方位智能驾驶解决方案领航者

2019 年底,一场以智能传感器为主题的高科技论坛 智能传感器及无人系统应用论坛 在北京理工大学举行....
的头像 说科技 发表于 01-17 14:21 145次 阅读
雷科智途,全方位智能驾驶解决方案领航者

2019年的无人技术有哪一些重大的事件

无人系统相关技术在2019年度再次取得重大进展,特别是在无人机、机器人系统和自主技术方面不断取得新的....
发表于 01-17 14:04 79次 阅读
2019年的无人技术有哪一些重大的事件

机器人餐厅可以如何开启“战争”

人工智能越来越多运用到生活场景,机器人布局餐厅已成现实。
发表于 01-17 13:58 237次 阅读
机器人餐厅可以如何开启“战争”

京东方正充分发挥在人工智能领域的创新能力与优势

人工智能与经济社会发展深度融合已经成为确定趋势,它给各行各业提供了超过万亿美元的全球性市场和机会。对....
的头像 倩倩 发表于 01-17 13:54 212次 阅读
京东方正充分发挥在人工智能领域的创新能力与优势

国产AGV在海外的市场情况怎么样

拿欧美市场来说,欧美生产的AGV主要采用大部件组装形式,整体外观较为笨重,但与之俱来的是它们大都可以....
发表于 01-17 13:53 61次 阅读
国产AGV在海外的市场情况怎么样

未来的制造业将会是人工智能的应用蓝海

据悉,德勤以问卷采访了“中国制造业500强”里的119家大中型企业,并遴选代表性企业进行深度访谈,从....
发表于 01-17 13:52 39次 阅读
未来的制造业将会是人工智能的应用蓝海

机器人是如何成为数字化的劳动力的

随着人工智能、大数据、云计算等新兴技术的兴起,传统的财务管理模式正在被颠覆,智能财务成为大势所趋。
发表于 01-17 13:49 103次 阅读
机器人是如何成为数字化的劳动力的

京东方人工智能在细分应用场景中创造价值

从科研和学术的庙堂之高到众多领域接地气的落地,人工智能仅用了几年时间。德勤预测,2025年世界人工智....
发表于 01-17 13:47 208次 阅读
京东方人工智能在细分应用场景中创造价值

AI如何给教育领域系统带来改善

随着物联网技术、5G技术、云计算网络技术的不断进步,人工智能正推动人类社会迎来人机协同、跨界融合、共....
发表于 01-17 13:43 94次 阅读
AI如何给教育领域系统带来改善

天翼云十年耕耘 “5G+云+AI”早已蓄势待发

今天的5G、云计算、大数据、人工智能,推动着物理世界向信息化、智能化发展,撬动了各行各业的市场活力和....
发表于 01-17 13:43 40次 阅读
天翼云十年耕耘 “5G+云+AI”早已蓄势待发

算力银行将会给行业带来什么价值

人类生产力发展已经进入算力时代,也就是说计算能力已成为这个时代最强大的新型生产力。
发表于 01-17 13:39 29次 阅读
算力银行将会给行业带来什么价值

“实时”天气预报可以借助人工智能来实现?

该研究利用谷歌自己训练的人工智能(AI)模型,能够大大增强“实时”天气预报的能力。
发表于 01-17 13:33 44次 阅读
“实时”天气预报可以借助人工智能来实现?

IBM对2020年人工智能发展有怎样的展望

人工智能不仅成功吸引了全世界的关注,而且还激发了人们的想象力。
发表于 01-17 11:53 36次 阅读
IBM对2020年人工智能发展有怎样的展望

人工智能怎样变得更加的务实

人工智能从发明创造到社会化生产,需要时间和流程。
发表于 01-17 11:48 31次 阅读
人工智能怎样变得更加的务实

人工智能芯片可以研发出“指甲手机”?

随着军事的发展,人工智能被投放民用市场,普及市场,推动了社会的全面进步。
发表于 01-17 11:42 72次 阅读
人工智能芯片可以研发出“指甲手机”?

人工智能能为酒店带来什么

人工智能是科研发展的前沿技术,发展过程中与信息技术、计算机技术、精密制造技术、互联网技术密切相关,对....
发表于 01-17 11:39 45次 阅读
人工智能能为酒店带来什么

德国高校成立新的人工智能研究所 意在培养先进的科研和人才培养

德国柏林工业大学15日宣布成立新的人工智能研究所,目标是在这一领域开展先进的科研和人才培养。
发表于 01-17 11:30 26次 阅读
德国高校成立新的人工智能研究所 意在培养先进的科研和人才培养

韩国将在未来10年内为人工智能半导体技术研发投资1万亿韩元

2020年1月16日,韩国科学技术信息通信部在位于大田市的韩国电子通信研究院(ETRI)公布了202....
发表于 01-17 11:25 29次 阅读
韩国将在未来10年内为人工智能半导体技术研发投资1万亿韩元

人工智能赋能智能家居能带来什么

随着AI相关技术的深入发展与落地使用,传统安防行业加快了智能化转型升级,开始涵盖更多领域,智能家居行....
发表于 01-17 11:12 46次 阅读
人工智能赋能智能家居能带来什么

制造业是人工智能应用蓝海 人工智能应用正从消费智能扩大到企业智能

最新发布的《2020德勤人工智能制造业应用调查》报告指出,人工智能的应用正从消费智能扩大到企业智能。....
发表于 01-17 10:15 33次 阅读
制造业是人工智能应用蓝海 人工智能应用正从消费智能扩大到企业智能

人工智能在安防行业开了一个好头 但也面临着不少的挑战与问题

安防行业近20年的发展经过了从模拟到数字,从标清到高清的变革,目前进入了人工智能的变革时代。数字和高....
发表于 01-17 10:10 35次 阅读
人工智能在安防行业开了一个好头 但也面临着不少的挑战与问题

2020年存储行业趋势预测

物联网(IoT)、人工智能(AI)、5G和边缘的崛起不仅推动了数据的增长,也为获取新兴的数据驱动型业....
发表于 01-17 09:40 100次 阅读
2020年存储行业趋势预测

CES|艾睿电子推出首个采用ADI的3D飞行时间技术针对健康护理产品的概念验证设计

艾睿电子推出首个采用ADI公司的3D飞行时间技术(ToF)针对健康护理产品的概念验证设计,这设计为呼....
发表于 01-17 09:20 148次 阅读
CES|艾睿电子推出首个采用ADI的3D飞行时间技术针对健康护理产品的概念验证设计

人工智能在分子诊断市场有怎样的应用

线上线下协同发展:高速互联网和分子诊断技术逐步结合,特别是5G技术出现后,高维度的数据共享成为可能,....
发表于 01-16 13:52 166次 阅读
人工智能在分子诊断市场有怎样的应用

AI三类医疗器械和人工智能有直接的关系吗

这是我国首个应用人工智能技术的三类器械过审。而人工智能三类器械过审的通过,对于医疗AI行业来说是一件....
发表于 01-16 13:45 205次 阅读
AI三类医疗器械和人工智能有直接的关系吗

智芯科微发布AT610x深度学习语音识别芯片

杭州智芯科微电子科技有限公司将AI、模拟计算芯片技术相结合,推出了一种低功耗、高性能的深度神经网络处....
发表于 01-16 11:20 80次 阅读
智芯科微发布AT610x深度学习语音识别芯片

关于人工智能改变税收行业的几种方式

政府正在医疗保健、交通运输、国防以及国家安全等诸多领域动用AI与机器人技术。各国政府对于这些新兴成果....
发表于 01-16 11:10 95次 阅读
关于人工智能改变税收行业的几种方式

人工智能如何应用于交通和物流领域

现在,越来越多的公司部署更广泛的物联网网络,对实时数据关注的需求也越来越大。而AI系统能够分析更多的....
发表于 01-16 10:53 100次 阅读
人工智能如何应用于交通和物流领域

哈工大智能研究中心成立 加大人工智能的研究力度

近日,哈工大人工智能研究院感知智能研究中心暨认知智能研究中心成立大会在科学园308举行。黑龙江省科技....
发表于 01-16 10:48 73次 阅读
哈工大智能研究中心成立 加大人工智能的研究力度

曝苹果2亿美元收购Xnor.ai 拟整合技术改进Siri

据熟知内情的消息人士透露,苹果公司收购了西雅图初创公司Xnor.ai,后者是一家专业致力于研究设备人....
的头像 工程师邓生 发表于 01-16 10:31 303次 阅读
曝苹果2亿美元收购Xnor.ai 拟整合技术改进Siri

人工智能领域有什么技术性的岗位

人工智能领域目前已经逐渐形成了一个庞大的产业体系,整个产业体系结构中也涉及到大量的工作岗位。
发表于 01-16 10:13 93次 阅读
人工智能领域有什么技术性的岗位

人工智能时代怎样避免成为“透明人”

人工智能时代,个人的很多信息正被某些应用所采集,如指纹信息、脸部信息、位置信息等,正被手机、银行、交....
发表于 01-16 10:10 95次 阅读
人工智能时代怎样避免成为“透明人”

自主可控“木兰”编程语言怎么样

编程语言是构建生态的基石,在信息技术中有重要的地位,是与操作系统并重的两大系统软件。
发表于 01-16 10:05 4248次 阅读
自主可控“木兰”编程语言怎么样

上海已初步形成品牌效应 成为中国人工智能发展最领先的地区之一

徐建民说,人工智能是新一轮科技革命和产业变革的核心驱动力量,也是当前社会各界十分关注的热点领域。上海....
发表于 01-16 10:05 74次 阅读
上海已初步形成品牌效应 成为中国人工智能发展最领先的地区之一

机器人的发展得益于什么的推动

一旦人工智能对自然语言的理解出现突破,我们身边的人工智能的水平一下子就会有飞跃式的进展。
发表于 01-16 10:01 218次 阅读
机器人的发展得益于什么的推动

AI颠覆的用户体验有多厉害

以前放在桌上的PC机很大,随后智能硬件开始走向笔记本、iPad、手机,甚至开始走向可穿戴,因此未来个....
发表于 01-16 09:56 347次 阅读
AI颠覆的用户体验有多厉害

中国AI看百度已是行业共识 百度AI约等于中国AI的底气

在人工智能这条赛道上,百度的技术实力又一次得到了业界权威的认可,这也让中国AI看百度的行业共识再度牢....
发表于 01-16 09:52 174次 阅读
中国AI看百度已是行业共识 百度AI约等于中国AI的底气

2030年会有多少工作会被替代

人工智能技术飞速发展。从阿尔法Go到自动驾驶,人工智能似乎一夜之间就充斥着我们生活和工作的方方面面。
发表于 01-16 09:51 87次 阅读
2030年会有多少工作会被替代

人工智能全球2000位具有影响力的学者有哪一些

而当前人工智能领域热点研究话题位居前十的是:神经网络、卷积神经网络、机器学习、计算机视觉、移动设备、....
发表于 01-16 09:47 89次 阅读
人工智能全球2000位具有影响力的学者有哪一些

40家江苏AI企业盘点 江苏人工智能产业面临的挑战与机遇并存

回顾2014年,大量初创的人工智能公司集中出现。此后,随着资本进一步加持,全球范围内“Al”热潮不断....
发表于 01-16 09:43 88次 阅读
40家江苏AI企业盘点 江苏人工智能产业面临的挑战与机遇并存

2020艾睿电子解决方案展示会

活动简介 艾睿电子解决方案展示会是艾睿电子自主主办的展会,也是每年一度的 ACT (Arrow Centralized Training) 高潮,为...
发表于 01-15 09:40 3266次 阅读
2020艾睿电子解决方案展示会

基于单片机语音控制开关设计

本人大四 现在想做一个单片机的语音控制开关系统 。因为之前学过一点单片机,不是很深入 想向各位大神寻求一点有关的资料。 设计...
发表于 01-13 13:00 536次 阅读
基于单片机语音控制开关设计

内置NPU的Orange Pi 4B,你怎么看

提起单板电脑,树莓派基金会发布的树莓派系列开发板或许是最广为人知的,该公司坚持使用博通的SOC芯片,以实现不断更新的镜像...
发表于 12-23 21:07 517次 阅读
内置NPU的Orange Pi 4B,你怎么看

串口屏应用案例-自助点餐系统

串口屏应用案例-自助点餐系统 自助点餐系统应景而生,彻底打破了传统,能够有效的减少排队使用的时间。在自助点餐机器前的显示屏...
发表于 12-23 13:15 252次 阅读
串口屏应用案例-自助点餐系统

【征文福利帖】真香!AliOS派送订制开发板,你不来看一下吗?

AIoT领域技术栈跨度大,工程化过程中碎片场景多,整个产业亟需大量优秀的开发者和专业人员,产业的思考、技术的实践等优质内容...
发表于 12-20 09:28 1179次 阅读
【征文福利帖】真香!AliOS派送订制开发板,你不来看一下吗?

BP模糊神经网络纯电动汽车电机控制

针对传统比例积分(PI)控制在电机控制中控制效果不良的问题,设计了一种基于向后传播算法(BP)模糊神经网络的PI控制器。...
发表于 12-10 16:32 396次 阅读
BP模糊神经网络纯电动汽车电机控制

一文读懂WMS的进阶史

双十一高效配送的背后离不开各类物流系统的支持,WMS系统作为仓配中心的“智慧大脑”在其中发挥着重要作用。让我们一起回顾...
发表于 12-06 11:44 406次 阅读
一文读懂WMS的进阶史

【转载】如何从零入门人工智能(AI)具体学习步骤和方法

手把手教你设计人工智能芯片及系统(全阶设计教程+AI芯片FPGA实现+开发板)详情链接: 上次我们讲到人工智能的一些应用,...
发表于 11-28 16:20 392次 阅读
【转载】如何从零入门人工智能(AI)具体学习步骤和方法

史上最全AI人工智能入门+进阶学习视频全集(200G)【免费领取】

近几年来,人工智能(AI)概念很火热,几乎人人都在学习人工智能,AI市场人才的抢夺也非常的激烈。根据百科的解释,人工智能...
发表于 11-27 12:10 815次 阅读
史上最全AI人工智能入门+进阶学习视频全集(200G)【免费领取】

高焕堂:VR/AR欺骗大脑,AI赋能大脑,两者结合创意无限

高焕堂,台湾VR/AR产业联盟主席、台湾铭传大学《AI潮流下的创新设计思维》课程讲师、台湾科技大学VR技术培训课程讲师、...
发表于 11-26 13:52 10498次 阅读
高焕堂:VR/AR欺骗大脑,AI赋能大脑,两者结合创意无限