电子发烧友网 > 人工智能 > 正文

AI正在悄悄听懂你的话

2019年07月19日 16:43 次阅读

小时候看特务电影时,特工们往往有一项必备的技能,就是隔着几百米远盯着正在说话的对象,从嘴型判断出对方在说什么。有了这种记忆,导致如今看什么语音识别技术都觉得相当一般——我都说出声儿了你才听懂,算什么AI好汉。

不过最近一项专利申请表明,微软正在向特工学习,推出了无声语音识别技术。当AI也能像特工一样,无声之中辩人言,我们的世界究竟会有什么不同?

除去唇语识别,

AI还有什么方式悄悄听懂你的话?

说起无声语音识别,可能很多人第一反应就是复制人类的方式,利用图像识别进行辩读唇语。而利用唇语进行语音识别这种方式也由来已久,但是识别的准确率一直不算高。DeepMind曾在2016年做过测试,经过1万小时的新闻视频训练,AI唇语准确率达到了46.8%。国内有一家企业曾经提供过相关数据:在对中文新闻视频的识别中,准确率达到了70%。而搜狗所推出的驾驶场景下的唇语识别,因为涉及到的词汇量很少,准确率能够达到90%。

可以发现,相比现在主流语音识别动辄95%、97%的准确率,唇语识别准确程度实在是有些拿不上台面。对于中文这种一字一音节的语言来说还好,对于英文这种连音很多的语言来说,唇语识别要跨越的门槛确实不少。

另一方面来看,唇语识别所涉及到伦理问题实在过于严重。唇语识别的“射程”太远,如果这种技术真的发展成熟,意味着天网之下的我们在交谈时将再无隐私。在隐私焦虑越来越浓的今天,哪家企业公开研究这项技术,只怕是觉得自己家的公关部门过得太清闲。

因此包括微软在内的产业和学界,都在寻找一种更精准也更隐私的无声语言识别。目前看来,无声语音识别的技术方向可以被分为两个“派系”,一是“气宗”,另一个是“电宗”。

微软所提交的专利,就是典型的“气宗”——在终端上添加传感器,通过感知用户说话时的气流来判断用户说话的内容。这种终端如同一只小型麦克风,置于用户嘴边,用户在说话时形成的气流会在设备中形成反射,经过训练,可以将这些气流反射的信号和文字一一对应。

而“电宗”则更加神奇,我们知道人在说话时需要调动整个下半张脸的肌肉,不同的文字发音所调动肌肉的方式也并不相同。通过对面部EMG(肌电)信号的采集,来学习人类说话时面部EMG信号特征,并通过神经网络的训练将EMG信号和文字对应起来。

可以看出这两种无声语音识别都有一个共同的特点,那就是自主性和私密性。不管是EMG信号采集还是气流采集,都需要在讲话者身上佩戴好设备,而不是像图像技术一样,能够在远程且讲话者不知情的情况下进行采集分析。

无声语音识别变成真·气功?

不论是气宗还是电宗,这些无声语音识别技术都面临着同样的问题——既然要用户把话说出来才能进行识别,那为什么不直接应用语音识别来进行文字转换和翻译,非要弄一些和“气功”一样没有切实应用场景的花招?

其实无声语音识别的应用,可能不像大家想象的那样广泛,它既不能以最高效的方式帮助听障人士,也不允许被应用于监听等等工作。但在一些关键场合下,无声语音识别却可以发挥出奇用。

我们可以一起开动脑筋,想想在哪里人们需要说话,但却听不到彼此的声音。答案很简单,要么是在声音无法传播的地方,要么是在一些特别嘈杂的地方。于是无声语音识别就有了如下的应用场景:

灾害现场、舱外探索、水下作业……

在这类场所中,人们或许为了躲避被污染的空气、或许为了呼吸氧气,都会穿上类似生化服、宇航员服等等特殊服装。穿上之后既看不到对方的表情,也听不到对方的声音,更没办法用语音交互去控制其他设备了。同时环境情况(例如氧气不够充足)往往不允许人们以正常的声音说话,加上防护服的封闭状况会引起声音的回响,以往的有声语音识别在这种情况下很难发挥作用。

AI正在悄悄听懂你的话

这时可以被安置在防护服内部的无声语音识别就显得很有价值,讲话者只需要做出口型就能向外界传递信息。

除此之外还有嘈杂的马路、工厂车间、机场……

在这些场所中,想要让对方听清自己的声音,往往需要扯着嗓子吼。想让语音识别准确拾音,更是难上加难。这时利用无声语音识别就会轻松很多,不仅可以准确表达信息,也能让一些处于这种场合的工作人员戴上隔音耳塞保护自己的听力。

实际上目前在欧洲一些型号的战斗机中,就因为机舱内噪音巨大、飞行员之间无法沟通,已经应用上了EMG信号无声语音识别技术。

当然,目前相比语音识别技术、甚至相比唇语语音识别,无声语音识别技术的发展阶段还很初级,应用效率也不高。

实际上无声语音识别是一项典型的“美好而无用”的AI技术,它既完美体现了一系列技术的排列组合,例如EMG信号无声语音识别所体现出的AI与神经学的结合;又在应用上极大程度的受限,即使在一些声音难以传播的场景下,也要考虑计算条件、识别语音后信息再传递的媒介,更不用提复杂的数据收集工作了。

但我们有理由相信,在未来AI技术越来越普及化、应用成本越来越低时,总会出现一些极端场景应用上这些看似无用的技术——也许未来有一天,战斗机的控制也要应用上语音交互呢?

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

【5月12】不懂编程没关系,邀请您来学AI

不懂编程没关系,邀请您来学AI活动概述:本活动是现场讲座,由台湾知名AI教育专家、金门创新学院院长、台湾Android技

发烧友学院 发表于 2019-05-24 00:00 0次阅读
【5月12】不懂编程没关系,邀请您来学AI

智能协作能为人类做到什么

把人类的动作当做“棋谱”大量输入给神经网络,让神经网络自行挖掘动作和实现目标之间的关系。

发表于 2019-07-19 16:36 7次阅读
智能协作能为人类做到什么

人工智能如何影响网络安全

人工智能的攻防之战不断展开,在网络上关于它的负面评论也渐渐浮现。

发表于 2019-07-19 16:25 7次阅读
人工智能如何影响网络安全

如何从难以普及的数据增强技术

虽然数据驱动不是AI算法训练的唯一途径,但在产业中已经出现了很明显的趋势。

发表于 2019-07-19 16:19 10次阅读
如何从难以普及的数据增强技术

为AI加上安全锁有没有可能

然而随着AI的发展与应用,这门新技术所暴露出来的危险与不确定性确实也渐渐浮出水面。

发表于 2019-07-19 16:15 6次阅读
为AI加上安全锁有没有可能

如何让AI赋能智慧电力和智慧城市建设

谈到如何赋能智慧电力建设,常向魁说,大华智慧电力解决方案以人工智能、物联网、大数据等技术为核心,在传...

发表于 2019-07-19 16:11 11次阅读
如何让AI赋能智慧电力和智慧城市建设

人工智能时代,它是下一个机器人明星产品

在本届峰会上,深圳未来科技有限公司展示的儿童智能机器人通过语言识别、人脸识别、语音唤醒等技术,搭建了...

发表于 2019-07-19 15:34 31次阅读
人工智能时代,它是下一个机器人明星产品

新人工智能模型提高预测乳癌准确度达87%

新的AI模型能以良好的准确度来预测患者恶性乳癌一年内的发展,以减少进行不必要测试的女性患者人数。

发表于 2019-07-19 15:29 18次阅读
新人工智能模型提高预测乳癌准确度达87%

中国云端智能机器人募资 5 亿美元,准备赴美上市

近日,云端智能机器人运营商达闼科技(CloudMinds)正式向其递交招股书,准备在纽交所上市,据悉...

发表于 2019-07-19 15:02 55次阅读
中国云端智能机器人募资 5 亿美元,准备赴美上市

达摩院“机器智能实验室”成型,阿里AI芯片会怎样...

随着达摩院这两年的成长,在AI 布局的深度与应用的广度又更上一层楼,现在其机器智能实验室已经是整个阿...

发表于 2019-07-19 14:55 40次阅读
达摩院“机器智能实验室”成型,阿里AI芯片会怎样...

AI智能教育,从小培养孩子兴趣

7月17日,上书院联合瓦力工厂举办的“机器人编程课程”暑期研学活动于瓦力工厂公主坟校区顺利举行。

发表于 2019-07-19 11:52 181次阅读
AI智能教育,从小培养孩子兴趣

NVIDIA GPU解决方案亮相 推进专业视听产...

亚太专业视听和交互体验式通信技术交流的平台会议InfoComm China 2019在北京启幕,作为...

发表于 2019-07-19 10:58 22次阅读
NVIDIA GPU解决方案亮相 推进专业视听产...

AI加持下的互联网反欺诈

针对互联网乱象纷飞的欺诈行为,芯盾时代一直秉持着零容忍的态度,在虚假交易、薅羊毛、信息泄露、信用欺诈...

发表于 2019-07-19 10:09 139次阅读
AI加持下的互联网反欺诈

DOCOMO在推动5G发展方面的一些举措介绍

在5G方面,DOCOMO会在两个月以后9月份在世界橄榄球大会上正式开展预商用,在明年的春天会开始5G...

发表于 2019-07-19 10:08 21次阅读
DOCOMO在推动5G发展方面的一些举措介绍

加入AI自主学习后会发生什么事

软件升级包括分区清洁、自主学习。

发表于 2019-07-19 09:55 17次阅读
加入AI自主学习后会发生什么事

如何让AI能力延伸至边缘

人工智能技术的复兴,主要归功于过去几年以来以IT为代表的计算能力的显着提升。

发表于 2019-07-19 09:50 24次阅读
如何让AI能力延伸至边缘

科技如何避免成为黑产帮凶

科技的发展推动了社会进步,同时也带来很多风险和隐患。

发表于 2019-07-19 09:48 21次阅读
科技如何避免成为黑产帮凶

人工智能(AI)对于当今生活的现实意义有什么

人工智能绝对是现代生产力变革的巨大动力,和不远的将来,和你和我都息息相关,现如今它已经在不远的将来向...

发表于 2019-07-19 09:43 22次阅读
人工智能(AI)对于当今生活的现实意义有什么

来看看中国机器人的发展现状

新的视觉技术、机器人的认知、灵巧性的追求、高投资回报、机械手的开发等都在不断吸引着协作机器人新兴入局...

发表于 2019-07-19 09:35 69次阅读
来看看中国机器人的发展现状

国产机器人跟进口机器人的差别在哪里?

近年来,在人口红利逐步消退及科技进步的背景下,中国制造业企业自动化升级、机器换人的需求逐年攀升。拥有...

发表于 2019-07-19 09:31 62次阅读
国产机器人跟进口机器人的差别在哪里?

未来生活,AI无处不在?

Vimicro AI是人工智能技术的先行者,基于深度学习技术的嵌入式神经网络处理器芯片和人工智能技术...

发表于 2019-07-19 08:50 96次阅读
未来生活,AI无处不在?

百度、商米科技、众趣科技齐聚一堂 共同探讨AI技...

7月18日,奥比中光联合深圳市人工智能行业协会共同主办“以芯致新 启视未来”新商业沙龙。41家企业代...

发表于 2019-07-19 08:43 76次阅读
百度、商米科技、众趣科技齐聚一堂 共同探讨AI技...

大联大世平集团推出基于Brightek ICLe...

致力于亚太地区市场的领先半导体元器件分销商---大联大控股宣布,其旗下世平推出基于弘凯光电(Brig...

发表于 2019-07-18 16:55 44次阅读
大联大世平集团推出基于Brightek ICLe...

AI赋能教育产业应用管窥与琐思

人工智能已进入“大航海时代”,成为科技创新的“超级风口”。

发表于 2019-07-18 16:50 46次阅读
AI赋能教育产业应用管窥与琐思

人工智能进步须突破算力依赖

对脸书这样的公司来说,人工智能在其服务的几乎每个方面都发挥着作用。

发表于 2019-07-18 16:45 35次阅读
人工智能进步须突破算力依赖

AI单凭文字就可作画谁最先受到冲击

随着人工智能时代的到来,艺术与科技的碰撞,越来越频繁地现身热门话题榜。

发表于 2019-07-18 16:36 36次阅读
AI单凭文字就可作画谁最先受到冲击

AI将电影制作变成娱乐游戏

Queisser 说道:“你可以在软件中创建两个不同的场景,分别在每个场景中比较 Emma Wats...

发表于 2019-07-18 15:49 99次阅读
AI将电影制作变成娱乐游戏

更像人类的学习,英特尔AI芯片系统模拟人脑!

800万神经元,比CPU快1000倍!

发表于 2019-07-18 15:33 111次阅读
更像人类的学习,英特尔AI芯片系统模拟人脑!

不亦乐乎:一边造假,一边打假的AI!

后来Facebook创始人马克.扎克伯格的一段视频也开始疯传,在其中小扎说“让我们快速地想象一下,一...

发表于 2019-07-18 15:10 135次阅读
不亦乐乎:一边造假,一边打假的AI!

阿里最新研究:AI进化到助理法官水平 可一秒“判...

如果说“一个人的法庭”还属于审判流程的数字化、在线化的1.0阶段。那么,阿里的最新研究成果标志着智能...

发表于 2019-07-18 15:07 91次阅读
阿里最新研究:AI进化到助理法官水平 可一秒“判...

灵云AI能力:快速接入,轻松调用

灵云SDK,将为每一个软件、每一款硬件,提供AI能力,打造万物智能新世界。

发表于 2019-07-18 14:47 82次阅读
灵云AI能力:快速接入,轻松调用

科技巨头正逼迫制药商仓促入局

人工智能研究人员推出了一种神经网络算法,可以根据序列预测蛋白质的功能。

发表于 2019-07-18 14:16 37次阅读
科技巨头正逼迫制药商仓促入局

AI的出现,其实不是为了终结人类的工作

AI多火?之前,财经网一则题为《AI 人才抢夺生猛:应届博士年薪涨到 80 万,一年涨了 60%》的...

发表于 2019-07-18 14:16 81次阅读
AI的出现,其实不是为了终结人类的工作

AI和数据为未来智慧城市赋能的5大途径

智慧城市通过从各种传感器收集信息以更加有效地管理城市资产和资源,从而将自己定位为解决城市困境的手段。

发表于 2019-07-18 11:21 211次阅读
AI和数据为未来智慧城市赋能的5大途径

不用写一行就带就可以参加 Kaggle,这个真香...

随着 AI 技术的不断发展与落地,有越来越多的平台和工具可供大家使用,这些平台针对不同领域、不同层次...

发表于 2019-07-18 10:59 183次阅读
不用写一行就带就可以参加 Kaggle,这个真香...

“只讲技术,拒绝空谈”的AI开发者大会再次来临!

微信小程序自2017年上线以来,如今已经成为互联网最火热的项目风口,阿里、百度等也纷纷看中小程序的发...

发表于 2019-07-18 10:54 203次阅读
“只讲技术,拒绝空谈”的AI开发者大会再次来临!

AI智能体使用日常语言生成解释其行为的原理

由于人工智能遍及我们生活的方方面面,因此非常需要以人为本的人工智能设计,使日常用户可以解释如同黑盒子...

发表于 2019-07-18 10:44 28次阅读
AI智能体使用日常语言生成解释其行为的原理

2019年人工智能五大趋势

当机器学习模型应用于这些数据集时,IT运行即可从被动响应转变为主动预测。

发表于 2019-07-18 10:20 35次阅读
2019年人工智能五大趋势

技术的温度:用AI保护野生动物

他们使用的 SPOT 系统,由南加州大学社会人工智能中心的研究人员建造,先通过人工标记,以及无人机自...

发表于 2019-07-18 10:15 153次阅读
技术的温度:用AI保护野生动物

“没人比我更懂AI了”介绍45篇让你跟上AI时代...

Targeted Dropout不再像原有的Dropout那样按照设定的比例随机丢弃部分节点,而是对...

发表于 2019-07-18 10:12 158次阅读
“没人比我更懂AI了”介绍45篇让你跟上AI时代...

视觉AI市场引爆前夕,虹软+AI创享会招募深圳同...

从人工智能技术应用曲线来看,人脸识别技术正处于爆发阶段,应用价值逐步呈现。人脸识别在LFW、Mega...

发表于 2019-07-18 09:28 19次阅读
视觉AI市场引爆前夕,虹软+AI创享会招募深圳同...

通用人工智能仍是白日梦

尽管深度学习为广泛的计算机感知领域注入了新鲜血液,但它甚至没有触及人工智能的基本问题。

发表于 2019-07-18 09:22 20次阅读
通用人工智能仍是白日梦

大国竞争格局将变成AI人工智能的竞争

本轮科技和产业革命,从一开始大家聚焦的新能源和新通讯,慢慢地聚焦到以人工智能、大数据以及物联网为核心...

发表于 2019-07-18 08:45 21次阅读
大国竞争格局将变成AI人工智能的竞争

未来可以让AI来创造AI吗

任何机器学习模型都是基于历史数据开发出来的,而历史数据反映的是过去的商业状况,所以模型其实是有保质期...

发表于 2019-07-18 08:33 26次阅读
未来可以让AI来创造AI吗

8小时卖出20万台AI音箱,喜马拉雅是如何做到的...

去年年底,喜马拉雅AI音箱小雅Nano宣布全球发售时,1万台现货开售1分钟即被抢购一空,首批10万台...

发表于 2019-07-17 17:09 380次阅读
8小时卖出20万台AI音箱,喜马拉雅是如何做到的...

vivo Y7s正式开启预约搭载联发科P65处理...

联发科P65处理器基于12nm工艺,八核心设计,由两颗2.0GHz的A75核心与六颗1.7GHz的A...

发表于 2019-07-17 16:49 379次阅读
vivo Y7s正式开启预约搭载联发科P65处理...

大众与福特共推自动驾驶出租车服务

Argo AI作为一家自动驾驶汽车开发商,目前正负责部署福特的自动驾驶出租车服务。

发表于 2019-07-17 16:07 260次阅读
大众与福特共推自动驾驶出租车服务

AI在实际应用中最大的问题与困扰是什么?

本次邀请该研究中心的薛向阳教授,为我们共同探讨产研合作中存在的问题。

发表于 2019-07-17 15:51 203次阅读
AI在实际应用中最大的问题与困扰是什么?

AI也需要做梦吗

处于“清醒”或在线状态的人工智能神经网络总是在学习新的信息模式。

发表于 2019-07-17 15:22 32次阅读
AI也需要做梦吗

下次如何加薪将由AI和算法说了算

用过去的方法来评估员工的绩效,意味着要从几套不同的人力资源部门记录中挖掘出每份直接报告中蕴含的信息。

发表于 2019-07-17 14:20 60次阅读
下次如何加薪将由AI和算法说了算

MIT和谷歌开发失传语言的机器翻译系统

注释数据库和让机器从中学习的技术让语言学习发生了革命性变化,这使得机器翻译变得越来越普遍。

发表于 2019-07-17 10:56 45次阅读
MIT和谷歌开发失传语言的机器翻译系统

医疗和技术的加速融合,带动产业进入“AI+医疗”...

人工智能等前沿技术正在快速迭代,医疗领域的智能升级是大势所趋。

发表于 2019-07-17 10:51 210次阅读
医疗和技术的加速融合,带动产业进入“AI+医疗”...

法律会是AI将革新的又一产业吗

我们这个软件驱动的世界,正在给法律行业带来革命性的变化,并产生了所谓的“法律工程师”。

发表于 2019-07-17 10:39 157次阅读
法律会是AI将革新的又一产业吗

科创板报道:倒计时!首批25家公司如何前瞻和选择

7月22日(下周一),科创板首批25家公司将在上交所鸣锣上市,成为中国资本市场的新生力量。 从201...

发表于 2019-07-17 10:34 623次阅读
科创板报道:倒计时!首批25家公司如何前瞻和选择

边缘计算时代的到来会给AI带来哪些影响

随着5G、人工智能和物联网时代的到来,传统的云计算技术已经无法满足人工智能终端“大连接、低时延、大带...

发表于 2019-07-17 10:33 70次阅读
边缘计算时代的到来会给AI带来哪些影响

5G与AI的碰撞会发生什么化学反应

5G尚处于商用初期,AI也处于发展初级阶段。

发表于 2019-07-17 10:00 45次阅读
5G与AI的碰撞会发生什么化学反应

利用语音直接画出人脸,AI再添新能力

听声辨人,利用声纹进行解锁,这种技术已广泛应用,人类的声音含有该个体的一定特征,从而可以进行区分。

发表于 2019-07-17 09:54 205次阅读
利用语音直接画出人脸,AI再添新能力

中国车联网规模突破2000亿,5G和AI融合推动...

7月9-10日,由国泰君安证券与中移(上海)产业研究院、浦发硅谷银行共同主办的国泰君安2019年信息...

发表于 2019-07-17 09:32 1794次阅读
中国车联网规模突破2000亿,5G和AI融合推动...

人工智能能实现无人物流体系吗

无人科技背后的大数据、AI算法等科技成果还促进建立了以消费者个性化需求为核心的C2M反向定制、物流价...

发表于 2019-07-16 17:27 106次阅读
人工智能能实现无人物流体系吗

产业互联网时代到来科技是最大筹码

当产业互联网的风口到来,这些企业未来的发展路径又是怎样的?

发表于 2019-07-16 17:06 186次阅读
产业互联网时代到来科技是最大筹码

物业公司如何面对社区物联化大势所趋

随着人工智能、大数据、物联网等科技发展,传统行业也开始借助这些技术进行转型升级。

发表于 2019-07-16 15:24 94次阅读
物业公司如何面对社区物联化大势所趋