0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

语音技术革命如何改变人们的交流方式

iotmag 来源:未知 作者:胡薇 2018-11-13 11:19 次阅读

语言是我们日常交流的主要方式,可以让我们快速了解对方的意图,并做出适当的反应。说话这一看似简单的行为对很多语言障碍者而言依旧很困难。

语言是件极其复杂的事情,不仅仅是文字表面上的发音,还与音量、音调、速度、说话环境等众多因素密切相关。

同一个词或句子,在不同的场合,用不同的音量和速度,所表达的意义也不同。比如“你吃了么?”,可以是两人见面的问候语;也可以是我正准备去吃饭,如果你没吃,我们可以结伴去吃饭;还可以是恋人间的关怀;甚至可以是小孩子玩游戏时,跟玩偶的对话。

语言环境如此复杂,而对于那些因受伤或生病而无法说话的人,我们怎样才能更好的理解他们的想法?他们又如何能更快更有效的表达自己的意图?

新技术正在快速推动语音生成设备的进步

自20世纪60年代以来,一些语音技术的先行者就致力于研发语音生成设备(SGDs)来帮助语言障碍者。

1963年,英国人Maling和Clarkson开发了专为严重身体残疾的人设计的个人通信工具POSSUM,这是一台带开关控制扫描装置的打字机。

自此,随着语音合成算法的进步及微处理器技术的发展,电子辅助和替代通信系统(AAC)得以快速普及。通信辅助设备也变得越来越小巧,功能也越来越强大。

目前,电子辅助和替代通信系统(AAC)、语音生成设备(SGDs)、语音输出通信辅助设备(VOCA)已经在美国帮助了200多万人。患有肌萎缩性侧索硬化症(ALS)、脑瘫、闭锁综合征、多发性硬化症、帕金森、脑中风、创伤性脑损伤等交流障碍或残疾人都可以使用这类语音生成设备。著名物理学家史蒂芬·霍金就使用语音生成装置与他人进行交流。

在过去几年中,随着人工智能技术与语音技术的突破,以及数字设备功能的指数级增长,数字化语音正在改变人们的交流方式,特别是翻译和医疗等领域。

据相关数据显示, 2017年,语音生成设备市场规模为1.9亿美元,预计到2025年将达到3.3亿美元。

科技创新公司和谷歌、微软等科技巨头都在努力通过辅助应用APP、语音生成设备和脑机接口技术帮助语言障碍者能够更有效地与他人进行交流。

1)辅助应用APP

智能手机、平板电脑和数字触摸屏为患者提供更加直接的交流方式。如自闭症患者可以通过触摸屏上的物品图像、活动图片或符号来表达他们的需求。

Proloquo2Go就是这样一款面向语言障碍患者的辅助交流工具,适用于自闭症、唐氏综合症、脑瘫和其他诊断患者,目前已有20多万用户。

此外,还有很多APP可以帮助用户“说话”,如SayIt!和Predictable这两款文字处理应用,可以将用户输入的文字内容转化成语音,并具有智能联想和自动更正单词的功能。

MyTalkTools Mobile是由一位父亲开发的,以帮助他儿子克服通信困难,他的儿子出生时患有Nager综合症,这是一种影响听力、言语和其他能力的罕见疾病。目前该软件已拥有超过10万名用户。

2017年初,微软推出了GazeSpeak应用程序,帮助肌萎缩性侧索硬化(ALS)患者用眼球运动进行沟通。该应用通过手机摄像头跟踪患者的眼睛运动,并用AI进行字词预测。

2)语音生成设备

机器学习、自然语言处理和文本预测技术极大地推动辅助通信技术的发展,语音合成应用可以为用户提供定制化、个性化的服务。

语音生成设备可以将单词或图片转化成语音,比辅助应用APP更加先进。某些产品允许用户可以从几种不同的声音中进行选择,例如男性或女性,儿童或成人,甚至可以选择一些地域口音。某些算法模型可以追踪患者眼睛运动或头部运动来进行词汇选择,并合成语音。

Pocket Go Talk是一款可穿戴的小型便携式AAC设备,也可以在桌面使用,具有五种可调节的扫描速度。通过5个易操作的按钮生成25条语音消息,每条语音可以长达12秒。

便携式辅助书写平板MegaBee是在英国斯托克曼德维尔医院的闭锁综合征患者的帮助下研发出来的。通过眼球运动和闪烁作为选择字母或短语的方法,然后在屏幕上显示,从而帮助中风、多发性硬化症、运动神经元疾病患者及其它语言障碍患者进行交流。

还有很多新兴科技公司正在利用机器人技术提升患者的社交能力。卢森堡机器人公司LuxAI推出适用于自闭症儿童的社交机器人QTrobot,实验证明,该机器人可以明显增加自闭症儿童的注意力和参与度,同时减少他们的焦虑和破坏行为。

美国波士顿公司VocalID利用众包和语音混合技术为语言障碍患者提供个性化的合成语音。目前已有110多个国家的超过14000人为公司的语音库The Human Voicebank提供了600多万句话。

2017年,谷歌宣布神经网络模型WaveNet正式商用于Google Assistant中,比初始模型效率提高了1000倍,可以更好地模拟自然语音。该模型可以根据真实的人类语音对音频波形进行建模分析,从中学习并创建自己的声音。

3)代表未来的脑机接口

意念交流是很多科幻小说和电影里的场景,而现在科研人员正在通过脑机接口技术将之变成现实。

早在1998年,英国雷丁大学的研究员Kevin Warwick博士在自己的手臂上植入一个发射器来控制门和其它装置。2002年,他将电极接入自己的神经系统,以便用思维控制轮椅,并允许远程机器人手臂模仿他的手臂动作。

Warwick博士的目标是帮助语言障碍患者进行沟通,他将一个芯片植入他妻子的手臂,通过互联网将两人的大脑联系在一起,创造了世界上第一个脑—脑电子通信。

2012年,美国因中风而瘫痪的患者Cathy Hutchinson利用脑植入芯片成功的用思维控制机器手臂端起一杯咖啡,并和吸管中喝了一口。

2014年初,法国公司Axilum Robotics与西班牙巴塞罗那大学、Starlab公司和哈佛医学院一起进行第一次脑对脑的沟通,在5000公里外,实现了直接在两个人的大脑之间进行沟通。

2016年埃隆·马斯克成立了Neuralink公司进行脑机接口研究,以帮助治疗人类的脑部疾病。

2018年5月,俄罗斯新西伯利亚国立技术大学声称研制出了一款用意念控制的越野轮椅。颈部以下瘫痪者可乘坐该轮椅在室内甚至城市街道上独立行动。

2018年6月,美国麻省理工学院下属计算机科学与人工智能实验室(CSAIL)的研究人员开发了一种新界面系统,它可以读取人类操作人员的脑电波,通过思维命令机器执行任务。

目前脑控科技已经成为各国科研人员竞相研究的前沿课题。尽管大多数研究目前还停留在实验室阶段,一旦该技术成功商业化,瘫痪者、语言障碍者、盲人等群体将迎来生命中的第二个春天。

语音2.0:语音界面技术和实时翻译

未来,科技创新将使人类的交流与沟通提升到另外一个层次,它不仅仅是帮助语言障碍患者进行无障碍交流;还会在人与人或人与机器之间进行信息交换。

由于人类语言的多样化,限制了人与人之间的沟通,特别是跨国别和跨语种的交流。近几年,随着实时翻译技术的成熟,语言鸿沟正被慢慢地消除。

2017年10月,谷歌推出Pixel Buds蓝牙耳机,使用Pixel智能手机即可在40种不同语言之间进行即时翻译。

微软的Skype Translator可以对语音、视频及50种语言的文本内容实现八种语言之间的实时翻译

各种便携式翻译设备可以帮助游客在几秒钟内进行语言翻译。未来,小小的耳机设备将打破出行的语言限制,而传统的翻译这一职业也将被新技术所替代。

在语言的新技术革命中,手语也正在被技术所替代。2015年,美国德克萨斯A&M大学开发了一款可穿戴设备,通过感知用户的手臂动作,将手语翻译成英语。该设备可以识别出大约40个美国标准手语动作,准确率达到了96%。

利益于人工智能技术的飞速发展,机器不仅仅是充当翻译人员,还可以成为沟通伙伴。据Gartner预测,到今年年底,我们与新技术的互动中有30%将通过与智能机器完成。目前每六个美国成年人中,就有一个拥有智能音箱或相关设备。除了控制智能家居外,亚马逊的AI助手Alexa已经可以帮助用户在线购物。未来AI助手将能实现更多的功能。

无论是在医疗、旅游、还是商业活动,以人工智能为代表的新技术正在彻底改变人与人之间的交流方式,并将打破身体、地域、国别、语种的各种限制。未来,我们的交流对象也将不再局限在人类,可以是机器、可以是动物。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1780

    文章

    44499

    浏览量

    231266
  • 语音技术
    +关注

    关注

    2

    文章

    223

    浏览量

    21219

原文标题:深度:语音技术革命正在改变人类的交流方式

文章出处:【微信号:iotmag,微信公众号:iotmag】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    智能语音交互技术如何助力设备实现人机自然对话

    随着现代人工智能在各行业的普及,智能语音交互技术也越来越多的在日常工作、生活中应用,智能语音交互的出现不仅仅大量节省了人工的工作时间提高了工作效率,为人们工作生活带来便利的同时,也
    的头像 发表于 05-23 15:16 211次阅读
    智能<b class='flag-5'>语音</b>交互<b class='flag-5'>技术</b>如何助力设备实现人机自然对话

    智能语音交互技术如何助力设备实现人机自然对话

    智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术,实现人与机器之间自然语言的交流
    的头像 发表于 05-23 15:14 107次阅读

    广和通引领数字技术革命,推动行业创新与发展

    在当今科技飞速发展的时代,5G融合AI、5G-A助推6G、大模型与生成式AI、边缘智能技术等新兴技术风起云涌,正深刻改变着我们的生活与工作方式。广和通作为科技行业的领军企业,敏锐地洞察
    的头像 发表于 05-17 09:51 160次阅读

    讯维融合通信:一场革命性的通信方式变革

    讯维融合通信确实引发了一场革命性的通信方式变革。它的核心技术主要体现在高度集成化和智能化上,通过融合各种通信技术和手段,打破了传统通信方式
    的头像 发表于 04-12 16:29 157次阅读

    离线语音识别及控制是怎样的技术

    引言:  随着人工智能的飞速发展,离线语音识别技术成为了一项备受瞩目的创新。离线语音识别技术能够将人的语音转化为可理解的文本,无需依赖网络连
    发表于 11-24 17:41

    语音识别技术在智能家居控制系统中的应用与前景

    随着智能家居技术的不断发展,人们对于家居环境的智能化控制需求也越来越高。语音识别技术作为一种智能交互方式,能够为智能家居控制系统提供更加便捷
    的头像 发表于 11-03 09:10 649次阅读

    语音识别技术的行业应用与发展趋势

    一、引言 随着科技的不断发展,语音识别技术已经渗透到各个行业中,并逐渐改变人们的生活方式。本文将探讨
    的头像 发表于 10-18 16:10 434次阅读

    语音合成技术的简介与未来发展

    计算机技术生成人类可听的语音,从而实现语音交互的过程。根据合成方式的不同,语音合成技术可分为以下
    的头像 发表于 09-15 18:17 925次阅读

    5G演进——全面实现5G技术革命的发展之路

    人们普遍认为,5G技术的引入在电信和连接领域具有革命性意义。5G技术革命性体现在支持更快的数据速度、更低的延迟、增强的容量、更大规模的物联
    的头像 发表于 08-24 17:35 719次阅读
    5G演进——全面实现5G<b class='flag-5'>技术革命</b>的发展之路

    语音技术的催化剂:语音标注平台的崛起

    无可否认,人工智能正引领着人类社会的新一轮科技革命。而在这场革命中,语音识别技术无疑是一颗璀璨的明珠。然而,要让AI在语音识别方面表现出色,
    的头像 发表于 08-18 17:25 284次阅读

    存储技术革命!3个数字揭示它的神奇之处EEPROM

    EEPROM:存储技术革命!3个数字揭示它的神奇之处EEPROM,也称为“电可擦可编程只读存储器”,是一种重要的存储技术,可以被用于嵌入式系统和计算机中。它可以存储数据,也可以存储代码。相比于传统
    的头像 发表于 08-03 08:36 1988次阅读
    存储<b class='flag-5'>技术革命</b>!3个数字揭示它的神奇之处EEPROM

    生成式AI:技术革命新时代

    自第一次工业革命以来,每次重大技术革命都会推动人类社会经济飞速增长。新技术能否引发新一轮革命的标准在于,能否广泛应用于生产生活,并解放发展生产力。当前AI大模型的兴起,进一步激发了对高
    的头像 发表于 07-31 22:15 352次阅读
    生成式AI:<b class='flag-5'>技术革命</b>新时代

    生成式AI:技术革命新时代

    自第一次工业革命以来,每次重大技术革命都会推动人类社会经济飞速增长。新技术能否引发新一轮革命的标准在于,能否广泛应用于生产生活,并解放发展生产力。
    的头像 发表于 07-24 09:36 627次阅读

    语音识别唤醒词-开启智能化的语音交互时代

    语音识别唤醒词是指在语音交互系统中使用的特定词语或短语,用于唤醒系统并启动语音识别功能。这项技术的出现为智能化的语音交互带来了
    的头像 发表于 07-09 00:53 1066次阅读

    情感语音合成,让机器如真人一样和我们交流

    语音交互领域,语音合成是重要的一环,其技术也在不断发展。近年来,人们对情感合成的兴趣和需求越来越高。情感语音合成会让机器如真人一样和我们
    的头像 发表于 06-24 03:57 570次阅读