0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于人工智能语音的三次技术跃进详细分析

KIyT_gh_211d74f 2017-12-20 13:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能的诞生没有统一说法。

有部分学者以1950年“人工智能之父”马文·明斯基建造世界上第一台神经网络计算机为起点,到现在,大致经历三段演化和推进。

让我们一起回顾整个过程,来看一下人工智能语音的三次技术跃进。

人工智能语音1.0:一问一答

现在,人工智能语音技术在数码、电子、工业制造领域被广泛应用并且成为全民热议的话题,可是在发展之初它还有很多稚嫩的地方。

关于人工智能时代的讨论有很多,但在消费层面上,真正大范围进入用户试用阶段的人工智能语音应用大概在2010年之后。这个阶段的人工智能语音技术形成了以语音交互为主的感知状态,我们暂且称之为第一阶段。

这时的人工智能语音应用通过算法的演变和大量数据的输入,在技术层面实现自然语音识别和语义理解,针对对话内容进行数据匹配,然后调取相关话题,从而实现简单内容的单向一问一答。

第一阶段在自我学习、逻辑推理方面有很大欠缺,不能针对同一对话内容展开深入交互,横向拓展和纵向发展都不能满足用户需求。

例如你问今天天气如何?他调取今天的天气数据。

接着你问明天的天气如何?他调取明天的天气预报。

今天天气和明天天气只是各自独立的对答,不能连接贯通,形成逻辑。

关于人工智能语音技术的研究,国外企业投入较早,且发展也比较全面。

像Nuance,曾经在语音识别方面功绩卓著,到现在为止仍然是全球最大的语音技术公司,专利数量和市场份额都遥遥领先。之后包括亚马逊、苹果和谷歌,都在深度挖掘智能语音,推出自己的语音助手。

据不完全统计,目前全球专业做人工智能语音的公司有上千家之多,后起之秀越来越多,涉及的领域越来越广。

如总部位于奥地利维也纳的Cortical.io,主要提供新型自然语言理解(NLU)解决方案。

由艾伦人工智能研究所和亚马逊Alexa基金等机构资助KITT.AI公司,开发可定制热词检测器(hotworddetector)和对话引擎ChatFlow。旧金山的MindMeld公司可提供对话式人工智能平台等等。

人工智能语音2.0:有问有答

早在2000年,比尔 · 盖茨就提出“未来10年是语音的时代”。

我们目前所说的智能语音,学术界称为“自然语言处理”(来自百度)。业内人士认为,智能语音技术将会成为人类主流的人机交互方式之一,计算机技术与人工智能领域的发展为智能语音交互发展带来了希望。

人工智能语音交互的更深层阶段——对话,即有问有答,包含上下文逻辑。

举个例子或许更好理解,如果一门课程上一年没开设,对于“这门课程去年有多少同学没通过”这样的问题,机器是回答“都没通过”还是“去年没开这门课”?同时机器还需要提前存储“去年没开这门课”的信息,想想我们从小时候啥也不懂到现在懂得的知识和信息,这是难以想象的数据量。

再比如说“我想听周杰伦的歌”,机器只会将周杰伦的歌显示出来,并不能直接播放。就是说假如你要做一件事情,需要给机器一个明确的指令,否则,会让人很烦躁,因为你要一直说下去。

当然,“对话”层面,仍然停留在“人机对话”阶段,机器仍然停留在被动接受人类输入大量数据阶段,相比“问答”层面,只不过信息流、数据存储量更大,机器仍然不能更深层次理解人的意思,无法实现自学习、自成长,与机器的语音交流还不能像人一样自然。

人工智能语音3.0:自然交互

人工智能进入第三阶段,最大的进展就是交互的进展。不仅仅有问有答,不仅仅包含上下文逻辑了,人工智能硬件能够更多地融合各种环境信息,作出不同决策或推荐。也就说,在交互的过程中,机器有了更多的主动性,能够为人提供更多、更好的帮助,让人们的生活更便捷,更安全,更有趣。

有两个比较典型的应用场景,一个是智能汽车,一个是智能家居

2010年,谷歌秘密研究的无人汽车项目被《***》记者曝光,当时引起了不小的震动。无人汽车即无人驾驶汽车,也叫智能汽车,主要是通过车载传感系统感知道路环境,并依靠车内的人工智能系统自动规划行车路线,到达预定目的地。

谷歌无人驾驶汽车在开放道路上行驶时,会对来往车辆、行人,路面环境信息进行识别与分析,为系统的决策判断提供依据。系统经过长期的“学习”后,人工智能具备的策略神经元将变得更加熟练高效,并形成类似于人的“感觉”,能及时处理驾驶过程中的突发情况。

2016年1月,美国国家公路安全交通管理局(NHTSA)在其网站上发布了***,表示根据联邦政府现行法律规定,谷歌的无人驾驶汽车采用的人工智能系统可以被视为“司机”。这被视为是人工智能发展里程碑的事件,也标志着“智能”可以像“人工”一样感知、判断、推理并做出决策,可以实现主动控制,也能更好地人机交互与协同。

在智能家居领域,人工智能的发展方向同样是人机交互、操作简单、通过大数据能够进行自主判断决策。

长虹前不久推出了人工智能电视新品Q5K,主打语义理解和模糊搜片。不需要绝对明确的指令,人工智能电视能识别和理解用户的语义。比如当用户说“太暗了”时,电视能理解那是什么意思并知道该怎么做,而不是非得等用户说出“调高亮度”。

再比如,最近热播的一部电视剧《那年花开月正圆》,名字太长很多人记不住,但只要你说“我想看花开月圆”,长虹人工智能电视也能找到这部片。如果连这几个字都记不住,说“我想看陈晓的电视剧”,它也会根据热播影视数据推荐出这部片来。甚至于说到“我想看陈妍希老公的电视剧”,这台电视也能理解,你所说的八成就是这部由陈晓主演、最近热播的《那年花开月正圆》,并为你播放出来。

这就相当于机器真正有了“大脑”,从而可以感知,交互,理解和决策。因此,也就能够更好地为人类服务了。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1821

    文章

    50511

    浏览量

    267745

原文标题:1.0到3.0:人工智能语音的三次技术跃进

文章出处:【微信号:gh_211d74f707ff,微信公众号:重庆人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    嵌入式人工智能课程(华清远见)

    嵌入式 AI 编译器优化:华清远见课程,解锁极致端侧性能 随着人工智能从云端全面向边缘侧和终端侧下沉,“万物智联”的时代已经悄然到来。然而,在这股浪潮背后,隐藏着一个巨大的技术鸿沟:在算力受限
    发表于 04-16 18:47

    TCP三次握手与四挥手的详细过程

    TCP 三次握手和四挥手,大概是网络领域被问烂了的面试题。但真正能把状态变迁、序列号变化、抓包细节讲清楚的人并不多。很多人背了八股文,一到生产环境看 Wireshark 抓包就懵了
    的头像 发表于 02-25 10:38 532次阅读

    浅谈人工智能(2)

    接前文《浅谈人工智能(1)》。 (5)什么是弱人工智能、强人工智能以及超人工智能? 弱人工智能(Weak AI),也称限制领域
    的头像 发表于 02-22 08:24 440次阅读
    浅谈<b class='flag-5'>人工智能</b>(2)

    云知声斩获2025全国人工智能应用场景典型案例

    近日,由中国人工智能学会、苏州市人民政府、苏州大学共同主办的第届全国人工智能应用场景创新挑战赛总决赛暨全国人工智能+应用场景创新大会在苏州举办。云知声申报的《基于大模型和
    的头像 发表于 02-06 09:07 609次阅读

    浑圆天成!Profinet转EtherCAT网关模块配置的详细分析

    浑圆天成!Profinet转EtherCAT网关模块配置的详细分析 浑圆天成!Profinet转EtherCAT网关模块配置的详细分析 在某工厂的生产系统中,需实现西门子S7-1200PLC与伺服
    的头像 发表于 12-24 17:27 784次阅读
    浑圆天成!Profinet转EtherCAT网关模块配置的<b class='flag-5'>详细分析</b>

    TCP的三次握手

    ,Server进入SYN_RCVD状态。 (3)第三次握手:Client收到确认后,检查ack是否为J+1,ACK是否为1,如果正确则将标志位ACK置为1,ack=K+1,并将该数据包发送给Server
    发表于 12-02 07:16

    微软与新思科技分享智能人工智能技术的行业影响

    (Agentic AI)技术的行业影响,以及未来跨界合作的前景。此次圆桌讨论不仅展现了双方的战略协同,以及他们在开发市场领先解决方案方面的共同努力,也勾勒出人工智能是如何驱动工程、电信、制药等行业变革的新蓝图。
    的头像 发表于 11-30 09:48 600次阅读

    从电网到栅极:赋能第三次能源革命

    开启。随后在美国发生了第二能源革命,20 世纪石油产业的繁荣推动了汽车和电力领域取得前所未有的进步。 如今,人工智能 (AI) 的快速发展正在引领第三次能源革命,涵盖产生、转换和分配为我们正在消耗的大量数据提供动力所需的能源。
    的头像 发表于 11-14 10:19 842次阅读
    从电网到栅极:赋能第<b class='flag-5'>三次</b>能源革命

    人工智能+”行动重磅发布!ElfBoard助力嵌入式教育智能化升级

    8月26日,国务院《关于深入实施“人工智能+”行动的意见》(以下简称《意见》)正式公布,为中国加快推进“人工智能+”提供了重要指引。《意见》提出了加快实施“人工智能+”科学
    的头像 发表于 08-30 16:07 6713次阅读
    “<b class='flag-5'>人工智能</b>+”行动重磅发布!ElfBoard助力嵌入式教育<b class='flag-5'>智能</b>化升级

    人工智能+”,走老路难赚到新钱

    昨天的“人工智能+”刷屏了,这算是官方第一对“人工智能+”这个名称定性吧?今年年初到现在,涌现出了一大批基于人工智能的创业者,这已经算是AI2.0时代的第
    的头像 发表于 08-27 13:21 954次阅读
    “<b class='flag-5'>人工智能</b>+”,走老路难赚到新钱

    影响电解电容寿命的主要因素及其详细分析

    电解电容的寿命受多种因素影响,这些因素相互作用,共同决定了电容在实际使用中的可靠性和稳定性。以下是影响电解电容寿命的主要因素及其详细分析: 一、核心影响因素:温度 高温加速老化 化学机制 :电解液中
    的头像 发表于 08-08 16:15 2602次阅读

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    和生态体系带到使用者身边 ,让我们在技术学习和使用上不再受制于人。 、多模态实验,解锁AI全流程 它嵌入了2D视觉、深度视觉、机械手臂、语音识别、嵌入式传感器等多种类AI模块,涵盖人工智能
    发表于 08-07 14:23

    关于人工智能处理器的11个误解

    本文转自:TechSugar编译自ElectronicDesign人工智能浪潮已然席卷全球,将人工智能加速器和处理器整合到各类应用中也变得愈发普遍。然而,围绕它们是什么、如何运作、能如何增强
    的头像 发表于 08-07 13:21 1337次阅读
    <b class='flag-5'>关于</b><b class='flag-5'>人工智能</b>处理器的11个误解

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模
    发表于 07-04 11:10