0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌的AI智能助手带来6种新声音,发音更贴近人类自然语言

机器学习算法与人工智能 来源:未知 作者:李倩 2018-05-10 16:34 次阅读

Google I/O 谷歌开发者大会

为期三天的Google I/O开发者大会在美国开幕。在刚刚结束的主题演讲上,谷歌CEO桑达尔-皮查伊(Sundar Pichai)和各产品线负责人讲解了自家的AIAndroid系统、谷歌助手等产品的进展。

今年的主角依然是AI人工智能,它已经融入谷歌产品与软件系统中,但这次,谷歌在讲解AI或产品功能时候从理解人类和人性的角度举例,把AI带到了科技与人文的十字路口上。

AI:贴近人性并对人类有帮助

谷歌CEO皮查伊用两个卡通图标举例作为开场白,说明谷歌对信息真实的追求。AI是第一个被提及的话题,皮查伊将之具体到医疗领域,用视网膜扫描诊断疾病的具体案例来解释机器学习的能力,让观众能理解AI对人类的作用——“医疗就是AI能改变的重要领域”。

以往在Google I/O上大谈代码只有码农们兴奋而旁人无感的状况终于有所改进,皮查伊将每个技术点都具体化,例如谷歌相册中找到朋友的婚礼照片,下面会提示是不是要分享给她;或是一张较昏暗的照片提示用户要不要调整。

另外,谷歌公布了自己的人工智能专用芯片TPU3.0,相比上代,它使用液冷,计算力是去年TPU2.0的8倍,可以更快更智能解决更多问题。但这部分只有两句,并未过过解释。

Google Assistant:连声音都更像人类

Google Assistant(谷歌助手)是本次开发者大会介绍的第二个重要新品,它是谷歌的AI智能助手,这次更新带来6种新声音,并且发音更贴近人类自然语言,不那么像机器人发出来的声音。

皮查伊介绍说它的声调、节奏等都更接近人类。他们在录音室里采集了人类的声音,捕捉声音特质,之后分析特征融入Google Assistant中。

谷歌宣布了自己的AI语音助手发布2年后,已经支持30种语音,在80个国家可用;一些细节改变还有:1)持续性对话,不用每次都喊Hey Google唤醒一次才问一个问题,它可以连续回答;2)家庭使用场景,例如孩子跟谷歌助手对话时候,如果他比较礼貌的说“请”字,谷歌助手也会给更nice的回答——谷歌希望用这种不为人注意的细节,来告诉用户自己的AI助手有多周到。

除了声音,谷歌助手在视觉表达方面也有所改进。现场采用中国公司联想的“智能显示器”来展示谷歌助手在视觉方面给人们的反馈,还有手机上的语音搜索展示;在开车时候,如果用声音控制,谷歌助手也会融合在谷歌地图上,给人类声音+视觉展示,把导航这件事做得更好。

皮查伊演示了两个极为科幻的场景:你要理发,喊谷歌助手预定,它会给理发店打电话,并回答出理发店里店员“几点理发”“预定客人的名字”等信息;或者预定餐馆,如果没位置,它也能学会变通改预定时间——全程是谷歌助手(机器)在和一个人类流畅的对话,它的声音仿佛一个人类,回答方式也是一个人类,没有机械刻板的痕迹。

预约理发和餐馆这两个场景非常生活化,这么自然的场景,你手机里的智能助手就独立能完成。谷歌告诉世人,他们真的把自己的额智能助理变成了人,并在自己的发布会上演出了科幻片里的情节。

虽然我们相信实际生活中不会像舞台演示这么流畅,但谷歌助手已经展示了目前AI助手的发展方向,就是朝着人类的方向进化。

Google News:AI做新闻

谷歌自己不是媒体不做新闻,但他们的Google News用AI介入了人们阅读新闻方式,第一个特征可以粗略理解为高端版“今日头条”,它的有些方式很像关联阅读,你看了条朝鲜韩国领导人见面,它会关联推送其他相关新闻。

第二个特征,360度报道,让用户了解整个新闻的来龙去脉。比如某地停电,在新闻前后有这件事本身、人们需要做什么,以前以后相关的相关事件。他们想让用户知道一件事,并在后台绘制出一张脉络图,让用户完整理解这件事——这基本等于机器自己搭建了一个专题

第三个特征是让用户订阅自己需要的媒体,目前Google News已经进入127个国家和地区,在Android和iOS上都能找到。

Android P:帮用户戒掉手机瘾

十年前,谷歌发布了搭载Android系统的首款手机G1,影响了智能手机的变化。如今的Android系统没有大幅变化,一切尽在细节中:加入了更多智能体现,例如根据用户习惯判别使用情况来节省电力;根据用户喜好(手机亮度跳到了多高等)来自动判别亮度,让用户大幅降低手动调整亮度的机会,号称准确率到了60%;应用预测,学习用户习惯和使用情景,来给用户提供有效的App建议。

在界面方面,Android系统的界面变得更简单,并加入了更多手势。在这点上,谷歌似乎借鉴了iPhone X的手势(或者说他们都借鉴了webOS),在现场演示的Pixel手机上,底部有个小横条,滑动返回桌面,或是切换App,跟iPhone X实现方式接近。

谷歌希望Android P能帮人了解自己用手机做什么,防止沉迷在数字世界里。比如现在每个App都能统计使用时间,看看你究竟用手机做什么;到睡觉时间提醒人类并把手机屏幕调成灰色——帮用户戒掉手机瘾。

今天Android P Beta测试版已经上线,在谷歌提到的适配手机厂商中大半来自中国:一加,小米,ov与索尼诺基亚等国际厂商放在一起,成为了第一批支持厂商。

Google Maps+Google Lens:兴趣推荐

谷歌给地图加了更丰富的地点相关概念,利用AI和卫星图像技术,可以了解新地址和商家,另外推荐最近的路程和附近最适合你的餐厅。其实类似功能目前高德,百度地图等也有尝试。

谷歌地图这次跟手机摄像头结合了,例如你不知道在哪,打开镜头,它会采集街头画面,之后将实景与地图结合,告诉用户该想哪走。

这个功能其实Google Lens与地图的融合,它是一款基于图像识别和OCR技术的人工智能应用,这次被用在地图这种实用场景里;另外Google Lens本身也得到了加强,例如拍一张纸,上面的字可以识别并从纸上“粘贴”到手机里。

无人驾驶:车自己预判路况

2016年,谷歌的母公司Alphabet宣布将自动驾驶汽车项目分拆为一家单独的公司Waymo,这次的无人驾驶汽车和部分就由Waymo的CEO John Krafcik上台讲解,他介绍了Waymo无人驾驶汽车的近况:已在亚利桑那州凤凰城上路,AI的介入让无人驾驶的错误已经减少了100多倍,可让无人驾驶汽车更安全。

目前Waymo有2.5万辆车每天在路上验证各种路况。Waymo的讲解人举了个例子来说明神经网络的学习结果:无人车可以自己预测人们或车在横穿马路、闯红灯等行为提前预判,防止在过十字路口时候撞到闯红灯人或车。

总结:给AI加上人性

这是一场名副其实的开发者大会,没有硬件发布,也似乎没有一种系统是大革命性更新。这其实已经不是第一年这样了——AI的介入,让每件产品都有了机器学习的属性,更新在了潜移默化中。

相比之下,UI界面改头换面这种表层的惊喜少了,所有的改进似乎都是细枝末节。智能化的演进在每分每秒进行,根据用户使用习惯而悄悄变化。

对比之前,这场主题演讲特殊之处就是无时不忘提到AI对人类的帮助,以及AI资深的人性化(比如教小朋友说”请“),理工男们用这种方式让外界理解自己打造一个“更美好世界”的梦想,这也是硅谷所有科技公司的态度,所不同的是,这个目的是AI帮助人类实现的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5835

    浏览量

    103219
  • 语音助手
    +关注

    关注

    7

    文章

    223

    浏览量

    26606
  • 自然语言
    +关注

    关注

    1

    文章

    268

    浏览量

    13195

原文标题:2018 Google I/O放出6个大招,AI打电话能骗过人类

文章出处:【微信号:machinelearningai,微信公众号:机器学习算法与人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    自然语言处理的研究内容

    自然语言处理(NLP)的最新发展改变了我们与AI系统的交互方式: 1. 预训练模型:像 GPT-3 这样的模型已经进步,使人工智能能够在聊天机器人和虚拟助手中生成更连贯的上下文感知响应
    的头像 发表于 01-18 16:39 179次阅读

    模型与人类的注意力视角下参数规模扩大与指令微调对模型语言理解的作用

    近期的大语言模型(LLM)在自然语言理解和生成上展现出了接近人类的强大能力,远远优于先前的BERT等预训练模型(PLM)。
    的头像 发表于 01-04 14:06 150次阅读
    模型与<b class='flag-5'>人类</b>的注意力视角下参数规模扩大与指令微调对模型<b class='flag-5'>语言</b>理解的作用

    2023年科技圈热词“大语言模型”,与自然语言处理有何关系

    电子发烧友网报道(文/李弯弯)大语言模型(LLM)是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本,还能够深入理解文本含义,处理各种自然语言任务,如文本摘要、问答、翻译
    的头像 发表于 01-02 09:28 1358次阅读

    AI智能呼叫中心

    、数据驱动决策以及人力成本节约,旨在深入剖析其核心优势和对企业的重要意义。一、自动化处理AI智能呼叫中心通过引入自然语言处理(NLP)、机器学习和自动化技术,使得呼叫中心的处理过程更加高效和准确,
    发表于 09-20 17:53

    自然语言处理和人工智能的区别

      自然语言处理(Natural Language Processing,NLP)是人工智能(AI)中的一个分支,它利用计算机技术对自然语言进行处理,使得电脑能够理解和操作
    发表于 08-28 17:32 891次阅读

    自然语言处理和人工智能的概念及发展史 自然语言处理和人工智能的区别

    自然语言处理(Natural Language Processing, NLP)的定义是通过电脑软件程序实现人们日常语言的机器自动处理。为了帮助计算机理解,掌握自然语言处理的基本原理,需要涉及到
    发表于 08-23 18:22 520次阅读

    自然语言处理的概念和应用 自然语言处理属于人工智能

      自然语言处理(Natural Language Processing)是一种人工智能技术,它是研究自然语言与计算机之间的交互和通信的一门学科。自然语言处理旨在研究机器如何理解
    发表于 08-23 17:31 807次阅读

    自然语言处理的优缺点有哪些 自然语言处理包括哪些内容

    自然语言处理(Natural Language Processing)是一种人工智能的技术及领域,它致力于让计算机理解及处理人类语言。它可以帮助计算机对
    发表于 08-23 17:26 2438次阅读

    自然语言理解问答对话文本数据,赋予计算机智能交流的能力

    自然语言理解(Natural Language Understanding,简称NLU)问答对话文本数据是现代人工智能领域的一项重要资源。这些数据集涵盖了用户与计算机之间的自然语言交互,旨在让计算机
    的头像 发表于 08-07 18:11 406次阅读

    自然语言处理包括哪些内容 自然语言处理技术包括哪些

    自然语言处理(Natural Language Processing, NLP)一般包括以下内容: 语音识别(Speech Recognition):将人类语言转换为计算机可以理解的形式。 语音合成
    的头像 发表于 08-03 16:22 3795次阅读

    AI 人工智能的未来在哪?

    人工智能AI智能大模型已经孵化;繁衍过程将突飞猛进,ChatGPT已经上线。 世界首富马斯克认为AI人类是一
    发表于 06-27 10:48

    自然语言理解的数据定制服务:赋能智能化应用的关键

    在数字化时代,自然语言理解(Natural Language Understanding,NLU)成为了构建智能化应用的重要基石。NLU技术能够使机器理解和解释人类语言,从而实现
    的头像 发表于 06-18 21:22 192次阅读

    AI打LeetCode周赛进入前10%!秘诀:自然语言编程

    首先,自然语言表达是模糊的和不精确的。我们所讲的语言中,存在很多概念和意思是相对的和依赖语境的,这些难以在计算机程序中得到明确和一致的表达,这都给程序的理解使用和调试带来了很大困难。
    的头像 发表于 06-05 16:34 311次阅读
    <b class='flag-5'>AI</b>打LeetCode周赛进入前10%!秘诀:<b class='flag-5'>自然语言</b>编程

    PyTorch教程16.7之自然语言推理:微调BERT

    电子发烧友网站提供《PyTorch教程16.7之自然语言推理:微调BERT.pdf》资料免费下载
    发表于 06-05 10:52 0次下载
    PyTorch教程16.7之<b class='flag-5'>自然语言</b>推理:微调BERT

    PyTorch教程16.5之自然语言推理:使用注意力

    电子发烧友网站提供《PyTorch教程16.5之自然语言推理:使用注意力.pdf》资料免费下载
    发表于 06-05 10:49 0次下载
    PyTorch教程16.5之<b class='flag-5'>自然语言</b>推理:使用注意力