0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌的AI智能助手带来6种新声音,发音更贴近人类自然语言

机器学习算法与人工智能 来源:未知 作者:李倩 2018-05-10 16:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Google I/O 谷歌开发者大会

为期三天的Google I/O开发者大会在美国开幕。在刚刚结束的主题演讲上,谷歌CEO桑达尔-皮查伊(Sundar Pichai)和各产品线负责人讲解了自家的AIAndroid系统、谷歌助手等产品的进展。

今年的主角依然是AI人工智能,它已经融入谷歌产品与软件系统中,但这次,谷歌在讲解AI或产品功能时候从理解人类和人性的角度举例,把AI带到了科技与人文的十字路口上。

AI:贴近人性并对人类有帮助

谷歌CEO皮查伊用两个卡通图标举例作为开场白,说明谷歌对信息真实的追求。AI是第一个被提及的话题,皮查伊将之具体到医疗领域,用视网膜扫描诊断疾病的具体案例来解释机器学习的能力,让观众能理解AI对人类的作用——“医疗就是AI能改变的重要领域”。

以往在Google I/O上大谈代码只有码农们兴奋而旁人无感的状况终于有所改进,皮查伊将每个技术点都具体化,例如谷歌相册中找到朋友的婚礼照片,下面会提示是不是要分享给她;或是一张较昏暗的照片提示用户要不要调整。

另外,谷歌公布了自己的人工智能专用芯片TPU3.0,相比上代,它使用液冷,计算力是去年TPU2.0的8倍,可以更快更智能解决更多问题。但这部分只有两句,并未过过解释。

Google Assistant:连声音都更像人类

Google Assistant(谷歌助手)是本次开发者大会介绍的第二个重要新品,它是谷歌的AI智能助手,这次更新带来6种新声音,并且发音更贴近人类自然语言,不那么像机器人发出来的声音。

皮查伊介绍说它的声调、节奏等都更接近人类。他们在录音室里采集了人类的声音,捕捉声音特质,之后分析特征融入Google Assistant中。

谷歌宣布了自己的AI语音助手发布2年后,已经支持30种语音,在80个国家可用;一些细节改变还有:1)持续性对话,不用每次都喊Hey Google唤醒一次才问一个问题,它可以连续回答;2)家庭使用场景,例如孩子跟谷歌助手对话时候,如果他比较礼貌的说“请”字,谷歌助手也会给更nice的回答——谷歌希望用这种不为人注意的细节,来告诉用户自己的AI助手有多周到。

除了声音,谷歌助手在视觉表达方面也有所改进。现场采用中国公司联想的“智能显示器”来展示谷歌助手在视觉方面给人们的反馈,还有手机上的语音搜索展示;在开车时候,如果用声音控制,谷歌助手也会融合在谷歌地图上,给人类声音+视觉展示,把导航这件事做得更好。

皮查伊演示了两个极为科幻的场景:你要理发,喊谷歌助手预定,它会给理发店打电话,并回答出理发店里店员“几点理发”“预定客人的名字”等信息;或者预定餐馆,如果没位置,它也能学会变通改预定时间——全程是谷歌助手(机器)在和一个人类流畅的对话,它的声音仿佛一个人类,回答方式也是一个人类,没有机械刻板的痕迹。

预约理发和餐馆这两个场景非常生活化,这么自然的场景,你手机里的智能助手就独立能完成。谷歌告诉世人,他们真的把自己的额智能助理变成了人,并在自己的发布会上演出了科幻片里的情节。

虽然我们相信实际生活中不会像舞台演示这么流畅,但谷歌助手已经展示了目前AI助手的发展方向,就是朝着人类的方向进化。

Google News:AI做新闻

谷歌自己不是媒体不做新闻,但他们的Google News用AI介入了人们阅读新闻方式,第一个特征可以粗略理解为高端版“今日头条”,它的有些方式很像关联阅读,你看了条朝鲜韩国领导人见面,它会关联推送其他相关新闻。

第二个特征,360度报道,让用户了解整个新闻的来龙去脉。比如某地停电,在新闻前后有这件事本身、人们需要做什么,以前以后相关的相关事件。他们想让用户知道一件事,并在后台绘制出一张脉络图,让用户完整理解这件事——这基本等于机器自己搭建了一个专题。

第三个特征是让用户订阅自己需要的媒体,目前Google News已经进入127个国家和地区,在Android和iOS上都能找到。

Android P:帮用户戒掉手机瘾

十年前,谷歌发布了搭载Android系统的首款手机G1,影响了智能手机的变化。如今的Android系统没有大幅变化,一切尽在细节中:加入了更多智能体现,例如根据用户习惯判别使用情况来节省电力;根据用户喜好(手机亮度跳到了多高等)来自动判别亮度,让用户大幅降低手动调整亮度的机会,号称准确率到了60%;应用预测,学习用户习惯和使用情景,来给用户提供有效的App建议。

在界面方面,Android系统的界面变得更简单,并加入了更多手势。在这点上,谷歌似乎借鉴了iPhone X的手势(或者说他们都借鉴了webOS),在现场演示的Pixel手机上,底部有个小横条,滑动返回桌面,或是切换App,跟iPhone X实现方式接近。

谷歌希望Android P能帮人了解自己用手机做什么,防止沉迷在数字世界里。比如现在每个App都能统计使用时间,看看你究竟用手机做什么;到睡觉时间提醒人类并把手机屏幕调成灰色——帮用户戒掉手机瘾。

今天Android P Beta测试版已经上线,在谷歌提到的适配手机厂商中大半来自中国:一加,小米,ov与索尼诺基亚等国际厂商放在一起,成为了第一批支持厂商。

Google Maps+Google Lens:兴趣推荐

谷歌给地图加了更丰富的地点相关概念,利用AI和卫星图像技术,可以了解新地址和商家,另外推荐最近的路程和附近最适合你的餐厅。其实类似功能目前高德,百度地图等也有尝试。

谷歌地图这次跟手机摄像头结合了,例如你不知道在哪,打开镜头,它会采集街头画面,之后将实景与地图结合,告诉用户该想哪走。

这个功能其实Google Lens与地图的融合,它是一款基于图像识别和OCR技术的人工智能应用,这次被用在地图这种实用场景里;另外Google Lens本身也得到了加强,例如拍一张纸,上面的字可以识别并从纸上“粘贴”到手机里。

无人驾驶:车自己预判路况

2016年,谷歌的母公司Alphabet宣布将自动驾驶汽车项目分拆为一家单独的公司Waymo,这次的无人驾驶汽车和部分就由Waymo的CEO John Krafcik上台讲解,他介绍了Waymo无人驾驶汽车的近况:已在亚利桑那州凤凰城上路,AI的介入让无人驾驶的错误已经减少了100多倍,可让无人驾驶汽车更安全。

目前Waymo有2.5万辆车每天在路上验证各种路况。Waymo的讲解人举了个例子来说明神经网络的学习结果:无人车可以自己预测人们或车在横穿马路、闯红灯等行为提前预判,防止在过十字路口时候撞到闯红灯人或车。

总结:给AI加上人性

这是一场名副其实的开发者大会,没有硬件发布,也似乎没有一种系统是大革命性更新。这其实已经不是第一年这样了——AI的介入,让每件产品都有了机器学习的属性,更新在了潜移默化中。

相比之下,UI界面改头换面这种表层的惊喜少了,所有的改进似乎都是细枝末节。智能化的演进在每分每秒进行,根据用户使用习惯而悄悄变化。

对比之前,这场主题演讲特殊之处就是无时不忘提到AI对人类的帮助,以及AI资深的人性化(比如教小朋友说”请“),理工男们用这种方式让外界理解自己打造一个“更美好世界”的梦想,这也是硅谷所有科技公司的态度,所不同的是,这个目的是AI帮助人类实现的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6246

    浏览量

    110338
  • 语音助手
    +关注

    关注

    7

    文章

    241

    浏览量

    27540
  • 自然语言
    +关注

    关注

    1

    文章

    292

    浏览量

    13929

原文标题:2018 Google I/O放出6个大招,AI打电话能骗过人类

文章出处:【微信号:machinelearningai,微信公众号:机器学习算法与人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    云知声论文入选自然语言处理顶会EMNLP 2025

    近日,自然语言处理(NLP)领域国际权威会议 ——2025 年计算语言学与自然语言处理国际会议(EMNLP 2025)公布论文录用结果,云知声提交的《面向门诊病历生成的高质量医患对话合成技术
    的头像 发表于 11-10 17:30 590次阅读
    云知声论文入选<b class='flag-5'>自然语言</b>处理顶会EMNLP 2025

    AI赋能6G与卫星通信:开启智能天网新时代

    连接到6G网络,AI确保了即使在信号较弱的情况下,也能提供高质量的通信服务。 AI让\"天网\"智能 随着技术的不断进步,
    发表于 10-11 16:01

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予了人的智能,科学家们希望在没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范
    发表于 09-17 11:45

    【HZ-T536开发板免费体验】5- 无需死记 Linux 命令!用 CangjieMagic 在 HZ-T536 开发板上搭建 MCP 服务器,自然语言轻松控板

    引言:为什么需要 “自然语言控板”? 痛点引入 :嵌入式开发中,开发者常需通过 SSH 等工具登录开发板,手动输入复杂的 Linux 命令(如ls -l、gpio readall、ifconfig等
    发表于 08-23 13:10

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    DeepSeek-R1:强大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的新一代AI大模型。其核心优势在于强大的推理引擎能力,融合了自然语言处理(
    发表于 07-16 15:29

    如何在MATLAB中构建智能语音助手

    具身智能是一智能与物理实体深度融合的人工智能形态,强调智能行为既依赖智能体自身算力,
    的头像 发表于 06-30 14:30 2839次阅读
    如何在MATLAB中构建<b class='flag-5'>智能</b>语音<b class='flag-5'>助手</b>

    正点原子 AI BOX0 智能伴侣,1.54寸高清屏+长效续航,语音畅聊,情景对话,知识科普,多色可选,随身携带!

    正点原子 AI BOX0携小智AI来袭,专属你的智能伴侣!你的全能AI伙伴,懂你贴心 正点原子ESP32
    发表于 04-24 16:11

    自然语言提示原型在英特尔Vision大会上首次亮相

    在英特尔Vision大会上,Network Optix首次展示了自然语言提示原型,该方案将重新定义视频管理,为各行各业由AI驱动的洞察和效率提速。
    的头像 发表于 04-09 09:30 815次阅读

    AI Agent 应用与项目实战》----- 学习如何开发视频应用

    学习、自然语言处理(NLP)、计算机视觉(CV)等先进技术提供的强大的数据处理和分析能力。 在视频应用开发中,AI Agent可以用于视频内容分析、推荐、编辑等。 下面跟随作者的指导,使用语聚AI平台
    发表于 03-05 19:52

    AI Agent 应用与项目实战》阅读心得2——客服机器人、AutoGen框架 、生成式代理

    ,Airtable负责知识库管理,Voiceflow处理对话流程设计,再配合GPT模型进行自然语言理解和生成。前端功能设计中引入了用户意图识别模块,能够准确捕捉用户的查询意图并进行多维度分类,这种分类机制使得系统能够
    发表于 02-25 21:59

    AI智能体套件

    智能解决方案。一、应用领域AI智能体套件具备自然语言处理、机器学习以及人机交互能力,可以渗入用户的日常生活与工作环境,对传统设备进行升级。教育领域:
    发表于 02-25 16:48 0次下载

    AI Agent 应用与项目实战》第1-2章阅读心得——理解Agent框架与Coze平台的应用

    。 谈到Agent,就不得不提到目前AI应用领域的领头羊——OpenAI公司的对于的看法。OpenAI 先前向我们公开了它 AGI 五层路线图,第一层 L1的 Chatbot 代表基础的自然语言处理能力
    发表于 02-19 16:35

    谷歌AI智能体执行复杂任务能力大幅提升

    自然语言描述任务,随后由AI智能体代替用户执行并最终完成任务,极大地提升工作效率和便捷性。 为了推进这一技术的实现,谷歌正在积极开发两个相关项目。其中备受瞩目的是名为“Mariner”
    的头像 发表于 02-17 14:39 1028次阅读

    名单公布!【书籍评测活动NO.55】AI Agent应用与项目实战

    出来,当前的AI Agent并不仅仅是简单的对话机器人或根据固定流程的自动化程序,而是成为了一能够自主完成任务的智能体,它正在迅速改变人类的工作和生活方式。其核心特性包括自主性、学习
    发表于 01-13 11:04

    AI芯片在智能手机中具体怎么用?

    物,并允许用户单独编辑每个部分。 语音识别和智能助手AI芯片可以实现对用户语音的实时识别和处理,提供智能助手功能。通过语音识别,用户可以
    的头像 发表于 01-03 14:02 1912次阅读