不忘初心,AI前行。技术愈精,情怀越高。
刚刚,Google I/O 2019大会开幕。
2小时主题演讲,全球AI第一大厂秀出最新黑科技进展,并且情怀依然满分,Google用行动诠释科技向善。
今年大会演讲主题:Keep making magic.
究竟Google的最新黑科技魔法有哪些?量子位带你一文打尽。
开场:不忘初心
大会开始,Google CEO桑达·皮猜在一片欢呼中微笑登场。
劈柴哥说今年Google I/O,视觉能力与众不同,比如观看方式加入了AR体验,通过手机,利用一个App就能身临其境、解答一切。
而且别看事情小,背后驱动是Google的初心和使命:整合全球信息,使人人都能访问并从中受益。
Our mission is to organize the world’s information and make it universally accessible and useful.
劈柴哥强调,正是这样的使命,让代代Google人推出更好的产品,帮用户更高效,让用户更快乐,要做更有用的Google.
一切自然离不开AI。
AI视觉成新入口
Google CEO先从去年推出的谷歌信息流说起,虽然这还遭到李彦宏感慨——谷歌学师百度,但劈柴哥解释,希望能在准确搜索之后,进一步让用户更完整了解世界。
背后都是机器学习、AR和AI等前沿黑科技。
比如你Google一下搜索黑洞,Google AI就能给你推荐相关新闻,包括给出一条完整的信息流时间线,展示黑洞是如何被发现的。
这其中,Google还解锁了越来越多视觉能力,让用户想要的信息更直观准确呈现。
比如利用AR视觉能力,搜索不仅准确提供结果,还能360°全面了解。
你想买一双鞋:
或者小朋友想了解大白鲨:
那有没有可能是看到一张图片,也想知道更多相关信息?
谷歌说Google Lens——智能拍照图搜应用,为此而生。而且不是拍照识别那么简单。
现在Google Lens还能做更多。
拍菜单,自动显示大众点评高赞菜,拍小票,自动计算金额和小费。
Google Lens只是入口,还结合了诸多其他Google App的能力。
比如地图、翻译、大众点评……一个入口背后,集齐谷歌全家桶能力。
那如果大字不识一个,能不能享受到AI福祉?
Google拿出第一个情怀大满足案例。
用Google Go就可以了。
现场举例,在印度,文盲大姐姐通过Google Go,即便大字不识一个,还只能说印地语,也能手机拍照,然后让手机自动朗读出来,用智能手机了解想要了解的一切——无论线上还是线下。
目前,Google Go已经包含印地语、中文在内的10多种语言。
谷歌团队将Google Go整个大小控制在100kb以下,35美元价位(200元)的手机,有摄像头就能使用。
真正做到用得起、用得好,一款Google Go在手,世界说走就走。
毫无疑问,现场掌声和欢呼声一片。
AI语音助手更全能
视觉之外,就是AI在语音语言方面的能力。
劈柴哥先从Duplex说起。
去年,Google推出了震惊四方的打电话AI系统Duplex,并在一年内实现了全美40多个州商用。
今年Google会把这项功能扩展到网络上,叫做Duplex on the web,帮你租车、预订电影票和餐厅座位。
比如你想租车,用Duplex打开租车公司的网站,这个AI就能代替你填写所有必要信息。在提交订单之前,人类只需要核对一下信息点击即可。
Duplex还可以理解日历行程信息、Gmail邮件内容,自动在填写订单时补全信息。
怎么说呢,虽已过当红阶段,但Duplex变得更强更务实。
而Duplex之源——Google AI助理Google Assistant也有大进展。
Google宣布升级AI语音助手,并把语音交互能力完全放入手机。
优秀到什么程度?
整个过程完全不用上手,也不需要反复用唤醒词,语音交互就能实现对手机的全过程操控。
更厉害的是语音识别速度保持在1秒以内,比用手更快。
现场小姐姐的演示,搞得人心激动。
Google解释,之所以如此流畅,是因为他们谷歌数据中心的语音识别模型“塞进了口袋”,原本100GB模型被压缩到0.5GB,使得集成到手机中成为可能。
而且,更小的模型还降低了网络延迟,交互速度提升10倍。
值得一提的是,Google的语音助手,还能跨App操作、完成任务,比Siri不知高到哪去了。
现场举例,如果你正在和朋友聊天,突然想发送一张过去旅游的照片,你只需要告诉它你照片是在哪拍的、里面有什么内容,AI助手就能把照片直接发送过去。
只可惜,Google的AI语音助手,Google的这个福音技术,只能在Google“亲儿子”——Pixel手机上使用。
当然,依然是AI语音语言能力,还有技术牛X,情怀满分的新能力。
Google AI可以给任何视频加字幕。
之前,YouTube视频即使上传者没有给字幕,也能通过自动识别添加实时字幕。
现在Google把这个能力带到了任何视频中——需要强调的是手机终端,没联网也OK.
无论是相册中自己拍的视频、网页中的视频、聊天视频,统统能加上字幕,以后再也不怕地铁上看剧听不清对话了。
但如果只把技术用到这一步,Google就不会是那个人类希望了。
Google这次展示了Live Relay的技术,用语音识别和TTS,帮助聋哑人士接电话。
比如打进来的声音,转化成文字,然后让聋哑人可以像回复短信一样接电话,输入的文字会实时转写、自动变成语音发出去。
更贴心的是,Live Relay还利用了Google智能预测和回复功能。对打字内容做出预测。
不要担心打字速度跟不上语音,一切实时甚至“提前”进行,转写质量也很高,打字速度能跟上语音通话的速度。
现场都被Google的情怀填满了。
这项技术也被叫作:不开口就能打电话。
聋哑人群体能更好享受智能手机和AI的便利了。
安卓10:离线实时转写速记
接下来是最新安卓版本:Android Q.
Google先披露了最新成绩单,目前安卓设备已经突破25亿——全球60亿人,每4个就有1个使用安卓设备。
然后开始谈安卓往何处去。
首先是大热的折叠屏带来的影响。
折叠屏带来不一样的内容展示方式,也带来了更便捷的多任务处理。
所以Google认定折叠屏是趋势,对于折叠屏的准备,今年就会在安卓系统中体现。
其次是5G。
可以明确的是,今年就会有5G的安卓手机商用。
5G能带来什么?带来更快的网速。
也让更多AI能力可以实时发挥作用。
比如刚才说到的视频实时字幕,背后核心是AI语音识别转写。
但!是!Google放出大招,即便不联网,现在也能在最新安卓系统中实现实时语音转写。
因为Google团队把AI模型训练到了最小最高效,手机算力,手机数据,就能在手机本身实现这项AI能力。
接下来就是越来越受用户关注的隐私数据。

这次 Google 将会对系统的安全策略做进一步的调整:比如在文档管理中加入加密功能、控制 App调取系统摄像头 / 麦克风的访问权限,以及防止App在后台随意获取用户位置等等。
在新系统中,用户可针对每个App所获得的权限进行调整,从而不让软件供应商通过App获取用户隐私信息。
除此以外,跟此前Android Q的测试版体验差不多,系统的设计和交互也有新变化:
比如,加入全局“黑暗模式”、新增 WiFi 分享功能、新增支持录屏及“桌面模式”、优化Pixel的线性马达效果,优化系统手势交互……
虽然是安卓系统首次加入,但不得不说,中国手机厂商在此之前,就已经基于老安卓版本,实现了很多类似功能。
中国手机厂商的微创新,不得不服。
Pixel手机:单摄AI吊打苹果
新系统,但没有新旗舰手机,推出小迭代版本:Pixel 3a和Pixel 3a XL.
开门见山,Google大方承认,Pixel手机价格太贵,所以需要两款中端手机——Pixel 3a和Pixel 3a XL来帮谷歌提升销量。
Pixel 3a提供三种颜色:黑色、白色、有点紫(比灭霸的紫色稍淡),保留了3.5mm耳机接口。
Pixel 3a依旧是天生骄傲,用AI和算法硬件劣势,依然保持祖传前后单摄像头,都可以提供背景虚化的人像模式。
现场展示照片,单摄的Google手机,夜景成像吊打双摄的iPhone X。
Pixel 3a定位中端旗舰,依然传承谷歌“买软件送硬件”传统,承诺连续3年的软件和安全更新。
更炫酷的AI能力也别放到手机里。
Pixel 3a现在能过滤骚扰电话,地图AR结合街景导航,比看地图箭头更直观。
Google还把智能手机做到了AI智能和功能机功能的完美结合。
Pixel 3a一次充电,可以使用30小时,充电15分钟,可以用7个小时。
但是Pixel 3a的价格可是一点不中端,起售价399美元(约2700元),搭载骁龙670处理器、4GB内存、3000mAh电池。
2700元?能买2台同样配置的国产手机了。
难怪谷歌不好意思在发布会上公布参数详情,不去官网查看是不知道滴。
更好笑的是,刚才说好的Pixel 3a XL,直接被跳过了。
Google官网显示,Pixel 3a XL售价479美元起,除了屏幕大一点,没有其他区别。
智能音箱炫出手势识别
手机之后,来到智能家居环节,智能音箱为核心。
现在,Google把智能音箱划入了Alphabet旗下智能家居和物联网公司——Nest.
Google先祭出新时代的AI硬件产品打造理念:
AI+软件+硬件。
其次,带来新发布:
带屏智能音箱。
之前叫Google Hub,现在改叫Nest Hub。
一个背后加了音箱的平板电脑。
大小也都能选,全家桶系列。
当然,带屏带摄像头,还加入了AI刷脸的能力。
一个带屏智能音箱全家用,但刷你脸的时候,就只提醒你的信息,比如你的行程、提醒等。千人千面。
另外,Google软件的能力也被集成其中。
打电话、谷歌相册,以及YouTube节目。
也有黑科技,比如手势识别:
一个手势,就能在你想要的时候达到目的。
具体售价:
Nest Hub售价129美元——866元。
Nest Hub Max售价229美元——1537元。
怎么说呢?幸好不在中国卖,不然能被中国智造的价格战杀得片甲不留。(手动狗头)
Jeff Dean压轴介绍AI向善
最后,Google AI大总管Jeff Dean压轴登场。
他先回顾了今年来Google在NLP领域取得的最亮眼成就——BERT模型。
然后自然是姐夫的亲儿子TensorFlow,并且强调运用TensorFlow取得的新成就。
依然情怀满满,向善优先。
比如最新在医疗AI推进方面,现在可以筛查早期肺癌,初步取得的准确率,可以给40%的早期患者提高生存率。
另外还有AI预测洪水。
Jeff Dean说在印度,洪水依然是威胁民众生命和财产安全的主要灾害,但通过TensorFlow,就能实现洪水的预测,还能更好规划排水渠道,最大限度降低洪水危害。
这也是Google一直以来提倡AI for social Good的理念成果。
Jeff公布了谷歌半年前围绕“AI向善”展开的2500万美元公益投资成果。这项名为“Impact Challenge”的挑战赛,吸引了全世界各行各业的人才,这次姐夫专门提到了印度和乌干达等地区的团队。
Jeff总结,挑战赛自去年10月份上线以来,一共吸引了全球119个国家的公司、组织参与其中,已收到2,600多份申请,希望这会是一个好的开始。
希望Google能从整合全球信息的初心使命出发,借助AI,对用户更有用有益,做一个更有用的Google.
进而,Jeff Dean在此处宣布Google I/O 2019大会主题演讲结束。
场内场外,都觉得这一结束来得过于仓促。
但,可能也有个不成熟的外界猜测——Google高管也忙着看欧冠半决赛。
其实劈柴哥刚登场,就提到了今天有利物浦和巴塞罗那的欧冠比赛,希望不要耽搁大家。
结果,Google I/O大会演讲在开赛前掐表结束。
于是换台看球的球迷最新反馈:见证了一场奇迹般的绝地逆转。利物浦落后3球情况下完成4球反击,淘汰了梅西坐镇的宇宙巴萨。
所以是不是Google的AI提前预测到了?
-
Google
+关注
关注
5文章
1817浏览量
60659 -
AI
+关注
关注
91文章
41481浏览量
302805 -
视觉
+关注
关注
1文章
183浏览量
24883
原文标题:一文看尽Google I/O大会:史上最快手机全语音操控,不开口也能打电话,安卓Q登场
文章出处:【微信号:CAAI-1981,微信公众号:中国人工智能学会】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
Arm携手Google Cloud推进代理式AI基础设施规模化落地
Google Cloud Next 2026大会亮点回顾
Cadence 与 Google 合作,利用 ChipStack AI Super Agent 在 Google Cloud 上扩展 AI 驱动的芯片设计
Cadence与Google合作,利用ChipStack AI Super Agent在Google Cloud上扩展AI驱动的芯片设计
NVIDIA与Google探讨AI模型的演进方向
谷东智能亮相2025 Google APAC TV Summit峰会
炬芯科技正式支持Google Find Hub
谷歌查找我的设备配件(Google Find My Device Accessory)详解和应用
Google Cloud展示一系列前沿技术更新
Google Fast Pair服务简介
2025 Google I/O大会演讲亮点回顾
Google I/O 2025大会回顾
谷歌I/O 2025大会前透露:Android 16接入Gemini,智能手机、XR设备升级
Google I/O 2019大会开幕:究竟Google的最新黑科技魔法有哪些?
评论