0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google在AI上究竟都实现了什么?

WpOh_rgznai100 来源:lq 2019-06-02 10:12 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

编者按:Google 这家成立于 1998 年的公司,起于互联网搜索引擎,其 Android 是移动操作系统当之无愧的霸主,不满足于语音识别+搜索,而从 2016 年开始了真正意义上的人工智能起点,到如今真正地 All in 了 AI,更是在学术和应用上两面开花。那么,Google 在 AI 上究竟都实现了什么?我们或许可以从前不久的 Google I/O 上一窥究竟。

很幸运今年又再一次来到 Google I/O 现场,会场仍然在离 Google Complex 不远的海岸圆形剧场。会议开始之前,主会场人头攒动,各种欢呼声,结伴照相的声音此起彼伏,恍若入了庆典的海洋。这三天的会场万里睛空,除了在 Keynote 中某个团体开着飞机拉横幅之外,基本上没有出现其他干扰。由于 Keynote 的一些图片已经满天飞大家也看到了许多,笔者就现场抓拍了 Google Brain 的老大 Jeff Dean 出场的画面。

这应该是这位大佬,为数不多的在 Google I/O 出场的场景。

既然各个 Session 的全程视频网上都有,那我就专注于 Google I/O 大会 AI 相关的展台,今年的 ML 相关的展台也设的比较特殊,就在会场入口不远处。

整个 I/O 的标志是 I/O Lankmark 的位置,而 AI 相关的展厅便是附近的 G 位置,得天独厚。我在第二天的下午,就跑到 AI 相关的展台,去看看里面倒底有什么。

所有的展厅外面都是搭的帐篷,ML+AI 放在一个展厅,用最醒目的大红色加以标注。

Google AI Research

进门右拐,可以看到 Google AI Research 的展位。人工智能发展到今天,数据越来越重要,谁掌握了数据,谁就能够做出更好的 AI 模型,数据是人智能的食粮。大公司可以以数据取胜,那么,对于众多开发者,探索人工智能如何落地的工程师,如何得到有效的数据呢?Google AI 搜索主要解决数据集的问题,让你免费获得可以公开的数据集。

我们知道,Google 最强有力的武器便是它的搜索工具,便携,好用。而且不会出现各种诈骗信息。那么,Google 对于数据集专门出了一个搜索通道,会加速 AI 的学习使用。

附数据专项搜索引擎的地址:

https://toolbox.google.com/datasetsearch

我们以 students 为关键字,查找一下数据。打开页面为:

https://toolbox.google.com/datasetsearch/search?query=students&docid=aTkZB%2F0%2F6kN6Bq6AAAAAAA%3D%3D

整个结果页面如下:

总共搜出了超过 100 个数据集。我们就从第一个数据集 kaggle 来看一下,搜出了什么样的结果:

通用属性,告诉我们一份关于中学生的社会、性别的学习数据,可以看出酒精消耗程度。然后我们拿到这些数据的详细信息,包括来源网站、上传日期、数据来源、许可、可下载的文件格式。

数据详继描述,说明了这份数据可以用来预测学生的最终级别。在描述中,共有 30 个数据域,把每一个域的数据的意义,标识都解释的一清二楚。

完全是妥妥的一份完全数据清洗之后的数据嘛。可以拿来直接用了。

一个搜索引擎,做这么贴心。真的很不容易,是不是需要感动一下?

AI on Edge

上面这张照片所显示的是一个 Edge 端的 Demo 演示,整个演示过程如下:

有一个上面带有数字标记的圆盘,圆盘编号从 1 到 8.先把圆盘投到右边的斜槽上,圆盘滚动到最右边,然后用带摄像头的 Edge TPU 去识别圆盘上的数字,如果识别完之后,自动的转动右边的黑色大的圆圈中的白色的通道,使得这个通道连通最下面用数据标识的槽。然后带数字的圆盘就会掉落到对应数字的槽中。

左边是一个显示器,显示器展于从 1,2,3,4,5,6,7,8 这 8 个数字的圆盘的识别情况,照片正好识别的数字 1 的情况,我们能够看到显示屏的浏览器中,这个 Demo 的名称为“Vision Intelligence with AutoML and Edge TPU”。 用 AutoML 和 Edge TPU 实现视觉智能。

我起初觉得就是用 Edge TPU 实现简单的数字分类,难度在于圆盘识别的数字可能是歪的,需要调正,然后再识别。但是展台工作人员告诉我,这个 Demo 完成了两个功能,一个功能是识别数字,打开对应通道,另一个功能是检查圆盘有没有破损情况,如果有破损,那么会标记出来,在显示屏上会显示”break”。相当于是 2 个 AI 模型共同工作,得出的结果。

即使只是一个小小的 Demo,但背后的技术含量还是很高的。

那么,让我们的思绪乱飞一会儿,这样的 Demo 有什么样的实际应用场景?而且我们用不同的 AI 模型相互搭配、乱入,可以获得什么奇妙的应用场景呢?欢迎留言讨论。

Custom&Pre-Trained Models

Custom&Pre-Trained Models 这个展台实际上向我们展于,我们在视频中,实时识别的数据,我们可以做什么样的处理,达到我们想到的结论。再补上一张图:

这张图也是这个展台中的,相当于用这个模型,可以分灯出人、飞机、汽车等一些对象。如果是摄像头处理的视频流,那么,可以用时间记录下来,在时间轴上,什么时间识别出了什么样的物体?这个类型的识别,更能够用于人口流量的统计等场合。比如一个十字路口,每一秒,每一天过了多少人?如果人流量太大,可以做一些分流。

Dance Like

这应该是具有互动性的一个展台了。

这个展台实际上想展示 AI 在舞蹈方面的应用。首先站在背景的男士,可以看到他的对面有一个显示器,显示器上是一个舞蹈老师在跳舞。我们学舞蹈时,也会这样做,前面有一个老师,现场教学。在前面,观众可以看得到的显示器有两个画面,左边的画面是真实的跳舞的人的动作。右边的画面是舞蹈老师和跳舞的小伙子重叠的影像。而且能够实时的看到姿势的差异。我们用另一张图片展现一下。

这张图片就更明显了,在这个时间点上,后面跳舞的帅哥是正面稍微下蹲的姿势,但是老师是摆腿的姿势,完全不一样。对于学习跳舞来说,这是一个很好的产品。但是我突然有种不好的感觉。这个产品对于人的模仿能力,是极大的考验啊。这完全是用 AI 跟人在磨啊,AI 吊打人类啊。

总结

这次的 I/O 之行,听了很多演讲,主要在 AI 的展厅实地观摩了一翻,还有一些 AI 展台没有介绍。但是上面这四个展台给我的印象特别深。对于数据处理,结论分析,实际的应用场景,都有展示。可以说,展台产品涉及到 AI 从数据到实际产品的几个主要环节,对于开发者,公司运用 AI 提供了特别好的示例。随着 AI 的应用越来越广泛,相应的落地应用会越来越多。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1812

    浏览量

    60623
  • AI
    AI
    +关注

    关注

    91

    文章

    40962

    浏览量

    302531
  • 人工智能
    +关注

    关注

    1819

    文章

    50293

    浏览量

    266843

原文标题:Google All in AI都做了什么?

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    NVIDIA与Google探讨AI模型的演进方向

    GTC 会场,观众座无虚席,两位计算领域最具影响力的领导人物,NVIDIA 首席科学家 Bill Dally,以及 Google DeepMind 与 Google Research 首席科学家 Jeff Dean 登台对话
    的头像 发表于 04-03 10:03 458次阅读

    AI辅助编程设计之道:从Spec到Code工程实践

    软件开发的形态。但改变的方向,不是“程序员不写代码”,而是“程序员把更多精力放在设计”。 那个花了两周才做完的小工具,是一个典型的案例——很多人刚接触AI编程时,都会在这个弯绕一
    发表于 03-16 13:33

    还在手动拼接 AI 代码?你的 IDE 早就该升级

    嵌入式专用 AI 智能助手直接内嵌到 IDE 工作流中,实现代码编辑、AI 生成、调试优化、编译运行、 项目部署一站式开发,让开发者无需切换窗口、手动拼接,就能高效完成
    发表于 03-11 10:25

    使用NORDIC AI的好处

    ; 自定义 Neuton 模型博客] Axon NPU :集成 nRF54LM20B 等高端 SoC 中的专用 AI 加速器,对 TensorFlow Lite 模型可实现最高约 15× 推理加速、显著
    发表于 01-31 23:16

    nordic NRF54蓝牙设备Google Pixel 10“听诊”蓝牙信道示例

    今年早些时候发布的Android 16系统首次引入了支持蓝牙®信道探测的公共API,实现智能手机的精准测距功能。然而直到近期,市面上仍未出现支持蓝牙6.0及信道探测技术的手机硬件。这一局面
    发表于 11-26 17:44

    vivo携手Google Cloud推动智能手机迈入AI新时代

    人们期待更智能、更前瞻手机的时代,vivo 携手 Google Cloud,迅速推出更安全、更前沿的 AI 功能,共同加速创新,推动智能手机迈入智能、无缝、以人为本的 AI 新时代。
    的头像 发表于 09-23 16:54 1684次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    AI被赋予人的智能,科学家们希望没有人类的引导下,AI自主的提出科学假设,诺贝尔奖级别的假设哦。 AI驱动科学被认为是科学发现的第五个范
    发表于 09-17 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+化学或生物方法实现AI

    )大脑的能效远高于目前的AI芯片 知道计算机算的快,但是能取代大脑吗?肯定是不行的。大脑处理复杂信息方面的能力是远超计算机的。是不可替代的。 2)细菌神经网络 直接使用生物体来实现
    发表于 09-15 17:29

    石英晶振AI听诊器的应用

    相较于传统听诊器,AI听诊器具备更清晰的监听声音以及更精准的心跳检测,这些功能的实现建立较高的稳定性和精准度基础
    的头像 发表于 09-10 14:19 968次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    的不同。随着AI热潮的兴起,大脑的抽象模型已被提炼成各种的AI算法,并使用半导体芯片技术加以实现。 而大脑是一个由无数神经元通过突触连接而成的复杂网络,是极其复杂和精密的。大脑本质
    发表于 09-06 19:12

    AI 芯片浪潮下,职场晋升新契机?

    职场、渴望专业领域更进一步的人来说,AI 芯片与职称评审之间,实则有着千丝万缕的联系,为职业晋升开辟新的路径。 AI 芯片领域细分与职称对应 目前,
    发表于 08-19 08:58

    Arm神经技术是业界首创 Arm GPU 增添专用神经加速器的技术,移动设备实现PC级别的AI图形性能

    Arm 神经技术是业界首创 Arm GPU 增添专用神经加速器的技术,首次移动设备实现 PC 级别的
    的头像 发表于 08-14 17:59 2906次阅读

    Arm KleidiAI与XNNPack集成实现AI性能提升

    INT4 矩阵乘法 (matmul) 优化以增强 Google Gemma 2 模型性能开始,到后续完成多项底层技术增强,Arm XNNPack 实现
    的头像 发表于 08-08 15:19 3102次阅读
    Arm KleidiAI与XNNPack集成<b class='flag-5'>实现</b><b class='flag-5'>AI</b>性能提升

    Google Fast Pair服务简介

    Google 帐户。 参考手机应是市场上活跃的手机,并且覆盖相当多的用户群体。 实现fast pair版本和相关扩展的蓝牙设备且是被认证的。 原文如下: All phones should
    发表于 06-29 19:28

    2025 Google I/O大会演讲亮点回顾

    今年的 Google I/O 大会上,我们展示了如何在 Google 的各个平台进行应用构建,并利用 Google DeepMind 的卓越 AI
    的头像 发表于 05-28 09:34 1056次阅读