0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Waymo用AutoML自动生成机器学习模型

ml8z_IV_Technol 来源:cc 2019-01-19 09:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Waymo十周年之际,发布了自动驾驶机器学习模型的构建思路,原来很多内部机器学习架构是由 AutoML 完成的。这种自动机器学习算法在激光雷达分割任务中,比人工创建的网络质量更高。在代理端到端搜索中,甚至发现了卷积、池化和反卷积操作的创造性组合,不禁让人感叹算法工程师要失业?

AutoML 全称是 Automated Machine Learning,是2014年以来,机器学习和深度学习领域最炙手可热的领域之一。2017年5月,谷歌在I/O大会上推出基于TensorFlow 框架下的AutoML,它可以通过神经网络来设计神经网络,节省人工设计的时间,其对专业知识的较低,让非机器学习专家也能轻松上手。而在近日waymo十周年上曝光,其AutoML 已经用来设计应用于自动驾驶上的机器学习算法。

在Waymo,机器学习几乎应用在自动驾驶系统的每个角落。它可以帮助无人车感知周围环境,了解世界,预测其他人的行为方式,并预测他们的下一步行动。

以感知为例,Waymo的系统采用了神经网络的组合,使无人车能够解读传感器数据、识别物体,并随着时间的推移跟踪它们,从而对周围的世界有一个深入的了解。这些神经网络的创建通常是一项耗时的任务,优化神经网络架构以实现在自动驾驶汽车上运行所需的质量和速度是一个复杂的微调过程,需要花费工程师数月时间完成任务。

通过与谷歌AI大脑团队研究人员合作,应用AutoML将前沿研究付诸实践,以自动生成神经网络。更重要的是,这些最先进的神经网络比工程师手动微调质量更高和速度更快。

Waymo 为了将自动驾驶技术应用到不同的城市和环境中,需要以极快的速度优化现有模型以适应不同的场景。恰好 AutoML 能够做到这一点,并高效,持续地提供大量的ML解决方案。

应用现有的AutoML框架进行迁移学习

Auto ML能否为汽车生成高质量、低延迟的神经网络?

质量往往是衡量一个神经网络产生的答案的准确性的标准,延迟数据决定了神经网络提供答案的速度,也称为推理时间。由于自动驾驶是一项需要无人车快速做出决定以保证安全的系统,因此神经网络需要保证在低延迟下进行。运行在Waymo无人车上的大多数网络,延迟都少于10毫秒,这比部署在数千台服务器上的数据中心中的许多网络都要快。

Google AI团队在2018年4月发表的论文(Learning Transferable Architectures for Scalable ImageRecognition)中,能够自动探索超过12,000种架构来完成 CIFAR-10 数据集的经典图像识别任务,其中发现的自我创建的NAS单元比手工创建神经网络更好。将在CIFAR-10上学到的知识转移到自动驾驶任务中,它可以很好的完成语义分割的任务,比如将LiDAR点云中的每个点标识为汽车,行人,树等。

NAS单元处理神经网络中前两个层的输入

通过构建一种自动搜索算法,在卷积网络架构(CNN)中探索数百种不同的NAS单元组合,进行 LiDAR 分割任务训练和评估模型。如果采用人工微调,只能探索有限数量的架构,但通过这种方法,自动探索了数百个。

相比人工微调优化神经网络,AutoML输出的神经网络做到了低延迟、高质量效果。

初步成功后,Waymo将相同的搜索算法应用于另外两个与交通车道检测和定位相关的任务,迁移学习技术也适用于这些任务,最后能够在无人车上部署三个新训练和改进的神经网络。

端到端搜索:从头开始搜索新的架构

发现AutoML巨大潜力后,Waymo开始思考是否可以更进一步、更广泛地寻找能够提供更好结果的全新架构。不局限于NAS单元,可以更直接地找到延迟在限定范围内的架构。

进行端到端搜索往往需要手动探索数千个架构,需要大量的计算成本。找到单一架构需要在多个GPU的计算机上训练好几天,这意味着搜索单个任务需要数千天的计算时间。相反,通过设计一个代理任务:一个缩小的激光雷达分割任务,可以在几个小时内解决。

这就意味着需要找到一个与最初的细分任务足够相似的代理任务。在确定代理任务上的架构质量与原始任务上的架构质量之间的良好相关性之前,对几个代理任务设计进行试验。然后,启动一个类似于AutoML论文的搜索,完成一个端到端代理搜索。这是这个概念第一次应用在激光雷达数据上。

代理端到端搜索:在按比例缩小的代理任务中探索数千个架构,将100个最佳应用程序应用于原始任务,验证并部署最佳的最佳体系结构。

通过使用几种搜索算法,优化质量和延迟。查看不同类型的CNN架构并使用不同的搜索策略,如随机搜索和强化学习,能够为代理任务探索10,000多种不同的架构。通过使用代理任务,在Google TPU集群上花费一年多的计算时间现在只需要两周时间。在NAS单元之外,我们发现了比以前更好的神经网路,它在相同的质量下,神经网络的延迟降低20-30%;具有更高质量的神经网络,错误率降低8-10%,与以前的架构具有相同的延迟。

左图展示了在一组简单的架构上随机搜索发现的大约4000个架构。每个点都是一个经过训练和评估的架构。实线表示不同推理时间约束下的最佳架构,红点表示用迁移学习构建的网络的延迟和性能。在这种随机搜索中,网络学习效果不如迁移学习。右图中,黄色和蓝色的点表示另外两种搜索算法的结果。黄色的是对一组精致架构的随机搜索。蓝色的那个使用了强化学习,探索了6000多个架构。它产生了最好的结果。这两个额外的搜索发现,该网络明显优于迁移学习的网络。

在搜索中发现的一些架构采用了卷积、池化和反卷积操作的创造性组合,如下图所示。这些架构最终非常适合最初的激光雷达分割任务,并将部署在Waymo的自动驾驶汽车上。

由代理端到端搜索发现的一种神经网络结构。

Waymo与Google AI合作,应用 AutoML 在无人驾驶上的实践仅仅是个开始。对于激光雷达分割任务,传输学习和代理端到端搜索都提供了比人工创建更好的网络,这些机制应用到新的任务类型上,可以改善许多其他的神经网络。这一发展为未来的ML工作开辟了新的道路,并提高了Waymo的自动驾驶技术的性能和能力。

看到这里是不是觉得很兴奋,自己费尽心思搭的神经网路,AutoML 只需很短的时间就能得出高质量的网络结构。当然,目前谷歌只开源了轻量级 AutoML 框架——AdaNet。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136271
  • waymo
    +关注

    关注

    2

    文章

    315

    浏览量

    25493

原文标题:算法工程师要失业?Waymo尝试用AutoML自动生成机器学习模型

文章出处:【微信号:IV_Technology,微信公众号:智车科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶中Transformer大模型会取代深度学习吗?

    [首发于智驾最前沿微信公众号]近年来,随着ChatGPT、Claude、文心一言等大语言模型生成文本、对话交互等领域的惊艳表现,“Transformer架构是否正在取代传统深度学习”这一话题一直被
    的头像 发表于 08-13 09:15 3946次阅读
    <b class='flag-5'>自动</b>驾驶中Transformer大<b class='flag-5'>模型</b>会取代深度<b class='flag-5'>学习</b>吗?

    超小型Neuton机器学习模型, 在任何系统级芯片(SoC)上解锁边缘人工智能应用.

    Neuton 是一家边缘AI 公司,致力于让机器 学习模型更易于使用。它创建的模型比竞争对手的框架小10 倍,速度也快10 倍,甚至可以在最先进的边缘设备上进行人工智能处理。在这篇博文
    发表于 07-31 11:38

    通过NVIDIA Cosmos模型增强机器人学习

    通用机器人的时代已经到来,这得益于机械电子技术和机器人 AI 基础模型的进步。但目前机器人技术的发展仍面临一个关键挑战:机器人需要大量的训练
    的头像 发表于 07-14 11:49 794次阅读
    通过NVIDIA Cosmos<b class='flag-5'>模型</b>增强<b class='flag-5'>机器人学习</b>

    福特CEO:Waymo的激光雷达方案比特斯拉纯视觉方案更有意义

    (LiDAR)的方案“更合理”,然后他列举了安全、消费者信任以及基于摄像头模型的局限性等因素来进行说明。同时他也指出,特斯拉和 Waymo 都在自动驾驶方面“取得了很大进展”。法利还确认,他已就此事与马斯克进行过交谈。尽管如此他
    的头像 发表于 06-30 19:19 507次阅读

    ​Diffusion生成式动作引擎技术解析

    开发、虚拟现实、影视动画和机器人控制等领域具有广泛应用前景。以下是其核心原理、技术实现和应用方向的详细解析: 一、核心原理 扩散模型基础 Diffusion模型通过逐步添加噪声破坏数据(正向过程),再
    的头像 发表于 03-17 15:14 2735次阅读

    机器学习模型市场前景如何

    当今,随着算法的不断优化、数据量的爆炸式增长以及计算能力的飞速提升,机器学习模型的市场前景愈发广阔。下面,AI部落小编将探讨机器学习
    的头像 发表于 02-13 09:39 639次阅读

    字节跳动即将推出多模态视频生成模型OmniHuman

    字节跳动旗下一站式AI创作平台即梦AI即将迎来重大更新,全新多模态视频生成模型OmniHuman即将上线。这款模型是字节跳动自研的闭源模型,其强大的功能令人瞩目:仅需一张图片与一段音频
    的头像 发表于 02-08 10:53 1153次阅读

    DeepSeek-R1实现自动生成Manim动画

    ​ 作者:算力魔方创始人/英特尔创新大使刘力 前面我们分享了在本地运行能与OpenAI-o1 能力相媲美的DeepSeek-R1 模型。本文将介绍如何使用DeepSeek-R1实现自动生成Manim
    的头像 发表于 02-07 12:31 4671次阅读
    <b class='flag-5'>用</b>DeepSeek-R1实现<b class='flag-5'>自动</b><b class='flag-5'>生成</b>Manim动画

    全球的AI+EDA(电子设计自动化)创新项目

    for EDA 项目概述 :Google研究团队推出了AutoML自动机器学习)平台,应用于电子设计自动化领域。该平台利用AI来
    的头像 发表于 02-07 12:00 3874次阅读

    华为、理想、特斯拉、商汤的世界模型是做什么

    最近世界模型(World Model)很火,甚至有人说世界模型是终极自动驾驶解决方案,实际上它只是端到端大模型的一种,和VLM没有本质区别。目前的研究基本都集中在用世界
    的头像 发表于 01-14 09:27 1805次阅读
    华为、理想、特斯拉、商汤的世界<b class='flag-5'>模型</b>是做什么<b class='flag-5'>用</b>的

    AN-715::走近IBIS模型:什么是IBIS模型?它们是如何生成的?

    电子发烧友网站提供《AN-715::走近IBIS模型:什么是IBIS模型?它们是如何生成的?.pdf》资料免费下载
    发表于 01-13 14:21 0次下载
    AN-715::走近IBIS<b class='flag-5'>模型</b>:什么是IBIS<b class='flag-5'>模型</b>?它们是如何<b class='flag-5'>生成</b>的?

    NVIDIA推出多个生成式AI模型和蓝图

    NVIDIA 宣布推出多个生成式 AI 模型和蓝图,将 NVIDIA Omniverse 一体化进一步扩展至物理 AI 应用,如机器人、自动驾驶汽车和视觉 AI 等。全球软件开发和专业
    的头像 发表于 01-08 10:48 1054次阅读

    借助谷歌Gemini和Imagen模型生成高质量图像

    在快速发展的生成式 AI 领域,结合不同模型的优势可以带来显著的成果。通过利用谷歌的 Gemini 模型来制作详细且富有创意的提示,然后使用 Imagen 3 模型根据这些提示
    的头像 发表于 01-03 10:38 1364次阅读
    借助谷歌Gemini和Imagen<b class='flag-5'>模型</b><b class='flag-5'>生成</b>高质量图像

    【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

    引入GPT这样的大模型后,情况发生了根本性的变化。只需提供适当的提示词以及封装好的机器人函数库,大模型便能灵活地生成控制代码,极大地简化了开发过程,并提高了
    发表于 12-29 23:04

    《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

    医疗领域,手术辅助机器人需要毫米级的精确控制,书中有介绍基于视觉伺服的实时控制算法,以及如何利用大模型优化手术路径规划。工业场景中,协作机器人面临的主要挑战是快速适应新工艺流程。具身智能通过在线
    发表于 12-24 15:03