0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Waymo和谷歌合作提出一系列用于自动驾驶行为预测的模型

如意 来源:今日头条 作者:DeepTech深科技 2020-10-19 12:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读:Waymo 近期宣布在凤凰城地区开放没有安全员的无人驾驶出租车,实现首个商用的真正的无人驾驶。与此同时,Waymo 也公开分享了一系列新的研究论文,本文就来讲解一下 Waymo 在行为预测方面的研究成果。

周围的车辆和行人在接下来数秒中会做什么?要实现安全的自动驾驶,这是一个必须回答的关键问题,这也就是自动驾驶领域中的行为预测问题。

行为预测的难点在于周围行人、车辆的不确定性和各种规则之外的行为。这些状况难以用规则进行总结,因此最近研发人员们开始利用基于数据驱动的深度学习的方法,以达到更加合理的预测效果。

在这方面,来自 Waymo 和谷歌的团队提出了一系列用于自动驾驶行为预测的模型,让无人车理解抽象的道路环境,并实现对车辆、行人的多可能性预测。

在今年 6 月的一篇 CVPR 论文中,这个团队首先提出了一个全新模型 VectorNet。

在该模型中,团队首次提出了一种抽象化认识周围环境信息的做法:用向量(vector)来简化地表达地图信息和移动物体,这一做法抛开了传统的用图片渲染的方式,达到了降低数据量、计算量的效果。Waymo 也在其博客文章中明确表示,该技术提高了其行为预测的精准度。

近日,这个团队公布了进一步的工作,提出了 TNT (Target-driveN Trajectory Predictio)。TNT 是一种目的地引导的轨迹预测方法,运用了监督学习的方法对车辆和行人进行多轨迹回归,最终的模型能够输出多个未来轨迹的预测,同时明确指出各个轨迹可能性。

论文中介绍,TNT 在公开数据集 Argoverse 的测试表现与冠军结果相当,同时在 INTERACTION、Stanford Drone,以及 Waymo 内部数据集中取得了非常好的效果。

目前该论文已经被国际机器人学习会议 CoRL(Conference on Robot Learning)接收。

预测多种可能的未来情形

Waymo和谷歌合作提出一系列用于自动驾驶行为预测的模型

Waymo 在博客中指出,VectorNet 突破性地提出了用向量的方式来抽象化表达这个世界,从而感知、理解周围环境。在理解环境以后,下一步就是实现更好的行为预测。

自动驾驶行为预测和其他问题不一样的地方在于,周围的车辆、行人在接下来数秒时间里有多种行进的可能性。这些可能性本身也将影响自动驾驶车辆的决策规划。

比方说,如果机器能算出:前方车辆有 80% 的概率左转、20% 的概率右转,自动驾驶车辆都能根据这一结果进行更好的决策规划。同时对机器来说,就算别的车辆只有 1% 的可能性右转,这种可能性也不能被忽视。

而这种针对多种可能性的多轨迹预测,有着很大的技术难度。当下的神经网络难以很好应对多轨迹预测的任务。

据业内人士介绍,神经网络擅长于一对一和多对一的拟合问题,而非一对多的问题。多对一如常见的分类问题,输入多张车辆的照片,神经网络能准确识别这些照片为 “车” 的类别。一对一如常见的回归问题,输入一张车辆的照片,神经网络能估计它的长宽高等尺寸。但如果输入一个样本,想让神经网络回归出三个结果,这是神经网络所不擅长的事情。

据介绍,现在市面上基础的方案是基于交通规则获得周围车辆、行人的行进可能性。如果交规允许这条道路直行、左右转,那么就算三种可能性。但这种方式的预测结果并不完全可靠,因为规则之外的案例并未被考虑其中,如借道,违法掉头,事实上,要保障自动驾驶长时间运行下的安全性,应对规则之外的情形的能力非常重要。

近两年的论文内容显示,很多团队正在尝试使用生成模型来进行多轨迹预测。即利用如 GAN,VAE 等模型在隐空间 latent space 进行采样,得到周围目标在特定场景下的多种潜在选择。

但依靠生成模型的问题在于,样本采集存在很大的随机性,这对一个要求可靠的系统来说是难以接受的。假设前方来车左拐的可能性有 90%,右拐的可能性有 10%,用采样的方法很有可能我们采样三次得到的都是左拐,而忽略了它往右拐的可能性。在自动驾驶领域,依靠这种方式的行为预测难以进行实际应用。

用监督学习实现精准预测

该团队提出的 TNT 首次运用了监督学习的方法对车辆和行人进行多轨迹预测,是一种目的地引导的轨迹预测方法。其模型的最大贡献,就是能够不依靠采样,纯靠监督学习来进行多轨迹的行为预测。

具体来说,该模型的行为预测按顺序分为三步,每一步都有着特定目标:1、利用地图的先验信息,离散化并预测目的地;2、在预测目的地基础之上,进一步预测目标的运行轨迹;3、在预测出多条运行轨迹当中,对每条轨迹进行筛选和打分,预测出各个选择的可能性,也同时选择出可能性最高的几个运行轨迹。

Waymo和谷歌合作提出一系列用于自动驾驶行为预测的模型

在技术层面,运用监督学习的好处在于能够让最终的模型给出多个未来轨迹的预测,同时明确指出各个轨迹可能性。比如在输出三个轨迹的情况下,模型能够明确指出,30% 可能性左转、30% 可能性右转,直行的可能性为 40%。这样的预测结果就能真正地被决策系统所使用。

在最终的表现上,单个 TNT 模型的行为预测准确性在公开数据集 Argoverse 的测试表现与冠军结果相当,同时在 INTERACTION、Stanford Drone 等测试中取得了非常好的效果。

图|论文作者团队,左至右分别为赵行、高继扬、孙晨

论文核心作者来自 Waymo 和谷歌。其中,赵行是 Waymo 研究科学家,本科毕业于浙江大学,在麻省理工学院获得博士学位;高继扬目前是 Waymo 的高级工程师,本科毕业于清华大学,后在美国南加州大学获博士学位;孙晨本科同样就读于清华大学,后博士毕业于南加州大学,目前在谷歌任研究科学家。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6244

    浏览量

    110261
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51712
  • 自动驾驶
    +关注

    关注

    791

    文章

    14670

    浏览量

    176517
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    VLA能解决自动驾驶中的哪些问题?

    、语言表达和动作控制这三者整合到个统模型框架中。 与传统自动驾驶系统将感知、预测、规划、控制拆解为多个独立模块的做法不同,VLA可以缩
    的头像 发表于 11-25 08:53 178次阅读
    VLA能解决<b class='flag-5'>自动驾驶</b>中的哪些问题?

    模型中常提的快慢思考会对自动驾驶产生什么影响?

    提出的“快慢系统”理论启发,旨在让自动驾驶系统模拟人类的思考与决策过程。理想汽车结合端到端与VLM模型,推出了业界首个在车端部署的双系统方案,并成功将VLM视觉语言模型部署于车端芯片上
    的头像 发表于 11-22 10:59 2271次阅读
    大<b class='flag-5'>模型</b>中常提的快慢思考会对<b class='flag-5'>自动驾驶</b>产生什么影响?

    自动驾驶为什么要重视轨迹预测

    轨迹预测。 轨迹预测要做的是,在几秒到十几秒的时间范围内,判断出“其他交通参与者可能会怎么移动”。如果缺少这个能力,自动驾驶系统更像是个被动的跟随者,只能针对当前状况做出反应;
    的头像 发表于 11-20 10:45 489次阅读
    <b class='flag-5'>自动驾驶</b>为什么要重视轨迹<b class='flag-5'>预测</b>?

    NVIDIA与Uber合作推进全球L4级自动驾驶移动出行网络

    NVIDIA 宣布与 Uber 达成合作,将共同扩展全球 L4 级自动驾驶移动出行网络。合作将依托 Uber 新代无人驾驶出租车和
    的头像 发表于 11-03 14:33 1042次阅读

    不同等级的自动驾驶技术要求上有何不同?

    谈到自动驾驶,不可避免地会涉及到自动驾驶分级,美国汽车工程师学会(SAE)根据自动驾驶系统与人类驾驶员参与驾驶
    的头像 发表于 10-18 10:17 2410次阅读

    Google Cloud展示一系列前沿技术更新

    在 2025 Google 谷歌开发者大会上,Google Cloud 展示了一系列前沿技术更新——不仅是模型升级,更是智能体、创意、行业应用的全面进化。这些前沿技术,正为出海开发者提供强大的技术支撑,助力他们打造面向全球用户的
    的头像 发表于 08-29 09:38 873次阅读

    爱立信推出一系列AI驱动的新产品与合作计划

    爱立信近日推出一系列AI驱动的增强功能,进步丰富其业务和运营支持系统(OSS/BSS)产品组合,实现产品升级演进。同时,爱立信还宣布启动面向紧密合作伙伴的全新AI合作计划。
    的头像 发表于 07-08 10:05 1.6w次阅读

    为什么自动驾驶端到端大模型有黑盒特性?

    、激光雷达数据)映射到控制输出(如方向盘转角、加速度、制动等),以深度神经网络为核心,打通了从视觉到驾驶行为的完整链条。它也代表了自动驾驶从“规则驱动”向“数据驱动”的跃迁,展现了极高的潜力。当然这种结构也天然地带来了
    的头像 发表于 07-04 16:50 591次阅读
    为什么<b class='flag-5'>自动驾驶</b>端到端大<b class='flag-5'>模型</b>有黑盒特性?

    自动驾驶中常提的世界模型是个啥?

    种对外部环境进行抽象和建模的技术,让自动驾驶系统在个简洁的内部“缩影”里,对真实世界进行描述与预测,从而为感知、决策和规划等关键环节提供有力支持。 什么是世界模型? 我们不妨先把“世
    的头像 发表于 06-24 08:53 739次阅读
    <b class='flag-5'>自动驾驶</b>中常提的世界<b class='flag-5'>模型</b>是个啥?

    小鹏汽车在全球AI顶会展示下自动驾驶模型

    Driving),与Waymo、英伟达、加利福尼亚大学洛杉矶分校(UCLA)、图宾根大学(University of Tuebingen)等来自工业界和学术界的自动驾驶同行共同探讨业界最新AI技术。
    的头像 发表于 06-23 09:13 987次阅读

    新能源车软件单元测试深度解析:自动驾驶系统视角

    焦点是否落在目标物体上。某自动驾驶公司借此发现模型在夜间过度关注路灯而非行人。 ‌ 实时性保障: ‌时间感知测试框架(TAF)注入时间戳探针,监控函数执行耗时。例如,某路径规划算法因内存泄漏导致响应
    发表于 05-12 15:59

    自动驾驶模型中常提的Token是个啥?对自动驾驶有何影响?

    、多模态传感器数据的实时处理与决策。在这过程中,大模型以其强大的特征提取、信息融合和预测能力为自动驾驶系统提供了有力支持。而在大模型的中,
    的头像 发表于 03-28 09:16 974次阅读

    自动驾驶“电车难题”如何解?

    近年来,自动驾驶技术正以前所未有的速度发展,并逐渐服务于大众出行。自动驾驶在带来便捷和安全的同时,也引发了一系列伦理、法律和社会问题的探讨,其中个便是
    的头像 发表于 02-25 08:54 1497次阅读

    光庭信息自动驾驶系统亮相CES 2025

    自动驾驶的魅力在于将人类从繁琐的驾驶任务中解放出来,随着 AI 大模型和大数据技术的突破,自动驾驶技术的发展及实际应用也成为 CES 2025 的重头戏之
    的头像 发表于 01-13 14:23 1236次阅读

    本田与通用汽车终止自动驾驶合作

    近日,据报道,本田汽车将解除与通用汽车在自动驾驶汽车领域的合作关系。这决定意味着双方此前在自动驾驶技术上的共同探索将告段落。 通用汽车此
    的头像 发表于 12-12 10:45 1170次阅读