0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

端到端驾驶模型的发展历程

ml8z_IV_Technol 来源:lp 2019-03-28 15:26 次阅读

在搭建无人车时,我和小伙伴们的主要工作是建立一个驾驶模型。所谓的驾驶模型是控制无人车行驶的软件,在功能上类似于一名司机,其输入为车辆状态、周围环境信息,输出为对无人车的控制信号。在所有驾驶模型中,最简单直接的是端到端驾驶模型。端到端驾驶模型直接根据车辆状态和外部环境信息得出车辆的控制信号。从输入端(传感器的原始数据)直接映射到输出端(控制信号),中间不需要任何人工设计的特征。通常,端到端驾驶模型使用一个深度神经网络来完成这种映射,网络的所有参数为联合训练而得。这种方法因它的简洁高效而引人关注。

端到端驾驶模型的发展历程

寻找端到端驾驶模型的最早尝试,至少可以追溯到1989年的ALVINN模型【2】。ALVINN是一个三层的神经网络,它的输入包括前方道路的视频数据、激光测距仪数据,以及一个强度反馈。对视频输入,ALVINN只使用了其蓝色通道,因为在蓝色通道中,路面和非路面的对比最为强烈。对测距仪数据,神经元的激活强度正比于拍摄到的每个点到本车的距离。强度反馈描述的是在前一张图像中,路面和非路面的相对亮度。ALVINN的输出是一个指示前进方向的向量,以及输入到下一时刻的强度反馈。具体的网络结构如图一所示。

图一:ALVINN的网络结构示意图,图片引用于【2】

在训练ALVINN时,其输出的真值被设为一个分布。该分布的中心位置对应于能让车辆行驶到前方7米处的道路中心的那个方向,分布由中心向两边迅速衰减到0。此外,在训练过程中使用了大量合成的道路数据,用于提高ALVINN的泛化能力。该模型成功地以0.5米每秒的速度开过一个400米长的道路。来到1995年,卡内基梅隆大学在ALVINN的基础上通过引入虚拟摄像头的方法,使ALVINN能够检测到道路和路口【3】。另外,纽约大学的Yann LeCun在2006年给出了一个6层卷积神经网络搭建的端到端避障机器人【4】。

近年来,比较有影响力的工作是2016年NVIDIA开发的PilotNet【5】。如图二所示,该模型使用卷积层和全连层从输入图像中抽取特征,并给出方向盘的角度(转弯半径)。相应地,NVIDIA还给出了一套用于实车路测的计算平台NVIDIA PX 2。在NVIDIA的后续工作中,他们还对PilotNet内部学到的特征进行了可视化,发现PilotNet能自发地关注到障碍物、车道线等对驾驶具有重要参考价值的物体【6】。

图二:PilotNet的网络结构示意图,图片引用于【5】

PilotNet之后的模型如雨后春笋般涌现。一个重要的代表是加州大学伯克利分校提出的FCN-LSTM网络【7】。如图三所示,该网络首先通过全卷积网络将图像抽象成一个向量形式的特征,然后通过长短时记忆网络将当前的特征和之前的特征融合到一起,并输出当前的控制信号。值得指出的是,该网络使用了一个图像分割任务来辅助网络的训练,用更多监督信号使网络参数从“无序”变为“有序”,这是一个有趣的尝试。以上这些工作都只关注无人车的“横向控制”,也就是方向盘的转角。罗彻斯特大学提出的Multi-modal multi-task网络【8】在前面工作的基础上,不仅给出方向盘的转角,而且给出了预期速度,也就是包含了“纵向控制”,因此完整地给出了无人车所需的最基本控制信号,其网络结构如图四所示。

图三:FCN-LSTM网络结构示意图,图片引用于【7】

图四:Multi-modal multi-task网络结构示意图,图片引用于【8】

北京大学提出的ST-Conv + ConvLSTM + LSTM网络更加精巧【9】。如图五所示,该网络大致分成两部分,即特征提取子网络和方向角预测子网络。特征提取子网络利用了时空卷积,多尺度残差聚合,卷积长短时记忆网络等搭建技巧或模块。方向角预测子网络主要做时序信息的融合以及循环。该网络的作者还发现,无人车的横向控制和纵向控制具有较强的相关性,因此联合预测两种控制能更有效地帮助网络学习。

图五:ST-Conv+ConvLSTM+LSTM网络结构示意图,图片引用于【9】

端到端驾驶模型的特点

讲到这里,大家也许已经发现,端到端模型得益于深度学习技术的快速发展,朝着越来越精巧的方向不断发展。从最初的三层网络,逐步武装上了最新模块和技巧。在这些最新技术的加持下,端到端驾驶模型已经基本实现了直道、弯道行驶,速度控制等功能。为了让大家了解目前的端到端模型发展现状,我们从算法层面将这种模型与传统模型做一个简单对比,见下表一:

表一:传统驾驶模型和端到端模型对比

传统的模型一般将驾驶任务分割成多个子模块,例如感知、定位、地图、规划、控制等等。每个子模块完成特定的功能,某个模块的输出作为其它模块的输入,模块间相互连接,形成有向图的结构。这种方法需要人工解耦无人车的驾驶任务,设计各个子模块,而子模块的数量甚至高达上千个,导致这项工作费时费力,维护成本高昂。如此多的子模块又对车载计算平台提出了极高的要求,需要强大的算力保证各个模块能快速响应环境的变化。

此外,传统驾驶模型往往依赖高精地图,导致其数据成本高昂。这类模型通过规则化的逻辑来做无人车的运动规划与控制,又导致其驾驶风格的拟人化程度弱,影响乘坐的舒适性。作为对比,端到端模型以其简单、易用、成本低、拟人化等特点表现出很强的优势。

人们通常认为端到端驾驶模型和模块化的传统模型之间是彼此对立的,有了模块化模型就不需要端到端了。但在无人配送领域,我认为两者应该是互补的。首先,无人配送车“小、轻、慢、物”的特点【10】极大降低了其安全风险。使端到端模型的部署成为可能。然后,端到端模型可以很好地处理常见场景,而且功耗低。模块化的方法能覆盖更多场景,但功耗高。因此,一个很有价值的方向应该是联合部署端到端模型和模块化模型。在常见场景中使用端到端,在复杂场景中,切换到模块化模型。这样,我们可以在保证整体模型性能的同时,尽最大可能降低配送车的功耗。

那么是不是很快就能见到端到端驾驶模型控制的无人配送车了呢?其实,现在端到端驾驶模型还处在研究阶段。我从自己的实际工作经验中总结出以下几个难点:

1、端到端驾驶模型因其近乎黑盒的特点导致调试困难。

由于端到端模型是作为一个整体工作的,因此当该模型在某种情况下失败时,我们几乎无法找到模型中应该为这次失败负责的“子模块”,也就没办法有针对性地调优。当遇到失败例子时,通常的做法只能是添加更多的数据,期待重新训练的模型能够在下一次通过这个例子。

2、端到端驾驶模型很难引入先验知识。

目前的端到端模型更多地是在模仿人类驾驶员动作,但并不了解人类动作背后的规则。想要通过纯粹数据驱动的方式让模型学习诸如交通规则、文明驾驶等规则比较困难,还需要更多的研究。

3、端到端驾驶模型很难恰当地处理长尾场景。

对于常见场景,我们很容易通过数据驱动的方式教会端到端模型正确的处理方法。但真实路况千差万别,我们无法采集到所有场景的数据。对于模型没有见过的场景,模型的性能往往令人担忧。如何提高模型的泛化能力是一个亟待解决的问题。

4、端到端驾驶模型通常通过模仿人类驾驶员的控制行为来学习驾驶技术。

但这种方式本质上学到的是驾驶员的“平均控制信号”,而“平均控制信号”甚至可能根本就不是一个“正确”的信号。

例如在一个可以左拐和右拐的丁字路口,其平均控制信号——“直行”——就是一个错误的控制信号。因此,如何学习人类驾驶员的控制策略也有待研究。

在这个问题上,我和小伙伴们一起做了一点微小的工作,在该工作中,我们认定驾驶员在不同状态下的操作满足一个概率分布。我们通过学习这个概率分布的不同矩来估计这个分布。这样一来,驾驶员的控制策略就能很好地通过其概率分布的矩表达出来,避免了简单求“平均控制信号”的缺点。该工作已被 ROBIO 2018 接收。

端到端驾驶模型中常用方法

为了解决上面提到的各种问题,勇敢的科学家们提出了许多方法,其中最值得期待的要数深度学习技术【11】和强化学习技术【12】了。随着深度学习技术的不断发展,相信模型的可解释性、泛化能力会进一步提高。这样以来,我们或许就可以有针对性地调优网络,或者在粗糙的仿真下、在较少数据的情况下,成功地泛化到实车场景、长尾场景。强化学习这项技术在近年来取得了令人惊叹的成就。通过让无人车在仿真环境中进行强化学习,也许可以获得比人类驾驶员更优的控制方法也未可知。此外,迁移学习、对抗学习、元学习等技术高速发展,或许也会对端到端驾驶模型产生巨大影响。

我对端到端驾驶模型今后的发展充满了期待。“Two roads diverged in a wood, and I took the one less traveled by”【13】。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2522

    文章

    47981

    浏览量

    739674
  • 神经网络
    +关注

    关注

    42

    文章

    4562

    浏览量

    98644
  • 图像分割
    +关注

    关注

    4

    文章

    173

    浏览量

    17854

原文标题:美团技术部解析:无人车端到端驾驶模型概述

文章出处:【微信号:IV_Technology,微信公众号:智车科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    未来已来,多传感器融合感知是自动驾驶破局的关键

    巨大的进展;自动驾驶开始摒弃手动编码规则和机器学习模型的方法,转向全面采用的神经网络AI系统,它能模仿学习人类司机的
    发表于 04-11 10:26

    HDMI信号的接收和发送与PD的DFP和UFP有对应关系吗?

    HDMI信号的接收和发送与PD的DFP和UFP有对应关系吗? 例如:一作为HDMI的接收PD的输电,另一
    发表于 02-29 07:46

    Aurix TC2752的中机制是怎么样的?有无固定的中向量标号和中地址啊?

    AurixTC2752的中机制是怎么样的?有无固定的中向量标号和中地址啊?是类似于飞思卡尔或者28335那样的吗?
    发表于 02-05 06:33

    和四稳压器的原理分析

    上图是一个双踪稳压器,先由上半部分分析正稳压过程。 1、假设未稳压输入电压是15-24V,电压进入该电路,在稳压二极管产生2.5V压降,运放正向输入也就是2.5V,此时运放进入正向饱和,假设是
    发表于 01-27 14:09

    PLC从HTTP服务获取JSON文件,解析数据寄存器

    文件提交给HTTP的服务; 服务有返回的JSON,或者GET命令获取到的JSON,网关进行解析后将数据写入PLC寄存器。 本文主要描述通过GET命令获取数据,解析西门子PLC的
    发表于 01-24 09:47

    自动驾驶和多模态大语言模型发展历程

    多模态大语言模型(MLLM) 最近引起了广泛的关注,其将 LLM 的推理能力与图像、视频和音频数据相结合,通过多模态对齐使它们能够更高效地执行各种任务,包括图像分类、将文本与相应的视频对齐以及语音检测。
    发表于 12-28 11:45 203次阅读
    自动<b class='flag-5'>驾驶</b>和多模态大语言<b class='flag-5'>模型</b>的<b class='flag-5'>发展</b><b class='flag-5'>历程</b>

    使用Lvpecl电平能够驱动AD9739A的时钟吗?

    使用Lvpecl电平能够驱动AD9739A的时钟么?如果可以,能否提供相关的端接电路,并且提供IBIS模型
    发表于 12-14 06:34

    一键解锁!晶体管结构工艺发展历程

    一键解锁!晶体管结构工艺发展历程
    的头像 发表于 12-07 09:48 302次阅读
    一键解锁!晶体管结构工艺<b class='flag-5'>发展</b><b class='flag-5'>历程</b>

    AD7124-4单信号输入,微弱信号输入时采集数据不对的原因?

    ain0 - ain3配置为pt100温度采集,ain4 - ain7配置为单信号输入,负输入配置为AVSS。 采集温度时,ain4 - ain7通道关闭,内部基准关闭。采集ain4
    发表于 12-01 07:51

    请问轨轨放大器同相输入和光电探测器正可以接地吗?

    请问轨轨放大器同相输入和光电探测器正可以接地吗?还是要接一个偏置。
    发表于 11-17 09:24

    汽车大灯发展历程:从乙烯块到激光灯

    电子发烧友网站提供《汽车大灯发展历程:从乙烯块到激光灯.doc》资料免费下载
    发表于 11-01 09:30 0次下载
    汽车大灯<b class='flag-5'>发展</b><b class='flag-5'>历程</b>:从乙烯块到激光灯

    机器学习发展历程

    机器学习发展历程:机器学习发展现状、机器学习发展前景和机器学习发展历史 随着科技的快速发展,全球
    的头像 发表于 08-17 16:30 1097次阅读

    Ai大模型与智能驾驶的关系

    Ai大模型与智能驾驶的关系 随着人工智能的不断发展,越来越多的企业开始使用AI大模型来提高业务的效率和创新性。智能驾驶系统也是一个日益受到关
    的头像 发表于 08-08 17:33 979次阅读

    浅析AI大型语言模型研究的发展历程

    大型语言模型研究的发展有三条技术路线:Bert 模式、GPT 模式、混合模式。其中国内大多采用混合模式, 多数主流大型语言模型走的是 GPT 技术路线,直到 2022 年底在 GPT-3.5 的基础上产生了 ChatGPT。
    发表于 06-09 12:34 3626次阅读
    浅析AI大型语言<b class='flag-5'>模型</b>研究的<b class='flag-5'>发展</b><b class='flag-5'>历程</b>

    智能配电系统在水务行业的发展历程及应用案例

    本文首先回顾了智能配电系统在水务行业的发展历程,并对其应用现状进行了分析,进而展望了智能配电系统在水务行业的发展趋势。
    发表于 05-19 16:47 0次下载
    智能配电系统在水务行业的<b class='flag-5'>发展</b><b class='flag-5'>历程</b>及应用案例