0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

强化学习与智能驾驶决策规划

jf_C6sANWk1 来源:阿宝1990 2023-02-08 14:05 次阅读

本文介绍了强化学习与智能驾驶决策规划。智能驾驶中的决策规划模块负责将感知模块所得到的环境信息转化成具体的驾驶策略,从而指引车辆安全、稳定的行驶。真实的驾驶场景往往具有高度的复杂性及不确定性。如何制定一套泛化能力强的决策规划机制是智能驾驶目前面临的难点之一。强化学习是一种从经验中总结的学习方式,并从长远的角度出发,寻找解决问题的最优方案。近些年来,强化学习在人工智能领域取得了重大突破,因而成为了解决智能驾驶决策规划问题的一种新的思路。

01.强化学习的介绍

b38a4ebc-a220-11ed-bfe3-dac502259ad0.jpg

强化学习(Reinforcement Learning)近些年来是人工智能的一个前言领域,属于机器学习的一个重要分支。从定义上来讲,强化学习可以通过经验探索来学习到解决问题的最优策略,即累计回报值最大的动作选取策略。在没有任何初始经验的情况下,强化学习可以通过平衡探索未知动作的可能性,学习到解决问题的最优方法,从而达到自我学习的目的。因此,强化学习与其他机器学习算法的一个显著区别为不依赖初始人工标注数据集的大小,探索式的自我学习可大幅度的节省人力成本。近些年来,随着深度学习的迅速发展,将深度学习与强化学习相结合的深度强化学习成为人工智能研究的热门领域之一,并在游戏、控制等领域取得了令人瞩目的成就。

02.智能驾驶决策规划的任务

b39a4f2e-a220-11ed-bfe3-dac502259ad0.jpg

智能驾驶的主要目的是为人们提供安全、舒适及高效的出行体验。大多数的交通事故产生的原因来自于驾驶员人为因素,例如疲劳驾驶、情绪驾驶以及路况判断失误等。因此,合理的选择驾驶行为及路线规划是智能驾驶的一个重要环节。其中,行为决策负责在接收到全局路径后,根据从感知模块得到的环境信息(车辆速度、障碍物及道路信息等),做出具体的行为决策(如变道、跟车、减速等)。而规划的任务则是在接收到决策层的宏观动作指令之后,将其转化成一条更加具体的行驶轨迹,从而能够生成一系列控制信号(油门、方向盘转角、刹车等),实现车辆的自动行驶。如何应对不同的路况信息将做出合理的决策与规划是无人驾驶智能化的一个重要指标。

03.决策规划目前的难点

b3aff450-a220-11ed-bfe3-dac502259ad0.jpg

由于实际的交通场景千变万化,道路结构差异大(高速、十字路口、停车场等),如何去设计一套通用性强的决策规划机制是目前困扰着智能驾驶的一个主要难题。同时,其他交通参与者的行为存在不确定性,不仅需要对其行为做预测,还需要考虑本车与其他交通参与者的博弈。因此,需要对时刻变化的外部环境做出快速及准确的响应。如何应对感知模块提供的信息做不到100%的准确和100%的全覆盖也是智能车在决策规划时要考虑的重要因素。

04.强化学习对于智能驾驶决策规划的意义

b3ba2fec-a220-11ed-bfe3-dac502259ad0.jpg

强化学习适用于求解具有时序性的决策问题,这正与智能驾驶的决策过程相契合。结合神经网络的深度强化学习框架可以增加驾驶场景的泛化能力。同时,考虑部分不可观测环境的强化学习流程可以评估交通参与者的不确定性,并通过预测与推演的方式从长远的角度出发来寻求最优的驾驶方案。更重要的是,强化学习由于其自身具有应对外部环境改变而产生进化的能力。当未知的corner case产生时,智能体可以通过改变自身的驾驶策略来适应并探索学习到解决该问题的方法。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43899

    浏览量

    230645
  • 智能驾驶
    +关注

    关注

    3

    文章

    2106

    浏览量

    48216
  • 强化学习
    +关注

    关注

    4

    文章

    259

    浏览量

    11114

原文标题:强化学习对于智能驾驶决策规划的意义

文章出处:【微信号:阿宝1990,微信公众号:阿宝1990】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    VADv2:基于概率性规划的端到端自动驾驶

    不同于感知,规划中存在着更多的不确定性,对于同一场景,存在不同的合理的决策规划结果。环境信息到决策规划不存在明确的映射关系,因此
    的头像 发表于 02-22 10:21 572次阅读
    VADv2:基于概率性<b class='flag-5'>规划</b>的端到端自动<b class='flag-5'>驾驶</b>

    什么是强化学习

    强化学习是机器学习的方式之一,它与监督学习、无监督学习并列,是三种机器学习训练方法之一。 在围棋上击败世界第一李世石的 AlphaGo、在《
    的头像 发表于 10-30 11:36 1661次阅读
    什么是<b class='flag-5'>强化学习</b>

    NeurIPS 2023 | 扩散模型解决多任务强化学习问题

    扩散模型(diffusion model)在 CV 领域甚至 NLP 领域都已经有了令人印象深刻的表现。最近的一些工作开始将 diffusion model 用于强化学习(RL)中来解决序列决策
    的头像 发表于 10-02 10:45 453次阅读
    NeurIPS 2023 | 扩散模型解决多任务<b class='flag-5'>强化学习</b>问题

    模拟矩阵在深度强化学习智能控制系统中的应用

    讯维模拟矩阵在深度强化学习智能控制系统中的应用主要是通过构建一个包含多种环境信息和动作空间的模拟矩阵,来模拟和预测深度强化学习智能控制系统在不同环境下的表现和效果,从而优化控制策略和提
    的头像 发表于 09-04 14:26 330次阅读
    模拟矩阵在深度<b class='flag-5'>强化学习</b><b class='flag-5'>智能</b>控制系统中的应用

    基于模型的自动驾驶汽车端到端深度强化学习概述

    真实驾驶场景中,通过观察和互动,使智能驾驶汽车能够积累知识并应对不可预测的情况。我们将智驾汽车的这种对世界运作方式称为“常规认知”,它使智能汽车能够找到自己的方向。
    发表于 07-25 16:18 233次阅读
    基于模型的自动<b class='flag-5'>驾驶</b>汽车端到端深度<b class='flag-5'>强化学习</b>概述

    语言模型做先验,统一强化学习智能体,DeepMind选择走这条通用AI之路

    智能体的开发中,强化学习与大语言模型、视觉语言模型等基础模型的进一步融合究竟能擦出怎样的火花?谷歌 DeepMind 给了我们新的答案。 一直以来,DeepMind 引领了强化学习(RL)
    的头像 发表于 07-24 16:55 335次阅读
    语言模型做先验,统一<b class='flag-5'>强化学习</b><b class='flag-5'>智能</b>体,DeepMind选择走这条通用AI之路

    基于强化学习的目标检测算法案例

    摘要:基于强化学习的目标检测算法在检测过程中通常采用预定义搜索行为,其产生的候选区域形状和尺寸变化单一,导致目标检测精确度较低。为此,在基于深度强化学习的视觉目标检测算法基础上,提出联合回归与深度
    发表于 07-19 14:35 0次下载

    什么是深度强化学习?深度强化学习算法应用分析

    什么是深度强化学习? 众所周知,人类擅长解决各种挑战性的问题,从低级的运动控制(如:步行、跑步、打网球)到高级的认知任务。
    发表于 07-01 10:29 1188次阅读
    什么是深度<b class='flag-5'>强化学习</b>?深度<b class='flag-5'>强化学习</b>算法应用分析

    人工智能强化学习开源分享

    电子发烧友网站提供《人工智能强化学习开源分享.zip》资料免费下载
    发表于 06-20 09:27 1次下载
    人工<b class='flag-5'>智能</b><b class='flag-5'>强化学习</b>开源分享

    基于深度强化学习的视觉反馈机械臂抓取系统

    机械臂抓取摆放及堆叠物体是智能工厂流水线上常见的工序,可以有效的提升生产效率,本文针对机械臂的抓取摆放、抓取堆叠等常见任务,结合深度强化学习及视觉反馈,采用AprilTag视觉标签、后视经验回放机制
    的头像 发表于 06-12 11:25 1423次阅读
    基于深度<b class='flag-5'>强化学习</b>的视觉反馈机械臂抓取系统

    ICLR 2023 Spotlight|节省95%训练开销,清华黄隆波团队提出强化学习专用稀疏训练框架RLx2

    大模型时代,模型压缩和加速显得尤为重要。传统监督学习可通过稀疏神经网络实现模型压缩和加速,那么同样需要大量计算开销的强化学习任务可以基于稀疏网络进行训练吗?本文提出了一种强化学习专用稀疏训练框架
    的头像 发表于 06-11 21:40 409次阅读
    ICLR 2023 Spotlight|节省95%训练开销,清华黄隆波团队提出<b class='flag-5'>强化学习</b>专用稀疏训练框架RLx2

    彻底改变算法交易:强化学习的力量

    强化学习(RL)是人工智能的一个子领域,专注于决策过程。与其他形式的机器学习相比,强化学习模型通过与环境交互并以奖励或惩罚的形式接收反馈来
    发表于 06-09 09:23 370次阅读

    自动驾驶决策规划算法第一章笔记

    第一章 自动驾驶决策规划算法数学基础 第一节:决策规划算法的地位和作用 该笔记来自b站up主(偶像):憨厚老实的老王 视频链接主页 第二节:
    发表于 06-02 14:17 0次下载
    自动<b class='flag-5'>驾驶</b><b class='flag-5'>决策</b><b class='flag-5'>规划</b>算法第一章笔记

    自动驾驶决策规划模块算法介绍

    在自动驾驶整个软件框架中,决策规划模块有着重要的作用。决策规划模块一般也叫Planning模块,在整个自动
    发表于 06-01 15:21 0次下载
    自动<b class='flag-5'>驾驶</b><b class='flag-5'>决策</b><b class='flag-5'>规划</b>模块算法介绍

    基于多智能体深度强化学习的体系任务分配方法

    为了应对在未来复杂的战场环境下,由于通信受限等原因导致的集中式决策模式难以实施的情况,提出了一个基于多智能体深度强化学习方法的分布式作战体系任务分配算法,该算法为各作战单元均设计一个独立的策略网络
    的头像 发表于 05-18 16:46 2683次阅读
    基于多<b class='flag-5'>智能</b>体深度<b class='flag-5'>强化学习</b>的体系任务分配方法