0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

没有地图,纯视觉自动驾驶就只能摸瞎吗?

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 2025-11-27 17:22 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]最近在一篇讨论高精度地图的文章中,有位小伙伴提到一个非常有趣的观点“如果人在陌生的目的地,只依托纯视觉(眼睛)去辨别道路,若没有导航,就只能摸瞎”。对于纯视觉自动驾驶来说,是否也是如此?

wKgZO2koGG2APVR8AAAQo00DEvw947.jpg

人和机器用“视觉”导航的差异

在讨论这个话题前,先简单聊聊什么是“纯视觉”。所谓“纯视觉”,就是只用摄像头(单目或多目)来完成感知的方案。不管是把图像直接送入一个端到端的神经网络输出控制指令,还是把图像先做目标检测/语义分割/深度估计再走传统规划,这类方案都强调将摄像头作为主传感器,甚至唯一的传感器。

摄像头的优势其实很明显,其信息丰富(颜色、纹理、文字、标志),成本低,分辨率高,便于人工标注和语义理解。但摄像头对光线敏感、受能见度影响大、难以直接测量精确距离与速度(尤其是远距物体)。

如果一个人在陌生城市,只有双眼和一辆车,确实会觉得“瞎摸”,但人并非只靠眼睛去辨别路况。人有长期记忆(熟悉的街区)、语言社交能力(问路)、抽象推理(理解路牌、交通规则)、以及对场景的常识推断(哪条路更可能通向城中心)。人还能容忍不确定性并主动采取探测行为(减速、靠边观察、试探转弯)。

机器要复制这些能力,光靠一帧图像是不够的,但连续的视频、多时序推理、学习到的场景模型以及外部信息(如高清地图、定位)可以代替人类的记忆与推理能力。简而言之,人类在陌生城市走路,若没有导航,并不仅是纯视觉,而是会有多种信息融合和主动探索,这也正是自动驾驶中会采用多传感器、多信息源来补偿摄像头不足的原因。

wKgZO2koGG6AUh1UAAAR42n7O-I852.jpg

纯视觉能做到什么?

纯视觉的作用不容小觑,很多车企都围绕成视觉方案,开发出自动驾驶系统。借助深度学习,摄像头其实可以做很强的语义理解,完成识别车辆、行人、交通标志和信号灯,判断车道线,分割出可通行区域等任务。

通过时序信息(连续帧)和已学得的运动模型,可以估计自车的运动(视觉里程计/VO)和相对深度(单目深度估计或双目/立体匹配)。把这些能力组合起来,纯视觉系统可以在相对良好的光照、天气条件下完成感知-预测-规划闭环,尤其是在结构化环境(如高速公路、城市主干道)和限定的操作设计域(ODD)内表现会非常不错。

但是纯视觉能做到并不意味着纯视觉可以完全替代其他传感器,摄像头在夜间或极低照度环境、强逆光、雨雪雾等能见度差的天气、反光或平坦无纹理表面(比如大面积光滑地面或光秃的雪面)、遮挡严重的复杂交叉口和远距离小物体的预警(比如远处突然出现的行人或小型车辆)等场景下表现不尽如人意。

单目相机还存在尺度不确定性的问题(即仅靠图像难以知道物体绝对距离),虽然借助运动恢复结构或学习可以部分解决,但精度、鲁棒性与雷达/激光雷达相比仍有差距。此外,摄像头对光学欺骗(比如反射、投影、极端对比)比较敏感,容易被异常光照或极端场景“迷惑”。这些局限会直接关系到安全冗余的设计,当感知变得不可靠时,系统必须要么降级(限制速度、主动停车),要么需依赖其他传感器。

其实现在很多技术方案中都是采用“冗余与互补”的策略。摄像头擅长语义与长距离视觉细节,毫米波雷达擅长在雨雪雾中测量相对速度并具备穿透性能,激光雷达在构建精确三维几何上更可靠。

多数成熟的自动驾驶系统会选择多传感器融合以覆盖更广的ODD。当然,也有技术方案一致在推动“摄像头主导”或“摄像头优先”的路线,靠大量场景数据训练、严格限制运行域并设计详尽的降级策略来保证安全。

wKgZO2koGG-AA0eMAAASG3BOmsQ533.jpg

纯视觉能否替代地图和定位?

回到今天的主题,其实这位小伙伴强调是导航(地图)对于纯视觉的重要性。地图和定位解决的是“我在哪儿”和“目标在那里”的问题。纯视觉可以进行相对定位(通过视觉里程计或视觉SLAM),甚至可以做基于图像匹配的全局定位(视觉定位/视觉数据库检索)。

但想真正将自动驾驶应用到车辆上,绝对定位是必不可少的,绝对定位(高精GNSS、车辆坐标在地图上的精确投影)在诸如狭窄车道、复杂交叉口和需要精确轨迹跟踪的场景中会起到关键性作用。

wKgZPGkoGG-AEnS7AABR2fwZL2Q617.jpg

图片源自:网络

地图(尤其是轻量级矢量地图或路网信息)给规划提供的其实是语义与先验信息,它能显著减少在线推理的负担并提高安全边界。纯视觉可以替代一部分地图功能,但要做到在任何场景下不用地图、只靠摄像头安全行驶,是非常困难的。

既然纯视觉可以替代一部分的地图功能,那如何将其能力推到极限?现在其实有多个方案,在推动这一想法。自监督深度与视觉里程计算法能在没有密集标注的情况下学到深度和运动;多视角与时序融合能改善远距深度估计;利用神经场景表示(如NeRF类思想)或大模型的视觉理解可以让系统在见过类似场景时更好地推断未观测的部分;此外,把摄像头输出转换为BEV表示、与轨迹预测结合、并在规划层引入不确定性建模,能让纯视觉系统的决策更可靠。

wKgZO2koGG-AVQGsAAASAJELks8374.jpg

最后的话

纯视觉并不是万能的,但能力不容小觑,其在语义理解和成本效益上有明显优势,在受控场景中可以承担很大一部分工作;但在面对极端光照、恶劣天气、远距预警和绝对定位需求时,摄像头的物理和算法局限依然明显。智驾最前沿以为,智驾安全不是仅靠单一感觉,而是需要靠多源信息与严谨的工程来保证。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    795

    文章

    15073

    浏览量

    182075
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    视觉自动驾驶如何在夜晚感知场景?

    [首发于智驾最前沿微信公众号]在聊今天的话题前,先申明下,对于视觉自动驾驶来说,夜晚确实是一个极具挑战的场景,今天仅从技术实现上来讨论视觉
    的头像 发表于 04-22 09:00 305次阅读
    <b class='flag-5'>纯</b><b class='flag-5'>视觉</b><b class='flag-5'>自动驾驶</b>如何在夜晚感知场景?

    为什么自动驾驶方案不再强调地图了?

    [首发于智驾最前沿微信公众号]不知道大家是否发现,现在很多车企在宣传自动驾驶方案时,很少会再强调或提及高精度地图,甚至很少会再提地图相关的内容,为啥曾经被自动驾驶行业高度依赖的技术,现
    的头像 发表于 03-31 08:57 468次阅读
    为什么<b class='flag-5'>自动驾驶</b>方案不再强调<b class='flag-5'>地图</b>了?

    为啥有人认为自动驾驶视觉方案比激光雷达方案好?

    激光雷达曾被视为自动驾驶不可或缺的“安全拐杖”,但以特斯拉为代表的自动驾驶方案让大家看到了视觉的潜力。视觉方案不仅在成本上有优势,更在模拟
    的头像 发表于 03-30 17:18 1208次阅读

    为什么光照对视觉自动驾驶影响较大?

    自动驾驶的技术路线中,视觉方案因其模仿人类驾驶逻辑与低廉的硬件成本,一直是很多车企的选择。但这种高度依赖摄像头的感知方式,在夜幕降临、车辆驶入幽暗的隧道,或是遭遇强烈的逆光直射、漫
    的头像 发表于 03-09 17:06 1168次阅读

    TomTom Orbis地图将为CARIAD的自动驾驶系统提供支持

    地图与位置技术专家TomTom宣布,大众集团汽车软件公司 CARIAD 将采用TomTom 先进的Orbis 地图,作为其开发的自动驾驶系统的核心组成部分。
    的头像 发表于 02-25 15:10 639次阅读

    视觉自动驾驶能识别出高透明玻璃墙吗?

    [首发于智驾最前沿微信公众号]最近在和大家聊视觉自动驾驶能否识别3D图像时,有小伙伴提问,视觉自动驾
    的头像 发表于 02-18 08:49 1.1w次阅读
    <b class='flag-5'>纯</b><b class='flag-5'>视觉</b><b class='flag-5'>自动驾驶</b>能识别出高透明玻璃墙吗?

    视觉自动驾驶的优势和劣势有哪些?

    [首发于智驾最前沿微信公众号]最近有很多小伙伴在后台询问视觉自动驾驶的优劣,视觉自动驾驶以其
    的头像 发表于 01-18 09:50 2463次阅读
    <b class='flag-5'>纯</b><b class='flag-5'>视觉</b><b class='flag-5'>自动驾驶</b>的优势和劣势有哪些?

    视觉自动驾驶会像人眼一样“近视”吗?

    [首发于智驾最前沿微信公众号]在自动驾驶领域,视觉路线逐渐获得了一部分从业者和研究者的认可与支持。随着双目乃至三目摄像头方案的应用,通过视差计算、结构约束和算法建模,摄像头已经具备了一定程度的深度
    的头像 发表于 12-15 09:23 963次阅读
    <b class='flag-5'>纯</b><b class='flag-5'>视觉</b><b class='flag-5'>自动驾驶</b>会像人眼一样“近视”吗?

    隐式地图自动驾驶的“数字直觉“

    当机器学会"看懂"道路 在自动驾驶领域,一场静默的革命正在颠覆传统认知。2023年以来,产业界悄然兴起一股新趋势——隐式地图。这种技术不再依赖传统的高精地图或轻量地图,而是让神经网络像
    的头像 发表于 11-19 09:26 638次阅读
    隐式<b class='flag-5'>地图</b>:<b class='flag-5'>自动驾驶</b>的“数字直觉“

    自动驾驶中如何将稀疏地图视觉SLAM相结合?

    [首发于智驾最前沿微信公众号]在自动驾驶场景中,稀疏地图通常是由一系列关键帧和若干三维稀疏特征点构成的地图,每个特征点包含三维坐标和描述外观的描述子;而视觉SLAM是运行在车辆上的实时
    的头像 发表于 10-28 09:07 887次阅读
    <b class='flag-5'>自动驾驶</b>中如何将稀疏<b class='flag-5'>地图</b>与<b class='flag-5'>视觉</b>SLAM相结合?

    实时生成式地图对于自动驾驶来说有什么作用?

    [首发于智驾最前沿微信公众号]在自动驾驶领域,地图长期以来都是车辆感知和决策的重要基石。传统的高精度地图(HD Map)多是在出厂前或随后由专门装备的测绘车辆完成采集与构建,然后通过定期更新的方式
    的头像 发表于 07-22 09:03 955次阅读
    实时生成式<b class='flag-5'>地图</b>对于<b class='flag-5'>自动驾驶</b>来说有什么作用?

    如何制作一张自动驾驶高精度地图

    [首发于智驾最前沿微信公众号]在自动驾驶系统中,高精度地图(HDMap)不仅仅是一份普通的路网图,而是承载着车道线、路缘石、交通标志、红绿灯、坡度坡向等丰富的结构化信息,能够为车辆的定位与决策提供
    的头像 发表于 07-18 09:08 1106次阅读
    如何制作一张<b class='flag-5'>自动驾驶</b>高精度<b class='flag-5'>地图</b>?

    自动驾驶视觉方案到底有哪些弊端?

    [首发于智驾最前沿微信公众号]随着人工智能与传感器技术的快速发展,自动驾驶汽车逐步走入公众视野。其中,关于感知系统的技术路线选择,始终是大家争论的焦点。尤其是“视觉方案”,也就是主要依赖摄像头进行
    的头像 发表于 06-23 09:27 1428次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>纯</b><b class='flag-5'>视觉</b>方案到底有哪些弊端?

    视觉自动驾驶会有哪些安全问题?

    强调视觉系统的先进性。视觉自动驾驶是指在车辆自动驾驶系统中仅依赖摄像头而不使用激光雷达或毫米波雷达等主动传感器。特斯拉率先倡导这一路线,宣
    的头像 发表于 06-16 09:56 1294次阅读
    <b class='flag-5'>纯</b><b class='flag-5'>视觉</b>的<b class='flag-5'>自动驾驶</b>会有哪些安全问题?

    自动驾驶视觉替代不了激光雷达?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术的不断发展,视觉和激光雷达(LiDAR)两种主流环境感知成为了大家的热议话题。基于摄像头的“视觉
    的头像 发表于 06-11 09:06 1313次阅读