0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

纯视觉自动驾驶会像人眼一样“近视”吗?

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 2025-12-15 09:23 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]在自动驾驶领域,纯视觉路线逐渐获得了一部分从业者和研究者的认可与支持。随着双目乃至三目摄像头方案的应用,通过视差计算、结构约束和算法建模,摄像头已经具备了一定程度的深度感知能力,使其在自动驾驶感知系统中的应用场景不断扩展。

正因如此,很多人习惯将纯视觉自动驾驶类比为“人眼驾驶”。但从生物视觉的角度来看,人眼本身会受到生理条件限制,存在近视等视力问题,那么基于摄像头的纯视觉自动驾驶系统,是否也会出现类似“近视”的情况?

wKgZPGk_YvSAFr80AAAQo00DEvw948.jpg

什么叫“纯视觉自动驾驶”

所谓的纯视觉自动驾驶,就是车辆主要靠摄像头来“看世界”,这些摄像头就像机器的眼睛一样,把路上的画面、车道、行人、障碍物等信息传给自动驾驶系统,自动驾驶系统再根据这些图像来判断、规划和控制车辆。相较于传感器融合方案,纯视觉因其成本较低、更接近人眼“看”路,获得了一大批厂商的支持。

从纯视觉自动驾驶的原理上看,好像它的工作原理与人眼看世界的原理很接近,这时候一定会有人好奇,既然机器视觉和人类视觉这么接近,那机器视觉会不会像人眼一样有近视的问题?或者说,会不会在某些场景下表现得像近视眼一样,看不清远处或者看不清细节?要回答这个问题,得先搞清楚人眼的结构和机器视觉的差别。

人眼的视觉的工作原理与摄像头工作,还是纯在明显差别的,甚至复杂很多。人眼内部有晶状体、视网膜等复杂结构,通过肌肉调节焦距,从而实现对不同距离的物体成像。如果焦距调节不好就会出现近视、远视等问题。眼睛把二维光线信息传给大脑,大脑再进行重建和理解,最终才形成我们看见和理解的世界。

汽车上的摄像头其实更像一个固定焦距的相机,它往前装着,用镜头和传感器把光学图像转成数字信号。这个信号传到自动驾驶系统中后,经算法处理成对周围环境的理解。这里没有天然的“调节焦距”的机制,也不像人类视觉能根据经验、注意力和其他感觉融合信息,它只是把图像“看”进去然后通过算法去处理这些像素。

wKgZPGk_YvWAHDltAAAR42n7O-I688.jpg

机器视觉真的像人眼吗?

机器视觉和人眼其实不是一回事。人类的视觉系统包括眼睛和大脑两个部分,眼睛可以调焦,能在光线复杂的情况下灵活适应,还会用经验和常识来推理。而机器视觉的“眼睛”只是单纯的图像采集器,它的深度感知、物体识别、距离估计全靠算法来做。单个摄像头本身不能直接给出深度信息,因此很多纯视觉自动驾驶系统要靠算法估计距离,或者用多摄像头、立体视觉等方式进行间接补充。

如果机器视觉看不清,不是因为“眼睛近视”,而是因为摄像头本身的物理局限和算法判断能力出现了问题。如在光线很弱或者很强的情况下,摄像头采集的画面会有噪点或者过曝,这会影响后面的感知算法对物体的识别和定位。没有深度传感器或者高精度地图等辅助信息时,算法在某些复杂场景下的表现就会像人眼近视一样,看不清楚东西。这有点类似人眼视觉疲劳时看不清细节的感觉,但本质上不是生理近视,而是技术局限。

人眼能够快速地判断物体距离、速度、判断光影变化、甚至在糟糕环境下还可以凭经验推测前方情况,而纯视觉系统则要依靠算法从二维图像里估计三维信息,这里面会有误差和不确定性。这种不确定性可能在某些场景下表现得模糊不清、难以判断甚至错判,从用户的角度看起来,还真就有点像近视时看远处一样。

wKgZPGk_YvaABLYTAAASG3BOmsQ471.jpg

纯视觉在什么情况下会出现“近视”

纯视觉自动驾驶在强光直射、逆光、夜间弱光或者雾霾天气下,摄像头看到的画面质量会急剧下降。画面质量差了,后面的算法判断也会跟着变糟,可能识别不出远处的障碍物或者错误估计距离。这样的情况在某种程度上和一个近视的人在没有戴眼镜时看远处模糊的体验有点相似。

同样的,在没有高精度地图、没有辅助雷达或者激光雷达等传感器时,纯视觉系统对于复杂街道、快速变化的交通状况的应对能力也会下降。在这些长尾的极端场景下,单靠摄像头不一定能稳定地判断情况,这本质上不是近视,而是缺少可靠的深度感知和补充信息。

还有一点是算法本身的学习和泛化能力问题。深度学习模型是基于大量数据训练出来的,它能很好地处理常见场景,但对于一些罕见情况或者数据没覆盖到的情况,它的判断可能会不稳定。就像人类在突然下雨、大雾或者隧道骤变光线时,会凭借经验和其他感觉(听觉、空间记忆)辅助下做出判断,而纯视觉系统只能根据画面数据来判断,这就增加了误判的风险。

wKgZPGk_YveAfLNsAAASAJELks8983.jpg

机器视觉的“限制”能不能被克服?

既然纯视觉自动驾驶纯在诸多问题,那是否有可行的解决方案?其实从理论上来看,可通过技术升级逐步改善,但想完全像人眼一样,其实很难。

现在很多自动驾驶方案并不只用纯视觉,而是融合了激光雷达、毫米波雷达等感知硬件与摄像头一起感知,这样在视觉弱的情况下,毫米波雷达和激光雷达可以补充距离信息及环境深度感知。这种融合方案比纯视觉方案更稳定。

在算法上,深度学习、三维重建、视觉深度估计等技术都在不断进步,现在很多纯视觉系统可以通过软件升级提升对复杂场景的理解能力。像是视觉深度估计算法,可以从单目图像推断出距离信息,或者通过多摄像头构成立体视觉来获取更准确的深度。

还有一些新方法尝试利用不同波段的光学信息来补充摄像头的感知能力,并提高视觉感知在弱光或复杂光照条件下的稳定性。一种典型的思路是将可见光与近红外(Near-Infrared,NIR)光谱的数据融合在一起,这样系统不仅能获取摄像头看到的图像,还能利用近红外光在低光或逆光情况下的成像优势,实现对场景中的物体和结构进行更全面的感知。

总之,纯视觉自动驾驶的感知能力确实会不断提高。未来可能通过更强的算法、更高性能的摄像头、更智能的数据融合手段,让它在绝大多数路况下做到跟人类一样甚至更好的感知效果。

wKgZPGk_YviAHOl8AAARwcz1hbg826.jpg

最后的话

回到大家最关心的问题,纯视觉自动驾驶会不会像人眼一样近视?答案是不会从生理上“近视”,因为机器的摄像头本身没有眼球那种可调焦结构;它的感知局限也不是眼睛近视那样的视觉模糊,而是技术层面处理复杂画面和深度信息的难点。

但是在某些光照、天气或者极端场景下,它的感知结果可能表现得像“近视”,但随着算法、硬件和系统融合的进步,这些问题将逐步改善,但要完全做到像人类视觉那样灵活、全面,目前仍然有诸多难题需要突破。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    791

    文章

    14692

    浏览量

    176893
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    没有地图,视觉自动驾驶就只能摸瞎吗?

    [首发于智驾最前沿微信公众号]最近在篇讨论高精度地图的文章中,有位小伙伴提到个非常有趣的观点“如果人在陌生的目的地,只依托视觉(眼睛)去辨别道路,若没有导航,就只能摸瞎”。对于
    的头像 发表于 11-27 17:22 1245次阅读
    没有地图,<b class='flag-5'>纯</b><b class='flag-5'>视觉</b><b class='flag-5'>自动驾驶</b>就只能摸瞎吗?

    不同等级的自动驾驶技术要求上有何不同?

    谈到自动驾驶,不可避免地涉及到自动驾驶分级,美国汽车工程师学会(SAE)根据自动驾驶系统与人类驾驶员参与
    的头像 发表于 10-18 10:17 2435次阅读

    自动驾驶感知不致是怎么发生的?

    [首发于智驾最前沿微信公众号]为了让自动驾驶汽车能够安全行驶,很多技术方案中会将多个感知硬件加装到车辆上,以确保自动驾驶汽车感知冗余,但感知硬件越多,并不意味着自动驾驶汽车越安全,因
    的头像 发表于 09-17 12:45 468次阅读
    <b class='flag-5'>自动驾驶</b>感知不<b class='flag-5'>一</b>致是怎么发生的?

    现场解决EMC电磁辐射干扰:“望闻问切”,中医一样

    南柯电子|现场解决EMC电磁辐射干扰:“望闻问切”,中医一样
    的头像 发表于 09-04 09:47 468次阅读

    卡车、矿车的自动驾驶和乘用车的自动驾驶在技术要求上有何不同?

    自动驾驶技术也得到了充足的应用,但因应用场景不同,技术的侧重方向也有所区别。今天就来和大家聊聊这个话题。 应用场景:开放道路vs封闭场地 首先要理解的是,自动驾驶所面对的环境决定了它的技术基础。乘用车
    的头像 发表于 06-28 11:38 750次阅读
    卡车、矿车的<b class='flag-5'>自动驾驶</b>和乘用车的<b class='flag-5'>自动驾驶</b>在技术要求上有何不同?

    自动驾驶视觉方案到底有哪些弊端?

    [首发于智驾最前沿微信公众号]随着人工智能与传感器技术的快速发展,自动驾驶汽车逐步走入公众视野。其中,关于感知系统的技术路线选择,始终是大家争论的焦点。尤其是“视觉方案”,也就是主要依赖摄像头进行
    的头像 发表于 06-23 09:27 758次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>纯</b><b class='flag-5'>视觉</b>方案到底有哪些弊端?

    视觉自动驾驶会有哪些安全问题?

    强调视觉系统的先进性。视觉自动驾驶是指在车辆自动驾驶系统中仅依赖摄像头而不使用激光雷达或毫米波雷达等主动传感器。特斯拉率先倡导这
    的头像 发表于 06-16 09:56 606次阅读
    <b class='flag-5'>纯</b><b class='flag-5'>视觉</b>的<b class='flag-5'>自动驾驶</b>会有哪些安全问题?

    自动驾驶视觉替代不了激光雷达?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术的不断发展,视觉和激光雷达(LiDAR)两种主流环境感知成为了大家的热议话题。基于摄像头的“视觉
    的头像 发表于 06-11 09:06 637次阅读

    视觉自动驾驶如何理解路边画报上的人?

    行业来说,其实是个值得深思的问题。随着自动驾驶技术下沉到消费市场,基于视觉自动驾驶系统就是依托于车载摄像头来识别路况,如果遇到了类似海
    的头像 发表于 05-19 09:16 547次阅读

    自动驾驶安全基石:ODD

    和限制下可以正常工作,是自动驾驶安全的核心概念之。   对于人类司机来说,在不同的道路上驾驶的能力也有所区别,比如新手司机在些窄路、山路,或者交通状况复杂的道路上可能
    的头像 发表于 05-19 03:52 5848次阅读

    华为受邀出席第自动驾驶产业发展论坛

    近日,在由中国电动汽车百和华为等联合主办的“第自动驾驶产业发展论坛”上,华为智能驾驶产品线总裁李文广先生受邀发表了“2025,开启
    的头像 发表于 04-28 10:25 756次阅读

    自动驾驶大模型中常提的Token是个啥?对自动驾驶有何影响?

    、多模态传感器数据的实时处理与决策。在这过程中,大模型以其强大的特征提取、信息融合和预测能力为自动驾驶系统提供了有力支持。而在大模型的中,有个“Token”的概念,有些看到后或许
    的头像 发表于 03-28 09:16 1007次阅读

    自动驾驶中的激光雷达是否伤害人

    提到激光,很多人都会下意识想到“激光笔”,相信在童年玩激光笔时,定会被告知不能直接对着照射,会对造成伤害。但随着
    的头像 发表于 03-24 09:26 933次阅读
    <b class='flag-5'>自动驾驶</b>中的激光雷达是否<b class='flag-5'>会</b>伤害人<b class='flag-5'>眼</b>?

    激光雷达是自动驾驶走的段弯路吗?

    传感器,直被视为构建精确三维地图和实时环境重构的关键设备,而特斯拉CEO埃隆·马斯克却反复表示,激光雷达是“错误的解决方案”,他认为人类驾驶完全依靠视觉及大脑神经网络,自动驾驶同样应
    的头像 发表于 02-19 09:09 730次阅读

    2024年自动驾驶行业热点技术盘点

    感知轻地图以及视觉等。这些技术的出现,也代表着自动驾驶正从概念走向现实,今天就给大家来盘点2024年自动驾驶行业出现的那些技术热点!   城市NOA:迈向精细化
    的头像 发表于 01-14 10:48 1171次阅读