0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶模型是如何“看”懂点云信息的?

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 2025-11-29 10:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]在自动驾驶中,点云是一个非常重要的感知信号,如激光雷达(LiDAR)生成的点云,其实就是三维空间里一堆带坐标、强度和时间戳的点。单帧点云看起来像“星星撒一地”,不像图像那样有整齐的像素网格,也没有颜色(除非和相机融合),更没有直接的语义标记。

机器要“学会”点云里的东西,不仅要解决输入怎么表示成模型能接受的数值结构,还要学习如何把人类的语义(比如“这是行人”“这是车道”)映射到这些数值上。

想将点云变成模型能理解的内容,就是把无结构的几何信息,经过清洗、编码、标签化等一系列流程后,变成有结构的张量和监督信号,然后用合适的网络或算法去学习这些映射关系。

wKgZO2kqWXmAWfBGAAAQo00DEvw893.jpg

如何将点云变成符合模型学习的信息?

自动驾驶汽车上采集的原始点云并不能直接使用,其会有孤立噪声点、有地面反射、有雨雪雾,还有车辆运动导致的扫描畸变等问题。为了使点云能够符合模型使用要求,首先要做的就是预处理,这一步的目标是把原始点云规范化,减少干扰,同时保留判别性信息。预处理包括时间同步和畸变补偿(把点按时间补偿到统一坐标系)、去地面和降噪(去掉地面和平面噪声以便更好分割物体)、下采样(用体素化或随机采样减少点数,让后续计算更可控)等操作。这些操作对模型训练和推理的稳定性至关重要。

神经网络其实更喜欢规则的张量,而点云却是无序的集合,因此要解决点云的“表示”问题。对此有直接以点集合为输入,设计点级网络;把点云离散到体素格子上,用稀疏卷积;把点云投影成二维图像(例如鸟瞰图BEV或视角的range image),用2D卷积;以及使用混合手段,把不同表示结合起来等主流做法。不同的方法,会影响模型的计算复杂度、内存占用和对细节的保留,如点级方法保留细节好但计算贵,BEV快且对规划友好但高度信息丢失。

除了空间表示外,还会从点中提取一些工程特征,每个点的回波强度、局部密度、法向量估计、点到最近地面的高度等信息,都可以和坐标一起作为网络输入,帮助模型学到更丰富的几何线索。

wKgZPGkqWXqAQ-sZAAAR42n7O-I415.jpg

模型如何学会点云里面的内容?

模型要学会“这是什么”和“在哪里”,就得有人先教它。教的方式就是给点云打标签,比如把每个点标上类别(路、车、人),或者用一个三维的长方体把车或行人圈起来,甚至标出它们的速度和行走轨迹等。标注质量将直接决定模型上限,因此半自动标注工具、投影到图像做辅标、以及合成数据等常被用来进行辅助。

在训练模型的时候,不仅要教会模型认东西,告诉它“这是车/这是人/这是路”;还要教会它把物体用三维框圈起来,告诉它框应该放在哪儿、多大;更要教会它判断框的朝向和框跟真实物体重合得有多好。

此外,为了让模型鲁棒性更高,还要学习一些边缘场景,可调整不同类别场景出现的频率,让模型不仅看得懂常见的东西,也看得懂更加复杂的场景。在训练模型时,可以让模型对自己判断有多少有把握给出一个定义,这样系统在用它的结果时就知道该信多少。

在训练模型时,数据增强也很重要,所谓数据增强,就是把已有数据稍微改一改来增加多样性。可通过随机旋转、放缩、平移点云,故意删掉部分点、加点噪声,或者把一个场景里的真实物体复制到另一个场景里等做法来进行数据增强。这样可以让模型在应对遮挡、点稀疏或远处目标的情况时表现得更加出色。

最近流行的还有自监督或对比学习,即先让模型在大量没标签的点云上学会“看懂形状和结构”的能力,然后只用很少的人工标签微调,就能达到不错的效果,这样做能大幅减少人工标注的工作量。

wKgZPGkqWXyABz3PAAASG3BOmsQ347.jpg

模型训练后如何部署?

训练出模型只是第一步,但想把模型安全地用在车上还有很多工作要做。首先要有严格的评估指标,用来衡量模型在检测、分割和跟踪上的表现。检测任务常用平均精度(mAP)和3D框的重合度来评价,分割任务常用mIoU。这些指标可以帮助我们比较不同模型和不同训练配置的优劣,但仅有离线指标还不够,还要在更接近真实的场景里做场景覆盖测试和压力测试,保证模型在稀有或极端情形下的表现可接受。

部署阶段需要把训练好的模型做压缩和优化,以满足车端的算力和延迟约束,可通过模型剪枝、权重量化、使用稀疏运算库等方式来达到这一要求。当然,一定要保证在压缩和优化的同时保证推理时的精度降损可控。部署之后还要做A/B测试和在线回归监测,持续观察模型在真实道路上的表现,如果出现退化或异常,需要能快速回滚到上一个稳定版本。

练时的数据环境(传感器类型、安装高度、城市布局)和模型实际运行的环境可能有差别。为了减少这种差别带来的性能下降,要做域自适应、数据扩充或周期性的在线微调。对于长期运行的车队,还要建立数据闭环,把线上采集到的异常场景回传、做标注并周期性重训练,从而持续提升模型对现实世界的适应能力。

wKgZPGkqWX2AIx16AAASAJELks8801.jpg

最后的话

想把点云变成模型能学的东西,应先把点云清洗和规整成模型可以处理的形式,再把人类的语义用标签和训练目标教给模型,通过合理的表示、增强和训练策略让模型学会识别类别、定位物体并估计不确定性。把这些能力工程化后,配合持续的数据闭环和安全机制,自动驾驶车辆才能使用点云数据在复杂的真实世界里安全、可靠地运行。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    795

    文章

    15065

    浏览量

    182033
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    理想汽车发布下一代自动驾驶基础模型MindVLA-o1

    2026年3月17日,理想汽车基座模型负责人詹锟出席NVIDIA GTC 2026,发表主题演讲《MindVLA-o1:开启全能范式——下一代统一视觉-语言-动作自动驾驶模型探索》,发布
    的头像 发表于 03-18 11:51 1617次阅读
    理想汽车发布下一代<b class='flag-5'>自动驾驶</b>基础<b class='flag-5'>模型</b>MindVLA-o1

    模型时代自动驾驶标注有什么特殊要求?

    自动驾驶的发展历程中,数据标注一直被视为算法进化的基石。然而,随着大模型时代的到来,这一领域正经历着重构。 过去,标注员的任务是简单地在二维照片上画框,标记出车辆和行人的位置。但现在,为了支撑复杂
    的头像 发表于 03-01 09:09 3348次阅读
    大<b class='flag-5'>模型</b>时代<b class='flag-5'>自动驾驶</b>标注有什么特殊要求?

    如何构建适合自动驾驶的世界模型

    [首发于智驾最前沿微信公众号]世界模型经历了系统动力学阶段(1960年~2000年)、认知科学阶段(2001年~2017年)、深度学习阶段(2018年至今),但将其应用到自动驾驶汽车上,还是近几年才
    的头像 发表于 02-18 08:14 1.1w次阅读
    如何构建适合<b class='flag-5'>自动驾驶</b>的世界<b class='flag-5'>模型</b>?

    Transformer如何让自动驾驶模型获得思考能力?

    在谈及自动驾驶时,Transformer一直是非常关键的技术,为何Transformer在自动驾驶行业一直被提及?
    的头像 发表于 02-01 09:15 4496次阅读

    自动驾驶中常提的模仿学习是什么?

    当谈及自动驾驶模型学习时,经常会提到模仿学习的概念。所谓模仿学习,就是模型先看别人怎么做,然后学着去做。自动驾驶中的模仿学习,就是把人类司机在各种路况下的行为做成范例,记录下看到了什么
    的头像 发表于 01-16 16:41 2266次阅读

    自动驾驶中常提的世界模型是什么?

    在很多厂家的技术方案中,会提到世界模型的介绍。世界模型,就是自动驾驶系统内部用来表示外部世界并预测未来演变的一组模型或表征。换句话说,世界模型
    的头像 发表于 01-05 16:23 1184次阅读

    世界模型是让自动驾驶汽车理解世界还是预测未来?

      [首发于智驾最前沿微信公众号]世界模型自动驾驶技术中已有广泛应用。但当谈及它对自动驾驶的作用时,难免会出现分歧。它到底是让自动驾驶汽车得以理解世界,还是为其提供了预测未来的视角?
    的头像 发表于 12-16 09:27 1110次阅读
    世界<b class='flag-5'>模型</b>是让<b class='flag-5'>自动驾驶</b>汽车理解世界还是预测未来?

    自动驾驶数据标注是所有信息都要标注吗?

    [首发于智驾最前沿微信公众号]数据标注对于自动驾驶来说,就像是老师教小朋友知识,数据标注可以让车辆学习辨别道路交通信息的能力。摄像头、雷达、激光雷达(LiDAR)拍下来的只是一堆原始信号,这些信号
    的头像 发表于 12-04 09:05 1320次阅读
    <b class='flag-5'>自动驾驶</b>数据标注是所有<b class='flag-5'>信息</b>都要标注吗?

    VLA能解决自动驾驶中的哪些问题?

    [首发于智驾最前沿微信公众号]很多从事自动驾驶的小伙伴应该对VLA这个概念已经非常熟悉了。VLA即“Visual-Language-Action”(视觉—语言—动作)模型,它的核心是将视觉信息
    的头像 发表于 11-25 08:53 714次阅读
    VLA能解决<b class='flag-5'>自动驾驶</b>中的哪些问题?

    如何确保自动驾驶汽车感知的准确性?

    [首发于智驾最前沿微信公众号]自动驾驶汽车想要自动驾驶,首先要做的就是能对周边环境实现精准感知,也就是能“”清道路,那自动驾驶汽车如何在复杂、快速变化的道路环境中做到感知的精确又可靠
    的头像 发表于 08-23 15:06 1901次阅读
    如何确保<b class='flag-5'>自动驾驶</b>汽车感知的准确性?

    自动驾驶数据标注主要是标注什么?

    [首发于智驾最前沿微信公众号]在自动驾驶系统的研发过程中,数据标注是实现高性能感知模型的基础环节,其核心目标是将车辆从环境中采集到的原始感知数据(主要包括图像、、视频序列等)转化为
    的头像 发表于 07-30 11:54 1852次阅读
    <b class='flag-5'>自动驾驶</b>数据标注主要是标注什么?

    什么是自动驾驶数据标注?如何好做数据标注?

    、精准且高效的数据标注流程显得尤为关键。那什么是数据标注?如何做数据标注? 自动驾驶数据标注是指在自动驾驶系统所采集的感知数据(如摄像头图像、激光雷达、毫米波雷达等)中,为各种交通
    的头像 发表于 07-09 09:19 1855次阅读
    什么是<b class='flag-5'>自动驾驶</b>数据标注?如何好做数据标注?

    为什么自动驾驶端到端大模型有黑盒特性?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术落地,端到端(End-to-End)大模型也成为行业研究与应用的热门方向。相较于传统自动驾驶系统中的模块化结构,端到端模型尝试直接从感知输
    的头像 发表于 07-04 16:50 1128次阅读
    为什么<b class='flag-5'>自动驾驶</b>端到端大<b class='flag-5'>模型</b>有黑盒特性?

    自动驾驶中常提的世界模型是个啥?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术的不断成熟,车辆需要在复杂多变的道路环境中安全地行驶,这就要求系统不仅能“看见”周围的世界,还要能“理解”和“推测”未来的变化。世界模型可以被看作一种
    的头像 发表于 06-24 08:53 1499次阅读
    <b class='flag-5'>自动驾驶</b>中常提的世界<b class='flag-5'>模型</b>是个啥?

    光庭信息自动驾驶试验车赴日

    今年以来,中国自动驾驶企业正借助创新技术和产品加速出海,竞逐全球市场新格局。近日,一辆自动驾驶试验车从武汉阳逻港启程前往日本,正式开启光庭信息出海新征程。
    的头像 发表于 06-18 16:33 1267次阅读