0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶模型是如何“看”懂点云信息的?

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 2025-11-29 10:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]在自动驾驶中,点云是一个非常重要的感知信号,如激光雷达(LiDAR)生成的点云,其实就是三维空间里一堆带坐标、强度和时间戳的点。单帧点云看起来像“星星撒一地”,不像图像那样有整齐的像素网格,也没有颜色(除非和相机融合),更没有直接的语义标记。

机器要“学会”点云里的东西,不仅要解决输入怎么表示成模型能接受的数值结构,还要学习如何把人类的语义(比如“这是行人”“这是车道”)映射到这些数值上。

想将点云变成模型能理解的内容,就是把无结构的几何信息,经过清洗、编码、标签化等一系列流程后,变成有结构的张量和监督信号,然后用合适的网络或算法去学习这些映射关系。

wKgZO2kqWXmAWfBGAAAQo00DEvw893.jpg

如何将点云变成符合模型学习的信息?

自动驾驶汽车上采集的原始点云并不能直接使用,其会有孤立噪声点、有地面反射、有雨雪雾,还有车辆运动导致的扫描畸变等问题。为了使点云能够符合模型使用要求,首先要做的就是预处理,这一步的目标是把原始点云规范化,减少干扰,同时保留判别性信息。预处理包括时间同步和畸变补偿(把点按时间补偿到统一坐标系)、去地面和降噪(去掉地面和平面噪声以便更好分割物体)、下采样(用体素化或随机采样减少点数,让后续计算更可控)等操作。这些操作对模型训练和推理的稳定性至关重要。

神经网络其实更喜欢规则的张量,而点云却是无序的集合,因此要解决点云的“表示”问题。对此有直接以点集合为输入,设计点级网络;把点云离散到体素格子上,用稀疏卷积;把点云投影成二维图像(例如鸟瞰图BEV或视角的range image),用2D卷积;以及使用混合手段,把不同表示结合起来等主流做法。不同的方法,会影响模型的计算复杂度、内存占用和对细节的保留,如点级方法保留细节好但计算贵,BEV快且对规划友好但高度信息丢失。

除了空间表示外,还会从点中提取一些工程特征,每个点的回波强度、局部密度、法向量估计、点到最近地面的高度等信息,都可以和坐标一起作为网络输入,帮助模型学到更丰富的几何线索。

wKgZPGkqWXqAQ-sZAAAR42n7O-I415.jpg

模型如何学会点云里面的内容?

模型要学会“这是什么”和“在哪里”,就得有人先教它。教的方式就是给点云打标签,比如把每个点标上类别(路、车、人),或者用一个三维的长方体把车或行人圈起来,甚至标出它们的速度和行走轨迹等。标注质量将直接决定模型上限,因此半自动标注工具、投影到图像做辅标、以及合成数据等常被用来进行辅助。

在训练模型的时候,不仅要教会模型认东西,告诉它“这是车/这是人/这是路”;还要教会它把物体用三维框圈起来,告诉它框应该放在哪儿、多大;更要教会它判断框的朝向和框跟真实物体重合得有多好。

此外,为了让模型鲁棒性更高,还要学习一些边缘场景,可调整不同类别场景出现的频率,让模型不仅看得懂常见的东西,也看得懂更加复杂的场景。在训练模型时,可以让模型对自己判断有多少有把握给出一个定义,这样系统在用它的结果时就知道该信多少。

在训练模型时,数据增强也很重要,所谓数据增强,就是把已有数据稍微改一改来增加多样性。可通过随机旋转、放缩、平移点云,故意删掉部分点、加点噪声,或者把一个场景里的真实物体复制到另一个场景里等做法来进行数据增强。这样可以让模型在应对遮挡、点稀疏或远处目标的情况时表现得更加出色。

最近流行的还有自监督或对比学习,即先让模型在大量没标签的点云上学会“看懂形状和结构”的能力,然后只用很少的人工标签微调,就能达到不错的效果,这样做能大幅减少人工标注的工作量。

wKgZPGkqWXyABz3PAAASG3BOmsQ347.jpg

模型训练后如何部署?

训练出模型只是第一步,但想把模型安全地用在车上还有很多工作要做。首先要有严格的评估指标,用来衡量模型在检测、分割和跟踪上的表现。检测任务常用平均精度(mAP)和3D框的重合度来评价,分割任务常用mIoU。这些指标可以帮助我们比较不同模型和不同训练配置的优劣,但仅有离线指标还不够,还要在更接近真实的场景里做场景覆盖测试和压力测试,保证模型在稀有或极端情形下的表现可接受。

部署阶段需要把训练好的模型做压缩和优化,以满足车端的算力和延迟约束,可通过模型剪枝、权重量化、使用稀疏运算库等方式来达到这一要求。当然,一定要保证在压缩和优化的同时保证推理时的精度降损可控。部署之后还要做A/B测试和在线回归监测,持续观察模型在真实道路上的表现,如果出现退化或异常,需要能快速回滚到上一个稳定版本。

练时的数据环境(传感器类型、安装高度、城市布局)和模型实际运行的环境可能有差别。为了减少这种差别带来的性能下降,要做域自适应、数据扩充或周期性的在线微调。对于长期运行的车队,还要建立数据闭环,把线上采集到的异常场景回传、做标注并周期性重训练,从而持续提升模型对现实世界的适应能力。

wKgZPGkqWX2AIx16AAASAJELks8801.jpg

最后的话

想把点云变成模型能学的东西,应先把点云清洗和规整成模型可以处理的形式,再把人类的语义用标签和训练目标教给模型,通过合理的表示、增强和训练策略让模型学会识别类别、定位物体并估计不确定性。把这些能力工程化后,配合持续的数据闭环和安全机制,自动驾驶车辆才能使用点云数据在复杂的真实世界里安全、可靠地运行。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    791

    文章

    14667

    浏览量

    176366
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自动驾驶数据标注是所有信息都要标注吗?

    [首发于智驾最前沿微信公众号]数据标注对于自动驾驶来说,就像是老师教小朋友知识,数据标注可以让车辆学习辨别道路交通信息的能力。摄像头、雷达、激光雷达(LiDAR)拍下来的只是一堆原始信号,这些信号
    的头像 发表于 12-04 09:05 276次阅读
    <b class='flag-5'>自动驾驶</b>数据标注是所有<b class='flag-5'>信息</b>都要标注吗?

    VLA能解决自动驾驶中的哪些问题?

    [首发于智驾最前沿微信公众号]很多从事自动驾驶的小伙伴应该对VLA这个概念已经非常熟悉了。VLA即“Visual-Language-Action”(视觉—语言—动作)模型,它的核心是将视觉信息
    的头像 发表于 11-25 08:53 166次阅读
    VLA能解决<b class='flag-5'>自动驾驶</b>中的哪些问题?

    模型中常提的快慢思考会对自动驾驶产生什么影响?

    2024年7月,理想汽车发布的基于端到端模型、VLM视觉语言模型和世界模型的全新自动驾驶技术架构标志着其全栈自研的智能驾驶研发进入了新阶段。
    的头像 发表于 11-22 10:59 2266次阅读
    大<b class='flag-5'>模型</b>中常提的快慢思考会对<b class='flag-5'>自动驾驶</b>产生什么影响?

    如何确保自动驾驶汽车感知的准确性?

    [首发于智驾最前沿微信公众号]自动驾驶汽车想要自动驾驶,首先要做的就是能对周边环境实现精准感知,也就是能“”清道路,那自动驾驶汽车如何在复杂、快速变化的道路环境中做到感知的精确又可靠
    的头像 发表于 08-23 15:06 1360次阅读
    如何确保<b class='flag-5'>自动驾驶</b>汽车感知的准确性?

    自动驾驶数据标注主要是标注什么?

    [首发于智驾最前沿微信公众号]在自动驾驶系统的研发过程中,数据标注是实现高性能感知模型的基础环节,其核心目标是将车辆从环境中采集到的原始感知数据(主要包括图像、、视频序列等)转化为
    的头像 发表于 07-30 11:54 893次阅读
    <b class='flag-5'>自动驾驶</b>数据标注主要是标注什么?

    什么是自动驾驶数据标注?如何好做数据标注?

    、精准且高效的数据标注流程显得尤为关键。那什么是数据标注?如何做数据标注? 自动驾驶数据标注是指在自动驾驶系统所采集的感知数据(如摄像头图像、激光雷达、毫米波雷达等)中,为各种交通
    的头像 发表于 07-09 09:19 917次阅读
    什么是<b class='flag-5'>自动驾驶</b>数据标注?如何好做数据标注?

    为什么自动驾驶端到端大模型有黑盒特性?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术落地,端到端(End-to-End)大模型也成为行业研究与应用的热门方向。相较于传统自动驾驶系统中的模块化结构,端到端模型尝试直接从感知输
    的头像 发表于 07-04 16:50 581次阅读
    为什么<b class='flag-5'>自动驾驶</b>端到端大<b class='flag-5'>模型</b>有黑盒特性?

    自动驾驶中常提的世界模型是个啥?

    [首发于智驾最前沿微信公众号]随着自动驾驶技术的不断成熟,车辆需要在复杂多变的道路环境中安全地行驶,这就要求系统不仅能“看见”周围的世界,还要能“理解”和“推测”未来的变化。世界模型可以被看作一种
    的头像 发表于 06-24 08:53 725次阅读
    <b class='flag-5'>自动驾驶</b>中常提的世界<b class='flag-5'>模型</b>是个啥?

    光庭信息自动驾驶试验车赴日

    今年以来,中国自动驾驶企业正借助创新技术和产品加速出海,竞逐全球市场新格局。近日,一辆自动驾驶试验车从武汉阳逻港启程前往日本,正式开启光庭信息出海新征程。
    的头像 发表于 06-18 16:33 747次阅读

    自动驾驶中常提的“”是个啥?

    [首发于智驾最前沿微信公众号]在自动驾驶系统中,技术作为三维空间感知的核心手段,为车辆提供了精确的距离和形状信息,从而实现目标检测、环境建模、定位与地图构建等关键功能。那所谓的“
    的头像 发表于 05-21 09:04 807次阅读
    <b class='flag-5'>自动驾驶</b>中常提的“<b class='flag-5'>点</b><b class='flag-5'>云</b>”是个啥?

    激光雷达在自动驾驶领域中的优势

    光束方向上的距离信息,将空间环境转化为高密度数据,为自动驾驶算法提供不可或缺的环境感知信息。雷达感知数据作为
    的头像 发表于 05-15 11:15 987次阅读
    激光雷达在<b class='flag-5'>自动驾驶</b>领域中的优势

    新能源车软件单元测试深度解析:自动驾驶系统视角

    。 ‌自动驾驶软件的特殊性‌ ‌ 感知层: ‌激光雷达、摄像头等传感器数据处理算法的单元测试需覆盖极端场景。例如,激光雷达滤波算法在雨雪天气下的噪声抑制能力需通过边界测试验证。某厂商曾在测试中遗漏
    发表于 05-12 15:59

    模型如何推动自动驾驶技术革新?

    [首发于智驾最前沿微信公众号]近年来,人工智能技术正以前所未有的速度在各个领域渗透与应用,而大模型(大语言模型和多模态大模型)的迅猛发展为自动驾驶技术带来了新的机遇。传统的
    的头像 发表于 04-20 13:16 680次阅读
    大<b class='flag-5'>模型</b>如何推动<b class='flag-5'>自动驾驶</b>技术革新?

    自动驾驶模型中常提的Token是个啥?对自动驾驶有何影响?

    、多模态传感器数据的实时处理与决策。在这一过程中,大模型以其强大的特征提取、信息融合和预测能力为自动驾驶系统提供了有力支持。而在大模型的中,有一个“Token”的概念,有些人看到后或许
    的头像 发表于 03-28 09:16 964次阅读

    光庭信息自动驾驶系统亮相CES 2025

    自动驾驶的魅力在于将人类从繁琐的驾驶任务中解放出来,随着 AI 大模型和大数据技术的突破,自动驾驶技术的发展及实际应用也成为 CES 2025 的重头戏之一。展会上,光庭
    的头像 发表于 01-13 14:23 1233次阅读