0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

自动驾驶中常提的卷积神经网络是个啥?

智驾最前沿 来源:智驾最前沿 作者:智驾最前沿 2025-11-19 18:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

[首发于智驾最前沿微信公众号]在自动驾驶领域,经常会听到卷积神经网络技术。卷积神经网络,简称为CNN,是一种专门用来处理网格状数据(比如图像)的深度学习模型。CNN在图像处理中尤其常见,因为图像本身就可以看作是由像素排列成的二维网格。

卷积神经网络可以概括为“从局部入手,逐步抽象”的一项技术,即通过一系列可学习的运算,让网络能够自动从原始像素中识别出边缘、角点、纹理等基础特征,再逐步组合成更高级的语义信息,最终完成类似“识别出一只猫”这样的感知任务。

wKgZPGkYGMSAP6LKAAB01FgQ2NM253.jpg

图片源自:网络

和传统的全连接网络相比,CNN不仅参数更少,还能更好地适应图像中物体的平移变化,因此在计算效率和泛化能力上的表现会更加出色。

01核心组件和工作原理

想理解清楚CNN,要抓住“卷积核滑动”与“层层抽象”两个要点。卷积操作就像拿着一个小窗口在图像上逐格滑动,每次将窗口内的像素值与一组可训练的权重(也就是卷积核或滤波器)做点乘并求和,得到输出特征图上的一个数值。

这样训练的目的,正是调整这些卷积核的参数,让它们能提取出有用的特征。由于卷积核远小于整张图像,并且在整个图像上共享参数,这种“局部连接”和“参数共享”的设计,大大减少了网络的参数量。

卷积层后面通常会接一个如ReLU这样的非线性激活函数,它的作用是把负数值置零,从而引入非线性,让网络能够表达更复杂的关系。之后就会进行如最大池化这样的下采样操作,它在局部区域中选取最大值输出,这样不仅能降低数据维度、压缩信息,还能增强网络对平移的鲁棒性。

通过多个卷积层和池化层的堆叠,网络会逐层把低级特征信息(如边缘、纹理)组合成中级特征信息(如角点、局部形状),再进一步抽象为高级特征信息(如物体部件或语义概念)。在网络的末端,这些特征会被“展平”,再输入到全连接层或经过全局池化处理,最终通过分类器(如softmax)输出每个类别的概率。

wKgZPGkYGMWAQlEzAAFALwHHgY8174.jpg

图片源自:网络

卷积并不局限于二维图像。它可以扩展到一维数据(如语音、时间序列)和三维数据(如医学影像中的体积数据)。对于多通道输入(例如彩色图像的RGB三个通道),卷积核也会为每个通道配备一组权重,分别计算后再求和,生成单通道的特征图。而为了提取不同类型的特征,可同时使用多个卷积核,以便得到多个特征图(也称为输出通道)。

02训练、优化与常见技巧

训练CNN的基本流程与其他神经网络类似,即先定义损失函数(分类任务常用交叉熵损失),再通过反向传播计算梯度,最后使用优化器(如随机梯度下降SGD或Adam)更新网络参数。在卷积层中,反向传播本质上是对卷积运算求导,分别计算卷积核和输入数据的梯度并更新。

在卷积神经网络的训练过程中,学习率、批次大小和权重初始化等超参数的选择至关重要,它们共同决定了训练过程的稳定性和模型的最终性能。为了抑制过拟合、提升模型的泛化能力,可综合运用以下几种实用技巧。

数据增强是非常有效的一种方法。通过对训练图像进行随机翻转、裁剪、旋转或调整亮度对比度等操作,可以显著增加数据的多样性,这能迫使模型学习更加鲁棒,而不是仅仅记住训练集中的特定样本。

权重衰减(L2正则化)和Dropout(随机屏蔽部分神经元)等正则化手段也是一种有效方式,不过在卷积层中使用Dropout通常会低于全连接层。批量归一化如今已成为训练深层网络的标准配置,它通过对每批数据进行规范化处理,有效稳定了训练过程,加快了收敛速度,并允许我们使用更大的学习率。此外,在训练过程中动态调整学习率的策略,以及根据验证集表现适时停止训练的“早停法”,也都是防止模型过拟合的常用手段。

除了上述训练技巧,模型架构层面的改进也会对训练结果产生深远影响。残差连接的引入是一项关键突破,它通过允许信息跨层直接传递,有效缓解了深层网络中的梯度消失问题,使得训练上百层的超深网络成为可能。

wKgZPGkYGMaAYBZwAACbEiYvjeA479.jpg

图片源自:网络

深度可分离卷积则从计算效率入手,将标准的卷积操作拆解为逐通道卷积和逐点卷积两个步骤,从而大幅降低了计算量和参数数量,这一设计对于在手机等移动设备上部署模型尤为关键。在实际的工程部署中,还会进一步运用模型压缩、量化等技术,对训练好的网络进行优化,以确保其在资源受限的环境中也能高效运行。

03重要架构演进与设计选择

回顾卷积神经网络的发展历程,可以清晰地了解其设计思想的演变。早期的LeNet成功地将卷积思想应用于手写数字识别,证明了其有效性。随后,AlexNet在大规模图像分类竞赛中取得突破性成果,极大地推动了深度学习的热潮。VGG网络则通过反复堆叠小巧的3x3卷积核,构建起结构规整而深厚的网络,证明了深度的重要性。Inception系列则另辟蹊径,采用并行结构来同时捕捉不同尺度的特征。ResNet引入的残差连接,从根本上解决了深度网络的训练难题。近年来,为了在准确率和效率间取得平衡,出现了像MobileNet(使用深度可分离卷积)和EfficientNet(复合缩放模型深度、宽度和分辨率)这样的轻量级架构。

卷积神经网络在计算机视觉领域的应用已经非常广泛,从基础的图像分类,到目标检测、语义分割、人脸识别、姿态估计,乃至图像生成和检索,都能看到它的身影。

当然,CNN也有局限性,它在捕捉图像中的长距离依赖及全局关系方面,天生不如基于自注意力机制的Transformer模型灵活。虽然可以通过加深网络或使用大卷积核来扩大感受野,但这会带来计算成本的急剧上升。此外,其引以为傲的平移不变性,在某些需要精确定位(如实例分割)的任务中,也需要额外的机制来辅助。

04最后的话

卷积神经网络通过“局部感知、参数共享、层次化抽象”这一核心思想,为处理图像等网格数据提供了一个强大而高效的框架。卷积神经网络的优势,源于它与生俱来的合理结构。它采用“从小范围入手”的策略,通过局部连接和权重共享,一层层地从图像中提取特征,从简单的边缘、纹理,逐步组合成复杂的物体部件和整体概念。这种设计不仅极大地减少了需要计算的参数数量,更让它天生就擅长处理图像这类数据。这使CNN在拥有出色识别能力的同时,也保证了很高的计算效率,成为计算机视觉领域坚实的技术基石。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动驾驶
    +关注

    关注

    791

    文章

    14667

    浏览量

    176379
  • 卷积神经网络

    关注

    4

    文章

    371

    浏览量

    12713
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Transformer如何让自动驾驶变得更聪明?

    ]自动驾驶中常的Transformer本质上是一种神经网络结构,最早在自然语言处理里火起来。与卷积神经
    的头像 发表于 11-19 18:17 1889次阅读

    NMSIS神经网络库使用介绍

    (q7_t) 和 16 位整数 (q15_t)。 卷积神经网络示例: 本示例中使用的 CNN 基于来自 Caffe 的 CIFAR-10 示例。神经网络由 3
    发表于 10-29 06:08

    自动驾驶中常的“专家数据”是

    [首发于智驾最前沿微信公众号]在谈及自动驾驶时,经常会听到一概念,那便是“专家数据”。专家数据,说白了就是“按理应该这么做”的那类示范数据。它不是随机抓来的日志,也不是随便标注的标签,而是来源可靠
    的头像 发表于 10-09 09:33 275次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“专家数据”是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶中常的ODD是

    [首发于智驾最前沿微信公众号]在自动驾驶中,经常会听到一概念,那就是ODD。所谓ODD,全称为Operational Design Domain,中文常译为“运行设计域”或者“作业域”。直观一点
    的头像 发表于 09-22 09:04 535次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的ODD是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶中常的硬件在环是

    [首发于智驾最前沿微信公众号]在谈及自动驾驶技术时,经常会提及一技术,那就是硬件在环,所谓的硬件在环是?对于自动驾驶来说有
    的头像 发表于 08-14 08:54 861次阅读

    自动驾驶中常的RTK是

    [首发于智驾最前沿微信公众号]在谈及自动驾驶关键技术时,经常会听到一技术,那就是RTK,很多人看到RTK后一定会想,这到底是技术?为啥这个技术很少在发布会上看到,但对于
    的头像 发表于 08-10 10:35 731次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的RTK是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶中常的惯性导航系统是?可以不用吗?

    每次提到自动驾驶硬件时,大家可能第一反应想到的是激光雷达、车载摄像头、毫米波雷达等,但想要让自动驾驶车辆实际落地,有一硬件也非常重要,那就是惯性导航系统。在很多讨论自动驾驶技术的内容
    的头像 发表于 07-24 18:12 1514次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的惯性导航系统是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?可以不用吗?

    自动驾驶中常的世界模型是

    对外部环境进行抽象和建模的技术,让自动驾驶系统在一简洁的内部“缩影”里,对真实世界进行描述与预测,从而为感知、决策和规划等关键环节提供有力支持。 什么是世界模型? 我们不妨先把“世界模型”想象成一种“数字化的地
    的头像 发表于 06-24 08:53 725次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的世界模型是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶中常的HMI是

    [首发于智驾最前沿微信公众号]在自动驾驶汽车领域,HMI(Human–Machine Interface,人机交互界面)正成为很多车企相互竞争的一大领域。之所以如此,是因为在车辆从“人控”过渡到“机
    的头像 发表于 06-22 13:21 2093次阅读

    自动驾驶中常的“点云”是

    ?对自动驾驶有何影响? 点云是? 点云(Point Cloud)是一种在三维空间中由大量离散点组成的数据集合,每个点包含自身的笛卡尔坐标(X、Y、Z),并可附带颜色、强度、时间戳
    的头像 发表于 05-21 09:04 807次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“点云”是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶中常的“NOA”是

    近年来,自动驾驶技术发展迅速,业界不断探索如何在复杂交通场景中实现真正的无人驾驶。城市NOA作为自动驾驶的一项前沿技术,正成为各大厂商相互争夺的关键技术。 何为NOA? NOA,全称
    的头像 发表于 04-09 09:03 2143次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的“NOA”是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?

    自动驾驶感知系统中卷积神经网络原理的疑点分析

    和语音识别等领域取得了显著成就,并广泛用于车辆自动驾驶的图像目标识别中。 1.局部连接:CNN通过局部连接的方式减少了网络自由参数的个数,从而降低了计算复杂度,并使网络更易于训练。与全连接网络
    的头像 发表于 04-07 09:15 639次阅读
    <b class='flag-5'>自动驾驶</b>感知系统中<b class='flag-5'>卷积</b><b class='flag-5'>神经网络</b>原理的疑点分析

    自动驾驶大模型中常的Token是?对自动驾驶有何影响?

    、多模态传感器数据的实时处理与决策。在这一过程中,大模型以其强大的特征提取、信息融合和预测能力为自动驾驶系统提供了有力支持。而在大模型的中,有一“Token”的概念,有些人看到后或许会问: Token是
    的头像 发表于 03-28 09:16 964次阅读

    BP神经网络卷积神经网络的比较

    BP神经网络卷积神经网络在多个方面存在显著差异,以下是对两者的比较: 一、结构特点 BP神经网络 : BP神经网络是一种多层的前馈
    的头像 发表于 02-12 15:53 1301次阅读

    自动驾驶中常的鲁棒性是

    随着自动驾驶技术的快速发展,鲁棒性(Robustness)成为评价自动驾驶系统的重要指标之一。很多小伙伴也会在自动驾驶相关的介绍中,对某些功能用鲁棒性进行描述。一鲁棒的系统能够在复杂
    的头像 发表于 01-02 16:32 8331次阅读
    <b class='flag-5'>自动驾驶</b><b class='flag-5'>中常</b><b class='flag-5'>提</b>的鲁棒性是<b class='flag-5'>个</b><b class='flag-5'>啥</b>?