0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RGPNET:复杂环境下实时通用语义分割网络

电子设计 来源:电子设计 作者:电子设计 2020-12-10 19:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文介绍的论文提出了一种新的实时通用语义分割体系结构RGPNet,在复杂环境下取得了显著的性能提升。
作者: Tom Hardy
首发:3D视觉工坊微信公众号

论文:RGPNet: A Real-Time General Purpose Semantic Segmentation (文末可下载)
论文链接:https://arxiv.org/abs/1912.01394

一、主要思想

本文提出了一种新的实时通用语义分割体系结构RGPNet,在复杂环境下取得了显著的性能提升。RGPNet由一个轻量级的非对称编码器-解码器和一个适配器组成。适配器有助于从编码器和解码器之间的多层分布式表示中保留和细化抽象概念。它也有助于从较深层到较浅层的梯度流动。大量实验表明,与目前最先进的语义分割网络相比,RGPNet具有更好的性能。

此外还证明了在保持性能的同时,使用改进的标签松弛技术和逐步调整大小可以减少60%的训练时间。论文还对应用在资源受限的嵌入式设备上的RGPNet进行了优化,使推理速度提高了400%,性能损失可以忽略不计。RGPNet在多个数据集之间获得了更好的速度和精度权衡。

二、创新点

1、提出的RGPNet作为一种通用的实时语义分割体系结构,它可以在单分支网络中获得高分辨率的深层特征,从而提高准确性和降低延迟,在复杂的环境中具有竞争力。

2、引入一个适配器模块来捕获多个抽象级别,以帮助细分的边界细化,适配器还通过添加较短的路径来辅助渐变梯度流。

3、对于green AI,在训练期间采用渐进式调整大小技术,从而使训练时间和环境影响减少60%,并且采用一种改进的标签松弛来消除低分辨率标签映射中的混叠效应。

4、使用TensorRT(一个高性能深度学习推理平台)优化RGPNet,以便部署在边缘计算设备上,从而使推理速度提高400%。

5、RGPNet在Cityscpes、CamVid和Mapillary数据集上分别实现了Resnet-101作为backbone 下80.9%、69.2%和50.2% mIoU以及Resnet-18作为backbone下74.1%、66.9%和41.7% mIoU。对于1024×2048分辨率的图像,RGPNet在CityScapes数据集上单NVIDIA GTX2080Ti GPU下达到37.4 FPS。

三、网络结构

RGPNet的整体结构如下所示,每个箭头都有对应的操作模式:

  • 中间一列操作为编码器
  • 最右边操作为解码器
  • “+”操作为适配器(Adaptor)

其中“+”详细操作如下所示:
1、T(:)是一个转换函数,它用来减少编码器模块输出通道数量并将其传输到adaptor。
2、D(:)和U(:)是下采样和上采样功能。

Adaptor有许多优点:

1、Adaptor聚合来自不同上下文和空间级别的特征。
2、通过引入较短的路径,有助于梯度从较深的层流向较浅的层。
3、Adaptor允许使用轻量解码器的不对称设计,这将减少卷积层,进一步增强梯度流。因此,Adaptor使网络适合于实时应用,因为它在保留空间信息的同时提供了丰富的语义信息。

针对带标签松弛的渐进式调整

论文采取了最大化像素周围区域相似度分布,而不是单个像素级别的标签最大可能化,针对边界类别,提出了边界损失函数。

四、实验结果

多种网络在Mapillary Vistas数据集上的测试结果:

几种网络在Mapillary Vistas数据集上的性能对比:

在CamVid数据集上的性能对比:

RGPNet使用TensorRT在GTX2080Ti和Xavier上速度对比:

综合速度和准确率以及实际部署下的性能,RGPNet都非常具有竞争力~!

推荐阅读

重点介绍:1、3D视觉算法;2、vslam算法;3、图像处理;4、深度学习;5、自动驾驶;6、技术干货博主及合伙人分别来国内自知名大厂、海康研究院,深研3D视觉、深度学习、图像处理、自动驾驶、目标检测、VSLAM算法等领域。
欢迎关注微信公众号

审核编辑:符乾江
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261403
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47445
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    手机板 layout 走线跨分割问题

    的layout,比如手机、笔记本。信号的跨分割处理已经不在是不能跨分割了。 在这类产品中成本是很重要的,所以层数都是能少就少。 这种情况,如何分辨那些信号是可以跨分割的,跨
    发表于 09-16 14:56

    复杂电磁环境构建与测试软件系统解析(精简版)

    复杂电磁环境构建与测试软件系统解析(精简版)
    的头像 发表于 09-15 21:05 442次阅读
    <b class='flag-5'>复杂</b>电磁<b class='flag-5'>环境</b>构建与测试软件系统解析(精简版)

    时间同步设备在复杂网络环境中的调试要点

    时间同步设备是保障网络系统协同运行的基础设施,尤其在金融、电力、通信等领域对精度要求较高的场景中,其稳定性直接影响业务连续性。在实际部署中,网络环境复杂性常给同步精度带来挑战。本文将
    的头像 发表于 08-13 15:48 292次阅读
    时间同步设备在<b class='flag-5'>复杂</b><b class='flag-5'>网络</b><b class='flag-5'>环境</b>中的调试要点

    北京迅为itop-3588开发板NPU例程测试deeplabv3 语义分割

    北京迅为itop-3588开发板NPU例程测试deeplabv3 语义分割
    的头像 发表于 07-22 15:51 812次阅读
    北京迅为itop-3588开发板NPU例程测试deeplabv3 <b class='flag-5'>语义</b><b class='flag-5'>分割</b>

    工业质检再升级:复杂网络检测模型破解多场景检测难题

    、模糊目标、多尺寸多类别等难题迎刃而解。复杂网络三大核心优势1、标注高效,使用便捷仅需矩形框即可完成标注,显著降低了数据准备的时间与人力成本。对比像素级分割标注,
    的头像 发表于 07-16 15:52 572次阅读
    工业质检再升级:<b class='flag-5'>复杂</b><b class='flag-5'>网络</b>检测模型破解多场景检测难题

    迅为RK3576开发板摄像头实时推理测试-ppseg 图像分割

    迅为RK3576开发板摄像头实时推理测试-ppseg 图像分割
    的头像 发表于 07-11 14:31 700次阅读
    迅为RK3576开发板摄像头<b class='flag-5'>实时</b>推理测试-ppseg 图像<b class='flag-5'>分割</b>

    【正点原子STM32MP257开发板试用】基于 DeepLab 模型的图像分割

    是谷歌团队提出的一种用于语义分割的深度学习模型,属于 DeepLab 系列模型的第三代版本。它在图像语义分割任务中表现优异,能够高效地捕获图像的多尺度上下文信息,并生成高分辨率的
    发表于 06-21 21:11

    SMA接口在汽车电子复杂环境的适应性剖析

    德索SMA接口在汽车电子复杂环境既具备一定的适应性优势,也面临诸多挑战。通过持续的技术创新与工艺改进,德索有望进一步提升SMA接口在汽车电子领域的适应性与可靠性,为汽车电子技术的发展提供有力支持。
    的头像 发表于 06-04 09:04 658次阅读
    SMA接口在汽车电子<b class='flag-5'>复杂</b><b class='flag-5'>环境</b><b class='flag-5'>下</b>的适应性剖析

    Matter 智能家居的通用语

    Matter由连接标准联盟(CSA)创建,旨在解决智能家居的互操作性问题。Matter 基于简单性、互操作性、可靠性和安全性四大核心原则 。 是采用基于 IP 应用层的开源协议,本质上是一种“通用语
    发表于 05-19 15:35

    复杂电磁环境构建与测试软件系统

    复杂电磁环境构建与测试软件系统
    的头像 发表于 04-29 20:47 471次阅读
    <b class='flag-5'>复杂</b>电磁<b class='flag-5'>环境</b>构建与测试软件系统

    标准网络时钟系统:数字时代的通用语

          跨洲手术机器人执刀切割的瞬间,远程会诊系统的影像数据正以0.1秒延迟同步呈现;沙漠光伏电站的逆变器阵列,在标准网络时钟系统指挥实现毫秒级功率调节;元宇宙演唱会中,10万虚拟观众的互动
    的头像 发表于 03-03 10:08 637次阅读

    SparseViT:以非语义为中心、参数高效的稀疏化视觉Transformer

    (IML)都遵循“语义分割主干网络”与“精心制作的手工制作非语义特征提取”相结合的设计,这种方法严重限制了模型在未知场景的伪影提取能力。 论文标题: Can We Get Rid
    的头像 发表于 01-15 09:30 808次阅读
    SparseViT:以非<b class='flag-5'>语义</b>为中心、参数高效的稀疏化视觉Transformer

    【「具身智能机器人系统」阅读体验】2.具身智能机器人的基础模块

    ,还有基于深度神经网络的Fast R-CNN和Faster R-CNN。 语义分割是将图像划分为具有不同语义类别的区域。 立体视觉通过模拟人类双眼的视觉系统,利用两天相机从略微不同的角
    发表于 01-04 19:22

    【AIBOX应用】通过 NVIDIA TensorRT 实现实时快速的语义分割

    设计,高效散热,保障在高温运行状态的运算性能和稳定性,满足各种工业级的应用需求。NVIDIATensorRTNVIDIA系列AIBOX支持深度学习框架Tensor
    的头像 发表于 12-18 16:33 1132次阅读
    【AIBOX应用】通过 NVIDIA TensorRT 实现<b class='flag-5'>实时</b>快速的<b class='flag-5'>语义</b><b class='flag-5'>分割</b>

    利用VLM和MLLMs实现SLAM语义增强

    语义同步定位与建图(SLAM)系统在对邻近的语义相似物体进行建图时面临困境,特别是在复杂的室内环境中。本文提出了一种面向对象SLAM的语义
    的头像 发表于 12-05 10:00 2168次阅读
    利用VLM和MLLMs实现SLAM<b class='flag-5'>语义</b>增强