0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RGPNET:复杂环境下实时通用语义分割网络

电子设计 来源:电子设计 作者:电子设计 2020-12-10 19:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

本文介绍的论文提出了一种新的实时通用语义分割体系结构RGPNet,在复杂环境下取得了显著的性能提升。
作者: Tom Hardy
首发:3D视觉工坊微信公众号

论文:RGPNet: A Real-Time General Purpose Semantic Segmentation (文末可下载)
论文链接:https://arxiv.org/abs/1912.01394

一、主要思想

本文提出了一种新的实时通用语义分割体系结构RGPNet,在复杂环境下取得了显著的性能提升。RGPNet由一个轻量级的非对称编码器-解码器和一个适配器组成。适配器有助于从编码器和解码器之间的多层分布式表示中保留和细化抽象概念。它也有助于从较深层到较浅层的梯度流动。大量实验表明,与目前最先进的语义分割网络相比,RGPNet具有更好的性能。

此外还证明了在保持性能的同时,使用改进的标签松弛技术和逐步调整大小可以减少60%的训练时间。论文还对应用在资源受限的嵌入式设备上的RGPNet进行了优化,使推理速度提高了400%,性能损失可以忽略不计。RGPNet在多个数据集之间获得了更好的速度和精度权衡。

二、创新点

1、提出的RGPNet作为一种通用的实时语义分割体系结构,它可以在单分支网络中获得高分辨率的深层特征,从而提高准确性和降低延迟,在复杂的环境中具有竞争力。

2、引入一个适配器模块来捕获多个抽象级别,以帮助细分的边界细化,适配器还通过添加较短的路径来辅助渐变梯度流。

3、对于green AI,在训练期间采用渐进式调整大小技术,从而使训练时间和环境影响减少60%,并且采用一种改进的标签松弛来消除低分辨率标签映射中的混叠效应。

4、使用TensorRT(一个高性能深度学习推理平台)优化RGPNet,以便部署在边缘计算设备上,从而使推理速度提高400%。

5、RGPNet在Cityscpes、CamVid和Mapillary数据集上分别实现了Resnet-101作为backbone 下80.9%、69.2%和50.2% mIoU以及Resnet-18作为backbone下74.1%、66.9%和41.7% mIoU。对于1024×2048分辨率的图像,RGPNet在CityScapes数据集上单NVIDIA GTX2080Ti GPU下达到37.4 FPS。

三、网络结构

RGPNet的整体结构如下所示,每个箭头都有对应的操作模式:

  • 中间一列操作为编码器
  • 最右边操作为解码器
  • “+”操作为适配器(Adaptor)

其中“+”详细操作如下所示:
1、T(:)是一个转换函数,它用来减少编码器模块输出通道数量并将其传输到adaptor。
2、D(:)和U(:)是下采样和上采样功能。

Adaptor有许多优点:

1、Adaptor聚合来自不同上下文和空间级别的特征。
2、通过引入较短的路径,有助于梯度从较深的层流向较浅的层。
3、Adaptor允许使用轻量解码器的不对称设计,这将减少卷积层,进一步增强梯度流。因此,Adaptor使网络适合于实时应用,因为它在保留空间信息的同时提供了丰富的语义信息。

针对带标签松弛的渐进式调整

论文采取了最大化像素周围区域相似度分布,而不是单个像素级别的标签最大可能化,针对边界类别,提出了边界损失函数。

四、实验结果

多种网络在Mapillary Vistas数据集上的测试结果:

几种网络在Mapillary Vistas数据集上的性能对比:

在CamVid数据集上的性能对比:

RGPNet使用TensorRT在GTX2080Ti和Xavier上速度对比:

综合速度和准确率以及实际部署下的性能,RGPNet都非常具有竞争力~!

推荐阅读

重点介绍:1、3D视觉算法;2、vslam算法;3、图像处理;4、深度学习;5、自动驾驶;6、技术干货博主及合伙人分别来国内自知名大厂、海康研究院,深研3D视觉、深度学习、图像处理、自动驾驶、目标检测、VSLAM算法等领域。
欢迎关注微信公众号

审核编辑:符乾江
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1820

    文章

    50330

    浏览量

    266967
  • 计算机视觉
    +关注

    关注

    9

    文章

    1715

    浏览量

    47723
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    复杂环境 RS485 与电源系统可靠性防护设计标准

    从分级防护到器件选型,一文读懂复杂环境的可靠性设计一、总则(一).目的规范RS485通信接口及电源系统防护设计,提升复杂环境
    的头像 发表于 03-26 19:33 148次阅读
    <b class='flag-5'>复杂</b><b class='flag-5'>环境</b><b class='flag-5'>下</b> RS485 与电源系统可靠性防护设计标准

    室外光缆线:室外环境的通信守护者

    在室外环境,通信网络的稳定性和可靠性面临着诸多挑战。而室外光缆线,作为室外通信的守护者,正以其独特的性能和优势,为通信网络提供着坚实的保障。 室外
    的头像 发表于 01-13 10:48 269次阅读

    数字滤波算法的在线电弱点测试仪:复杂电路环境的干扰信号剔除与检测精度提升

    。数字滤波算法的引入,为解决这一问题提供了核心技术支撑,成为提升测试仪在复杂场景适应性与检测可靠性的关键。​ 复杂电路环境中的干扰信号具有多样性与随机性,它们与反映电弱点状态的有效信
    的头像 发表于 01-09 09:29 434次阅读
    数字滤波算法的在线电弱点测试仪:<b class='flag-5'>复杂</b>电路<b class='flag-5'>环境</b><b class='flag-5'>下</b>的干扰信号剔除与检测精度提升

    Wi-Fi:无线连接的全球通用语

    一、什么是Wi-Fi?Wi-Fi是Wi-Fi联盟制造商的商标认证,是基于IEEE 802.11标准的无线局域网技术。它允许电子设备在特定范围内无线接入网络,实现高速数据交换与互联网访问,已成为
    发表于 01-07 09:49

    【NPU实战】在迅为RK3588上玩转YOLOv8:目标检测与语义分割一站式部署指南

    【NPU实战】在迅为RK3588上玩转YOLOv8:目标检测与语义分割一站式部署指南
    的头像 发表于 12-12 14:30 6407次阅读
    【NPU实战】在迅为RK3588上玩转YOLOv8:目标检测与<b class='flag-5'>语义</b><b class='flag-5'>分割</b>一站式部署指南

    手机板 layout 走线跨分割问题

    的layout,比如手机、笔记本。信号的跨分割处理已经不在是不能跨分割了。 在这类产品中成本是很重要的,所以层数都是能少就少。 这种情况,如何分辨那些信号是可以跨分割的,跨
    发表于 09-16 14:56

    复杂电磁环境构建与测试软件系统解析(精简版)

    复杂电磁环境构建与测试软件系统解析(精简版)
    的头像 发表于 09-15 21:05 876次阅读
    <b class='flag-5'>复杂</b>电磁<b class='flag-5'>环境</b>构建与测试软件系统解析(精简版)

    时间同步设备在复杂网络环境中的调试要点

    时间同步设备是保障网络系统协同运行的基础设施,尤其在金融、电力、通信等领域对精度要求较高的场景中,其稳定性直接影响业务连续性。在实际部署中,网络环境复杂性常给同步精度带来挑战。本文将
    的头像 发表于 08-13 15:48 635次阅读
    时间同步设备在<b class='flag-5'>复杂</b><b class='flag-5'>网络</b><b class='flag-5'>环境</b>中的调试要点

    北京迅为itop-3588开发板NPU例程测试deeplabv3 语义分割

    北京迅为itop-3588开发板NPU例程测试deeplabv3 语义分割
    的头像 发表于 07-22 15:51 1140次阅读
    北京迅为itop-3588开发板NPU例程测试deeplabv3 <b class='flag-5'>语义</b><b class='flag-5'>分割</b>

    工业质检再升级:复杂网络检测模型破解多场景检测难题

    、模糊目标、多尺寸多类别等难题迎刃而解。复杂网络三大核心优势1、标注高效,使用便捷仅需矩形框即可完成标注,显著降低了数据准备的时间与人力成本。对比像素级分割标注,
    的头像 发表于 07-16 15:52 867次阅读
    工业质检再升级:<b class='flag-5'>复杂</b><b class='flag-5'>网络</b>检测模型破解多场景检测难题

    迅为RK3576开发板摄像头实时推理测试-ppseg 图像分割

    迅为RK3576开发板摄像头实时推理测试-ppseg 图像分割
    的头像 发表于 07-11 14:31 1038次阅读
    迅为RK3576开发板摄像头<b class='flag-5'>实时</b>推理测试-ppseg 图像<b class='flag-5'>分割</b>

    【正点原子STM32MP257开发板试用】基于 DeepLab 模型的图像分割

    是谷歌团队提出的一种用于语义分割的深度学习模型,属于 DeepLab 系列模型的第三代版本。它在图像语义分割任务中表现优异,能够高效地捕获图像的多尺度上下文信息,并生成高分辨率的
    发表于 06-21 21:11

    SMA接口在汽车电子复杂环境的适应性剖析

    德索SMA接口在汽车电子复杂环境既具备一定的适应性优势,也面临诸多挑战。通过持续的技术创新与工艺改进,德索有望进一步提升SMA接口在汽车电子领域的适应性与可靠性,为汽车电子技术的发展提供有力支持。
    的头像 发表于 06-04 09:04 997次阅读
    SMA接口在汽车电子<b class='flag-5'>复杂</b><b class='flag-5'>环境</b><b class='flag-5'>下</b>的适应性剖析

    Matter 智能家居的通用语

    Matter由连接标准联盟(CSA)创建,旨在解决智能家居的互操作性问题。Matter 基于简单性、互操作性、可靠性和安全性四大核心原则 。 是采用基于 IP 应用层的开源协议,本质上是一种“通用语
    发表于 05-19 15:35

    复杂电磁环境构建与测试软件系统

    复杂电磁环境构建与测试软件系统
    的头像 发表于 04-29 20:47 771次阅读
    <b class='flag-5'>复杂</b>电磁<b class='flag-5'>环境</b>构建与测试软件系统