0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于超大感受野注意力的超分辨率模型

CVer 来源:AIWalker 作者:AIWalker 2022-10-27 13:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

注意力机制是深度学习领域非常重要的一个研究方向,在图像超分领域也有不少典型的应用案例,比如基于通道注意力构建的RCAN,基于二阶注意力机制构建的SAN,基于像素注意力机制构建的PAN,基于Transformer自注意力机制构建的SwinIR,基于多尺度大核注意力的MAN等。

本文则以PAN为蓝本,对其进行逐步改进以期达到更少的参数量、更高的超分性能。该方案具体包含以下几个关键点:

  • 提升注意力分割的感受野,类似大核卷积注意力VAN;
  • 将稠密卷积核替换为深度分离卷积,进一步降低参数量;
  • 引入像素规范化(Pixel Normalization)技术,其实就是Layer Normalization,但出发点不同。

上述关键技术点为注意力机制的设计提供了一个清晰的演变路线,最终得到了本文的VapSR,即大感受像素注意力网络(VAst-receptive-field Pixel attention Network)。

实验结果表明:相比其他轻量超分网络,VapSR具有更少的参数量。比如,项目IMDB与RFDN,VapSR仅需21.68%、28.18%的参数即可取得与之相当的性能。

本文动机

通过引入像素注意力,PAN在大幅降低参数量的同时取得了非常优秀的性能。相比通道注意力与空域注意力,像素注意力是一种更广义的注意力形式,为进一步的探索提供了一个非常好的基线。

受启发于自注意力的发展,我们认为:基于卷积操作的注意力仍有进一步改进的空间。因此,作者通过以下三个像素注意力中的设计原则展示了改善超分注意力的过程:

  • 首先,在注意力分支引入大核卷积具有明显的优势;
  • 其次,深度分离卷积可以降低大核卷积导致的巨大计算复杂度问题;
  • 最后,引入像素规范化操作让训练更高效、更稳定。
367cec1e-55b7-11ed-a3b6-dac502259ad0.jpg

**Large Kernel **以上图i中的baseline为基础,作者首先对注意力分支进行感受野扩增:将提升到(将图示ii),性能提升0.15dB,但参数量从846K提升到了4123K。

Parameter Reduction 为降低参数量,我们尝试尽可能移除相对不重要的部分。作者提出了三个方案:(1) 将非注意力分支的卷积尺寸从下调到;(2) 将大核卷积注意力分支替换为深度深度分离卷积;(3) 将深度分离卷积中的深度卷积进行分解为深度卷积+带扩张因子的深度卷积(该机制可参考下图,将卷积拆分为+,其中后者的扩张因子为3)。此时,模型性能变为28.48dB,但参数量降到了240K,参数量基本被压缩到了极限。

368720e4-55b7-11ed-a3b6-dac502259ad0.jpg

Pixel Normalization(PN) 注意力机制的元素乘操作会导致训练不稳定问题:小学习率收敛不够好,大学习率又会出现梯度异常。前面的注意力改进导致所得方案存在性能下降问题。为解决该问题,作者经深入分析后提出了像素规范化技术(可参考下图不同规范化技术的可视化对比)。

36997258-55b7-11ed-a3b6-dac502259ad0.jpg

假设输入特征为,第i个像素的特征均值与方差可以描述如下:

那么,像素规范化可以表示为:

当引入PN后,模型的性能取得了显著的提升,达到了28.92dB,参数量仅为241K。

Switch Attention to Middle 在上述基础上,作者进一步将注意力的位置进行了调整,放到了两个卷积中间。此时,模型性能得到了0.03dB提升,达到了28.95dB,参数量仍为241K。

本文方案

前面的探索主要聚焦在微观层面,基于此,作者进一步在宏观层面进行了更多设计与提炼,进而构建了VapSR,取得了更佳的性能,同时具有更少的参数量。

36c0b368-55b7-11ed-a3b6-dac502259ad0.jpg

上图给出了所提VapSR架构示意图,延续了常规轻量方案的设计思路:

  • 浅层特征:;
  • 非线性映射: ;
  • 图像重建:

VAB模块在前面探索得到的模块上进行了微调:(1) 主要是将模块输入与输出通道数从64减少到了48,保持中间注意力部分的通道数仍为64;(2) 将注意力分支深度扩张卷积(有时也称之为空洞卷积)调整为深度扩张卷积,此时感受野为;(3) 调整了注意力分支三个卷积的顺序,将卷积移到最前面。对于VapSR-S,作者进一步将部分从卷积调整为组卷积(group=2),该操作可以进一步降低参数量。

classAttention(nn.Module):
def__init__(self,dim):
super().__init__()
self.pointwise=nn.Conv2d(dim,dim,1)
self.depthwise=nn.Conv2d(dim,dim,5,padding=2,groups=dim)
self.depthwise_dilated=nn.Conv2d(dim,dim,5,1,padding=6,groups=dim,dilation=3)

defforward(self,x):
u=x.clone()
attn=self.pointwise(x)
attn=self.depthwise(attn)
attn=self.depthwise_dilated(attn)
returnu*attn

classVAB(nn.Module):
def__init__(self,d_model,d_atten):
super().__init__()
self.proj_1=nn.Conv2d(d_model,d_atten,1)
self.activation=nn.GELU()
self.atten_branch=Attention(d_atten)
self.proj_2=nn.Conv2d(d_atten,d_model,1)
self.pixel_norm=nn.LayerNorm(d_model)
default_init_weights([self.pixel_norm],0.1)

defforward(self,x):
shorcut=x.clone()
x=self.proj_1(x)
x=self.activation(x)
x=self.atten_branch(x)
x=self.proj_2(x)
x=x+shorcut

x=x.permute(0,2,3,1)#(B,H,W,C)
x=self.pixel_norm(x)
x=x.permute(0,3,1,2).contiguous()#(B,C,H,W)

returnx

本文实验

在实验部分,作者构建了VapSR与VapSR-S两个版本的轻量型超分方案:

  • VapSR:包含21个VAB模块,主干通道数为48;
  • VapSR-S:包含11个VAB模块,主干通道数为32。

此外,需要注意的是:对于X4模型,重建模块并未采用常规的轻量方案(Conv+PS),而是采用了类EDSR的重方案(Conv+PS+Conv+PS)。

36e349a0-55b7-11ed-a3b6-dac502259ad0.jpg37744252-55b7-11ed-a3b6-dac502259ad0.jpg378c5568-55b7-11ed-a3b6-dac502259ad0.jpg

上表&图给出了不同方案的性能与可视化效果对比,从中可以看到:

  • 所提VapSR取得了SOTA性能,同时具有非常少的参数量。
  • 在X4任务上,相比RFDN与IMDN,VapSR仅需21.68%/28.18%的参数量,即可取得平均0.187dB指标提升;
  • VapSR-S取得了与BSRN-S相当的性能,后者是NTIRE2022-ESR模型复杂度赛道冠军。
  • 在线条重建方面,VapSR具有比其他方案更精确的重建效果。

审核编辑 :李倩


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 分辨率
    +关注

    关注

    2

    文章

    1120

    浏览量

    43247
  • 模型
    +关注

    关注

    1

    文章

    3649

    浏览量

    51715
  • 深度学习
    +关注

    关注

    73

    文章

    5590

    浏览量

    123911

原文标题:董超团队提出VapSR:基于超大感受野注意力的超分辨率模型

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    自然场景下注意力如何耳周脑电可靠监测

    HUIYING自然听觉注意力概述听觉注意力是大脑在复杂听觉场景中选择相关信息、抑制无关信息的重要认知功能。传统研究多在实验室内使用笨重设备与人工刺激进行,限制了其生态效度。本研究采用语音包络跟踪、被
    的头像 发表于 12-05 18:03 150次阅读
    自然场景下<b class='flag-5'>注意力</b>如何耳周脑电可靠监测

    ADC分辨率与精度的区别是什么

    简单点说,“精度”是用来描述物理量的准确程度的,而“分辨率”是 用来描述刻度划分的。从定义上看,这两个量应该是风马牛不相及的。(是不是有朋友感到愕然^_^)。 很多卖传感器的JS就是利用这一点
    发表于 12-05 06:24

    镜头分辨率如何匹配工业相机的分辨率

    能被分辨开来的两个物点之间的最小距离,就是镜头的物方分辨率。单位为µm。这只是单纯镜头本身的参数,只反映镜头的解析能力,而和工业相机多少像素无关!它直接反映了,一个理想物点经过镜头成像后,会模糊
    的头像 发表于 11-21 15:43 131次阅读
    镜头<b class='flag-5'>分辨率</b>如何匹配工业相机的<b class='flag-5'>分辨率</b>

    电能质量在线监测装置的暂态记录分辨率如何影响故障类型识别?

    暂态记录分辨率是故障类型识别的 “细节放大镜”—— 核心通过 采样、幅值分辨率、时间分辨率 决定故障波形 “特征细节的完整性”,高分辨率
    的头像 发表于 11-14 16:10 1723次阅读
    电能质量在线监测装置的暂态记录<b class='flag-5'>分辨率</b>如何影响故障类型识别?

    电致发光(EL)成像中日光与分辨率的变量,对光伏电池裂纹功率损失仿真模型基准测试

    电致发光(EL)成像技术作为光伏电池缺陷检测与性能评估的重要手段,目前主要基于实验室暗室环境下获取的高分辨率CMOS图像进行模型开发与验证。然而,随着该技术在现场检测中的推广应用,实际应用中面临着
    的头像 发表于 11-05 09:03 828次阅读
    电致发光(EL)成像中日光与<b class='flag-5'>分辨率</b>的变量,对光伏电池裂纹功率损失仿真<b class='flag-5'>模型</b>基准测试

    索尼FCB-CR8530分辨率变焦:无人机光电吊舱的“视觉增强引擎”

    在无人机技术快速发展的当下,光电吊舱作为无人机的核心观测设备,其性能直接决定了任务执行的效率与精度。SONY FCB-CR8530模组凭借分辨率变焦技术与紧凑型设计,成为无人机光电吊舱领域的关键
    的头像 发表于 10-21 14:05 194次阅读

    精度,重复精度和分辨率有什么关联

    精度,重复精度和分辨率,这三个令人疑惑的术语有很多种定义方法。
    的头像 发表于 07-26 17:13 613次阅读
    精度,重复精度和<b class='flag-5'>分辨率</b>有什么关联

    分辨率 vs 噪声 —— ADC的挑战

    设计者常用高分辨率 ADC 以降低最低可量测单位(LSB),提高检测精度。 比如一个 16 位 ADC 在 5V 范围内, LSB ≈ 76 μV ;理想情况下可以检测到微弱电信号。 问题是: 若
    的头像 发表于 06-23 07:38 1481次阅读
    <b class='flag-5'>分辨率</b> vs 噪声 —— ADC的挑战

    如何计算存储示波器的垂直分辨率

    的示波器,其垂直分辨率有了显著提高。影响因素及注意事项 噪声干扰:在实际测量中,示波器内部的噪声和外部干扰会影响垂直分辨率的实际效果。即使示波器的理论垂直分辨率很高,但如果噪声水平也
    发表于 05-30 14:03

    NVIDIA Earth-2平台实现分辨率天气预测

    相比传统的高分辨率天气预测,Earth-2 的 CorrDiff 模型在能效上提升了 10000 倍,实现了 AI 驱动的公里尺度精准天气预报,从而有助于提升灾害应对能力和拯救生命。
    的头像 发表于 03-06 10:06 732次阅读

    是否可以在16位或32位图像上推断单映像-超级分辨率1032的模型

    无法确定是 单图像超级分辨率 - 1032 模型可以推断为 16 位还是 32 位图像
    发表于 03-06 07:16

    如何通过过采样提高ADC分辨率

    通过过采样提高ADC分辨率
    发表于 02-10 08:05

    如何提高透镜成像的分辨率

    透镜成像分辨率是指透镜系统能够分辨的最小细节的能力。提高透镜成像分辨率对于许多应用领域,如显微镜、望远镜、相机等,都是至关重要的。以下是一些提高透镜成像分辨率的方法: 1. 减少像差
    的头像 发表于 12-25 16:54 1726次阅读

    如何选择扫描电镜的分辨率

    选择扫描电镜的分辨率需要综合考虑多个因素。首先是研究目的。如果只是需要对样品的大致形貌进行观察,例如查看较大颗粒的分布或者材料表面的宏观缺陷,较低分辨率(如3-10nm)可能就足够了。但如果要观察
    的头像 发表于 12-25 14:29 1198次阅读
    如何选择扫描电镜的<b class='flag-5'>分辨率</b>?

    基于图像光谱分辨率的苹果糖度检测

    糖度是衡量苹果品质的关键指标。高光谱成像(由于含有丰富的图谱信息在糖度无损检测中有着广泛的应用前景。光谱分辨率(SSR)可通过建立映射关系从低光谱维度RGB图像获得对应高光谱维度HSI图像,在
    的头像 发表于 12-09 17:08 1000次阅读
    基于图像光谱<b class='flag-5'>超</b><b class='flag-5'>分辨率</b>的苹果糖度检测