0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是基于深度学习的超分辨率

科技绿洲 来源:Imagination Tech 作者:Imagination Tech 2022-05-24 09:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

去年,我在 LinkedIn 上阅读到一篇很有趣的文章,内容涉及使用基于深度学习的超分辨率网络来增加美国宇航局毅力号(Nasa’s Perseverance Rover)发回的图像和视频中包含的细微细节。这篇文章让我回想到,我在 90 年代第一次观看《银翼杀手》时,基于当时可用的技术,诸如“将 15 增强到 23”之类的场景似乎如此难以置信。那时(因为《银翼杀手》之类的电影),我正在攻读为期三年的人工智能学位课程,我无法预测到千禧年初深度学习革命的影响。你不能添加不存在的东西,我一直对自己说。但现在看来,你可以——而且非常有说服力。

超分辨率如何应用于现实世界?

超分辨率的应用非常广泛:从旧照片的怀旧修复和着色到通过对低分辨率源内容进行上采样来减少视频流带宽。正如“放大火星”(Upscaling Mars)一文的作者所解释的那样,升级行星探索飞行器上的摄像头是不可行的,因此,如果需要通过提高分辨率来获得更多细节,或者甚至在机载镜头变得模糊或损坏的灾难性场景中,最先进的超分辨率技术可以提供巨大的价值。也有许多例子表明,很多原始图像是黑白的或是历史图像视频,随着分辨率的提高,通过着色,它们被重新激活。

什么是基于深度学习的超分辨率?

基于深度学习的超分辨率是将学习的上采样(up-sampling)函数应用于图像的过程,目的是增强图像中现有的像素数据或生成合理的新像素数据,从而提高图像的分辨率。事实上,上面提到的着色示例提供了一些关于深度学习如何利用上下文关系和自然图像的统计信息的见解。假设您有一个输入面片(卷积神经网络输入图像的一个区域)“x”,那么在相应的输出面片y的颜色上存在一个条件概率分布 p( y|x ) 。

这种分布在生成输出颜色时基本考虑了上下文关系。着色神经网络通常近似于这种分布模式:它了解到黑白输入图像的特定部分(面片)有可能是特定的颜色或颜色范围,基于网络训练时与类似输入面片对应的先前输出面片。这就是黑白照片或视频的着色方式。

超分辨率网络正在以类似的方式解决一个非常类似的问题:在这种情况下,它已经学会了根据低分辨率输入面片x的上下文生成最有可能的高分辨率输出面片Y。

放大图像的功能已经存在了一段时间,所以你可能会问,为什么我们需要另一种方法?现有技术包括最近邻、双线性和双三次(三次卷积)上采样,这些技术在迄今为止的大多数图像和视频上缩放应用中已经足够了。然而,如下所示的放大输出图像的裁剪,突出显示了以这种方式将图像放大到更大分辨率时产生的一些不良伪影。

如上图所示,输出图像的裁剪包含豹子胡须上称为“锯齿”的伪影,最近邻算法也难以重建皮肤纹理,从而导致像素化。双线性和双三次算法往往会使图像过度柔化,使其看起来失焦,缺乏细节。

这些限制,加上提高显示分辨率能力的宏观趋势,在保持当前功率预算和性能的同时,正在为该领域激发一些非常令人兴奋的创新。

Visidon是一家芬兰公司,成立于 2006 年,擅长使用基于人工智能的软件技术来增强静态图像和视频内容。它开发了一套基于深度学习的超分辨率网络,可以将 1080p分辨率的图像和视频缩放到 4K (2160p) 和 8K (4320p) 分辨率。已经设计和训练了三个基于深度学习的超分辨率网络(VD1、VD2 和 VD3),每个网络的目标分别是:

快速双三次质量推理 (VD1)

快速且优于双三次质量推理 (VD2)

静止图像的最高质量超分辨率推理 (VD3)。

Imagination 如何帮助部署和加速这些算法

在60帧的情况下,使用超分辨率来提高图像和视频内容的分辨率,,这需要大量计算,而这正是 Imagination 可以提供帮助的地方。我们的 IMG 4系列 AI 计算引擎采用张量分片技术,旨在为基于卷积的神经网络提供低系统带宽、高推理率的执行——这是Visidon超分辨率解决方案中的主要算法。

pYYBAGKMNb2AF4Y5AABh7Gxtnkg875.png

图1: IMG 4NX-MC8,Imagination 的可扩展多核架构。

我们的多核架构和获得专利的张量分片技术相结合,可以在并行处理的同时将大量图像和权重数据保留在芯片上,从而产生可扩展、强大的超分辨率性能,如下图所示:

pYYBAGKMNcaAekXEAAB0P49t5Lw462.png

表1:IMG 4系列 NNA计算引擎上的Visidon超分辨率网络性能(将 1080p 视频转换为 4K 分辨率)

Visidon如何衡量视觉质量

Visidon网络的质量由专家和非专家参与者使用随机盲评进行评估,两组评估人员分别为七个输出版本(三个Visidon网络 (VD1-3) 和lanczos4,双三次,双线性和最近邻)进行评分。Visidon的VD 超分辨率网络质量与现有的基于非深度学习的上采样算法的比较如下表所示:

pYYBAGKMNc6AJMsyAAAxA4GkgsU286.png

评估人员之前没有看过网络的图像或结果,也不允许讨论结果。然后将分数标准化为 1 到 5,其中双三次曲线的参考分数为2。

现在是你一直在等待的部分——视觉效果!

现在让我们来看看Visidon 的VD1、VD3 和 VD3 网络的结果,它们可以通过张量分片有效地部署在Imaginations 4系列NNA上。

注:样本图像来自Flickr2K 数据集,可免费用于商业用途,OpenCV 库用于 lanczos4、双三次、双线性以及最近邻放大,因此可以验证结果。

上面的图像对比突出了Visidon的VD3超分辨率算法的卓越品质,使花朵的所有部分都清晰、无噪,尤其是花瓣细节和黄色雄蕊。双三次算法无法充分处理边缘,使其不会因平滑而丢失。另请参阅内部花瓣与花的深色中心区域相交的位置。

另一个很好的例子是,通过Visidon网络中的适当锐化,树叶和岩石定义得以保留,而这在双三次上采样的平滑中完全丢失了。

在这个比较中,Visidon 的VD2 网络体现了微羽毛的细节和清晰度,考虑到输入图像在某些地方出现混叠,这令人印象深刻。VD2 网络通过保留羽毛图案的复杂性来从中恢复,而双三次算法无法做到这一点。喙部的细节和掠过它的小羽毛仍然清晰可见,没有明显的阶梯效应——这在双三次输出图像中可以看到,尽管很微妙。

此图像对比突出了Visidon 的VD1 网络的基线目标,即在质量上优于双三次上采样,同时提供非常高的推理性能。因此,虽然 VD1 在评估中产生了最低的感知质量,但其输出比双三次放大更清晰,可以保留了眼睛下方羽毛的细节,并且爪子下方树枝上的纹理明显更清晰。

在这里,我们看到Visidon 的网络巧妙地恢复了双三次放大中丢失的细节。多亏了Visidon 的VD3 网络,原始非常模糊的原始图像的一小部分得以精细的细节呈现出来。此外,请注意VD3 放大中水面的反射细节。难以置信!

结论

在计算能力可用于实时超分辨率图像和视频之前,现有算法已经满足了高达 1080p 分辨率的观众。但随着 4K(和 8K)显示器质量的不断提高,非深度学习算法的软化并不能完全满足新一代高分辨率观看的需要。

因此,如果采用放大技术将低分辨率内容传递到高分辨率屏幕,则必须以智能和上下文的方式保留源图像和视频的细节,以提供最愉悦的视觉体验。

Imagination 的 IMG 4系列NNA AI 计算引擎提高了计算能力,可以提供低功耗、低面积和系统带宽可扩展的卷积神经网络加速,使其成为部署Visidon最先进的基于深度学习的超分辨率解决方案的完美平台。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53530

    浏览量

    458856
  • AI
    AI
    +关注

    关注

    89

    文章

    38085

    浏览量

    296330
  • imagination
    +关注

    关注

    1

    文章

    617

    浏览量

    63081
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ADC分辨率与精度的区别是什么

    简单点说,“精度”是用来描述物理量的准确程度的,而“分辨率”是 用来描述刻度划分的。从定义上看,这两个量应该是风马牛不相及的。(是不是有朋友感到愕然^_^)。 很多卖传感器的JS就是利用这一点
    发表于 12-05 06:24

    镜头分辨率如何匹配工业相机的分辨率

    能被分辨开来的两个物点之间的最小距离,就是镜头的物方分辨率。单位为µm。这只是单纯镜头本身的参数,只反映镜头的解析能力,而和工业相机多少像素无关!它直接反映了,一个理想物点经过镜头成像后,会模糊
    的头像 发表于 11-21 15:43 128次阅读
    镜头<b class='flag-5'>分辨率</b>如何匹配工业相机的<b class='flag-5'>分辨率</b>

    电能质量在线监测装置的暂态记录分辨率如何影响故障类型识别?

    暂态记录分辨率是故障类型识别的 “细节放大镜”—— 核心通过 采样、幅值分辨率、时间分辨率 决定故障波形 “特征细节的完整性”,高分辨率
    的头像 发表于 11-14 16:10 1717次阅读
    电能质量在线监测装置的暂态记录<b class='flag-5'>分辨率</b>如何影响故障类型识别?

    索尼FCB-CR8530分辨率变焦:无人机光电吊舱的“视觉增强引擎”

    在无人机技术快速发展的当下,光电吊舱作为无人机的核心观测设备,其性能直接决定了任务执行的效率与精度。SONY FCB-CR8530模组凭借分辨率变焦技术与紧凑型设计,成为无人机光电吊舱领域的关键
    的头像 发表于 10-21 14:05 192次阅读

    HDMI接口分辨率和刷新的区别

    在数字影音的世界里,HDMI接口早已成为连接设备的核心桥梁。然而,许多人对HDMI的“分辨率”和“刷新”仍停留在模糊认知阶段,本期我们将对其进行深度解析。
    的头像 发表于 08-13 16:01 2210次阅读
    HDMI接口<b class='flag-5'>分辨率</b>和刷新<b class='flag-5'>率</b>的区别

    精度,重复精度和分辨率有什么关联

    精度,重复精度和分辨率,这三个令人疑惑的术语有很多种定义方法。
    的头像 发表于 07-26 17:13 601次阅读
    精度,重复精度和<b class='flag-5'>分辨率</b>有什么关联

    分辨率 vs 噪声 —— ADC的挑战

    设计者常用高分辨率 ADC 以降低最低可量测单位(LSB),提高检测精度。 比如一个 16 位 ADC 在 5V 范围内, LSB ≈ 76 μV ;理想情况下可以检测到微弱电信号。 问题是: 若
    的头像 发表于 06-23 07:38 1467次阅读
    <b class='flag-5'>分辨率</b> vs 噪声 —— ADC的挑战

    如何计算存储示波器的垂直分辨率

    存储示波器的垂直分辨率是指示波器能够分辨的最小电压变化量,它反映了示波器对信号幅度细节的测量能力,通常用位数(bit)来表示,也可通过相关公式换算为具体的电压值。以下为你详细介绍其计算方法:了解关键
    发表于 05-30 14:03

    高光谱相机的空间分辨率,光谱范围等参数我们要如何理解

    高光谱相机作为一种强大的成像工具,其性能由多个关键参数决定,其中 空间分辨率 和 光谱范围 尤为重要。理解这些参数的含义及其影响,对于选择合适的高光谱相机至关重要。我们可以综合下图的参数来做对
    的头像 发表于 03-14 10:35 1124次阅读

    如何通过过采样提高ADC分辨率

    通过过采样提高ADC分辨率
    发表于 02-10 08:05

    请问SAR ADC有效分辨率与采样有关吗?

    是不是所有的ADC都是采样越高、分辨率越差(跳动位数越多)? 我的实验: ADS8556是16位SAR ADC,最高采样500多KhZ。使用20k采样。 1)使用安捷伦线性电源
    发表于 01-15 07:57

    请问ad芯片的分辨率如何计算?参考电压如何设置?

    ad芯片的分辨率如何计算?参考电压如何设置?
    发表于 12-27 06:41

    如何提高透镜成像的分辨率

    透镜成像分辨率是指透镜系统能够分辨的最小细节的能力。提高透镜成像分辨率对于许多应用领域,如显微镜、望远镜、相机等,都是至关重要的。以下是一些提高透镜成像分辨率的方法: 1. 减少像差
    的头像 发表于 12-25 16:54 1706次阅读

    如何选择扫描电镜的分辨率

    选择扫描电镜的分辨率需要综合考虑多个因素。首先是研究目的。如果只是需要对样品的大致形貌进行观察,例如查看较大颗粒的分布或者材料表面的宏观缺陷,较低分辨率(如3-10nm)可能就足够了。但如果要观察
    的头像 发表于 12-25 14:29 1184次阅读
    如何选择扫描电镜的<b class='flag-5'>分辨率</b>?

    基于图像光谱分辨率的苹果糖度检测

    糖度是衡量苹果品质的关键指标。高光谱成像(由于含有丰富的图谱信息在糖度无损检测中有着广泛的应用前景。光谱分辨率(SSR)可通过建立映射关系从低光谱维度RGB图像获得对应高光谱维度HSI图像,在
    的头像 发表于 12-09 17:08 988次阅读
    基于图像光谱<b class='flag-5'>超</b><b class='flag-5'>分辨率</b>的苹果糖度检测