介绍新型深度CNN模型——NIMA 它能判断出哪张图片最好看-电子发烧友网

谷歌今日发文介绍新型深度CNN模型——NIMA（Neural Image Assessment），它能以接近人类的水平判断出哪张图片最好看。

图像质量和美学的量化一直是图像处理和计算机视觉长期存在的问题。技术质量评估测量的是图像在像素级别的损坏，例如噪声、模糊、人为压缩等等，而对艺术的评估是为了捕捉图像中的情感和美丽在语义级别的特征。最近，用带有标记的数据训练的深度卷积神经网络（CNNs）已被用于解决特殊图像（例如景观）图像质量的主观属性。然而，这些方法通常简单地将图像分为低质量和高质量的两类，范围有些狭窄。为了得到更准确的图像质量预测，我们提出的方法可以得不出同的预测评级，更接近于真实的评级，更适用于一般图像。

在NIMA：Neural Image Assessment这篇论文中，我们介绍了一个深度卷积神经网络，通过训练，它可以判断哪些是用户认为技术精湛的图片（technically），哪些是有吸引力的图片（aesthetically）。正是有了最先进的能够识别物体的深度神经网络，NIMA才能在此基础上理解更多类别的物体，不论有什么变化。我们提出的网络不仅能给图像打一个靠谱的分数、接近人类的感知水准，同时还能用于各种需要大量劳动力和主观任务中，例如智能照片编辑、优化视觉质量，或者在pipeline中发现视觉错误。

背景

一般来说，图像质量评估可分为全参考和无参考两种方法。如果作为参考的理想图片可用，则就会使用诸如PSNR、SSIM等衡量图像质量的尺度。当参考图像不可用时，无参考方法就会依靠统计模型来预测图像质量。这两种方法的主要目标是预测一个与人类感知十分相近的质量分数。在利用深度卷积神经网络对图像质量进行评估时，需要通过在与对象分类器相关的数据集上进行训练（例如ImageNet），以初始化权重。然后对注释数据进行微调，以进行感知质量评估任务。

NIMA

通常判断一幅图像是否有吸引力是将其分成高低两种质量。这忽略了一个事实，即训练数据中的每个图像都与人类评分的直方图相关联，而非简单的二分类。人类评价直方图是评价图像整体质量的指标，也是所有打分者的平均数。而在我们的新方法中，NIMA模型不是简单地将图像分为高或低质量，或者进行回归得到平均分，而是对任意给定的图像产出评级分布——分数从1到10，NIMA计算出各个分数的可能性。这也与训练数据的来源相一致，并且当与其他方法对比时，我们的方法更胜一筹。

接着，就可以使用NIMA的向量分数的各种功能按照吸引力排列图像了。下面展示了利用NIMA排名的图片，他们都来自AVA数据集。在测试中，AVA中的每张图片都由200人共同评分，训练结束后，NIMA对这些图片的美感排名与人类评分员的平均分数非常接近。我们发现NIMA在其他数据集上表现同样很出色，对图像质量的预测和人类接近。

AVA中带有“风景”标签的图片排名。括号中是人类打分，括号外是NIMA的预测分数

NIMA的分数也可以比较经过扭曲的图片与原图的质量差别，以下是TID2013测试集的一部分，其中包含各种类型和级别的图像失真。

图像感知增强（Perceptual Image Enhancement）

正如我们在另一篇论文中所提到的，质量和吸引力分数也可以用来调整图像增强operators。换句话说，将NIMA分数最大化作为损失函数的一部分，能够提升图像增强的感知质量。下图中的例子表明，NIMA可以作为训练损失来调整色调增强算法。我们发现对美感的基准评分可以通过NIMA的评分指导的对比调整来改善。因此，我们的模型能够引导一个深度卷积神经网络滤波器，以找到参数中接近最佳设置的位置，例如亮度、高光和阴影。

用CNN和NIMA改变原图的色调和对比度

展望未来

NIMA的结果表明，基于机器学习的质量评估模型可能用途非常广泛。比如，我们可以让用户很轻易地找出最好的照片，甚至实现在用户拍照时进行实时反馈。在后期处理上，该模型可以产生更优秀的结果。

简单地说，NIMA以及其他类似的网络可以满足人类对图像甚至视频的审美，虽然还不够完美，但已经比较可行了。俗话说，萝卜青菜各有所爱，每个人对一张照片的评价也各不相同，所以想要了解所有人的审美水平是非常困难的。但我们将继续训练测试模型，期待有更多的成果。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4562

浏览量
98646
图像处理

图像处理

+关注

关注
26

文章
1220

浏览量
55779
计算机视觉

计算机视觉

+关注

关注
8

文章
1591

浏览量
45592

原文标题：谷歌发布NIMA，一个有品位的CNN模型

文章出处：【微信号：jqr_AI，微信公众号：论智】欢迎添加关注！文章转载请注明出处。

怎样在labview的图片里插入与plc的通信接口，类似图片中的组态软件这种，在线等，急！

怎样在labview的图片里插入与plc的通信接口，类似图片中的组态软件这种，在线等，急！有36张不同模型角度的图片，怎样在插入通信之后，切

发表于 08-25 21:43

从AlexNet到MobileNet，带你入门深度神经网络

的深度神经网络运用的方法。AlexNet在研发的时候，使用的GTX580仅有3GB的显存，所以创造性的把模型拆解在两张显卡中，架构如下：1.第一层是卷积层，针对224x224x3的输入图片

发表于 05-08 15:57

利用工业相机聚焦过程采集的图片，我们怎么判断哪张图最清晰？

如题，我们们采集下来的图片，用一个什么标准来判断它们的清晰度，求指点！！！

发表于 05-10 14:36

大家是怎么压榨CNN模型的

【技术综述】为了压榨CNN模型，这几年大家都干了什么

发表于 05-29 14:49

探讨机器学习与深度学习的差异

最好的解答或是模型。以下將介紹機器學習的類別：機器學習主要可分類成 1. 監督式學習 :須將每筆資料標記上一個「標籤」，比如是與非回答、狗與貓、蘋果與橘子，利用大量已知標籤資訊與資料訓練的方式建立出一

发表于 09-20 09:05

卷积神经网络CNN介绍

【深度学习】卷积神经网络CNN

发表于 06-14 18:55

深度学习模型是如何创建的？

嵌入式系统已被证明可以降低成本并增加各个行业的收入，包括制造工厂，供应链管理，医疗保健等等。本文将介绍有关深度学习嵌入式系统的信息。深度学习模型是如何创建的？创建

发表于 10-27 06:34

Github开源的数字手势识别CNN模型简析

2.概述一个简单的AI开发sampleGithub开源的数字手势识别CNN模型，识别数字0-10十一种手势类LeNet-5，两个卷积层，两个池化层，一个全连接层，一个Softmax输出层3.RKNN

发表于 04-02 15:22

什么是深度学习？使用FPGA进行深度学习的好处？

什么是深度学习为了解释深度学习，有必要了解神经网络。神经网络是一种模拟人脑的神经元和神经网络的计算模型。作为具体示例，让我们考虑一个输入图像并识别图像中对象类别的示例。这个例子对应机器学习中的分类

发表于 02-17 16:56

如何将DS_CNN_S.pb转换为ds_cnn_s.tflite？

MIMRTX1064(SDK2.13.0)的KWS demo中放置了ds_cnn_s.tflite文件，提供demo中使用的模型示例。在 read.me 中，声明我可以找到脚本，但是，该文档中的脚本

发表于 04-19 06:11

一文详解CNN

数字识别，将数字平移到图像另一个位置，被认为是不同的图片）2. 参数量太大，难以训练，容易陷入局部极值，这样便有了后来的CNN，CNN是减少模型尺寸的利器。 2

发表于 08-18 06:56

深度学习模型优于人类医生?

2017年，Esteva等人发表论文，宣布他们创建了一种基于卷积神经网络的深度学习模型，可以对图片进行分类，其中CNN无需被人类的标准所限制，它可以将数字

发表于 06-30 08:40 •2413次阅读

深度探析7大类深度CNN创新架构

深度卷积神经网络（CNN）是一种特殊类型的神经网络，在各种竞赛基准上表现出了当前最优结果。本综述将最近的 CNN 架构创新分为七个不同的类别，分别基于空间利用、深度、多路径、宽度、特征

发表于 01-27 11:01 •3958次阅读

谷歌发表论文EfficientNet 重新思考CNN模型缩放

谷歌AI研究部门华人科学家再发论文《EfficientNet：重新思考CNN模型缩放》，模型缩放的传统做法是任意增加CNN的深度和宽度，或使

发表于 06-03 14:19 •5844次阅读

cnn卷积神经网络模型卷积神经网络预测模型生成卷积神经网络模型

cnn卷积神经网络模型卷积神经网络预测模型生成卷积神经网络模型卷积神经网络（Convolutional Neural Network，CNN

发表于 08-21 17:11 •794次阅读

搜索历史

介绍新型深度CNN模型——NIMA 它能判断出哪张图片最好看

评论

怎样在labview的图片里插入与plc的通信接口，类似图片中的组态软件这种，在线等，急！

从AlexNet到MobileNet，带你入门深度神经网络

利用工业相机聚焦过程采集的图片，我们怎么判断哪张图最清晰？

大家是怎么压榨CNN模型的

探讨机器学习与深度学习的差异

卷积神经网络CNN介绍

深度学习模型是如何创建的？

Github开源的数字手势识别CNN模型简析

什么是深度学习？使用FPGA进行深度学习的好处？

如何将DS_CNN_S.pb转换为ds_cnn_s.tflite？

一文详解CNN

深度学习模型优于人类医生?

深度探析7大类深度CNN创新架构

谷歌发表论文EfficientNet 重新思考CNN模型缩放

cnn卷积神经网络模型卷积神经网络预测模型生成卷积神经网络模型