0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

细粒度图像分析任务在发展过程中面临着独特的挑战

nlfO_thejiangme 来源:lq 2019-08-02 14:29 次阅读

细粒度图像分析(fine-grained image analysis,FGIA)是计算视觉领域的基础问题,由于面临的问题与其他视觉任务相比具有显著的差异,细粒度图像分析任务在发展过程中面临着独特的挑战。

近年来随着深度学习发展和数据特征表示的进步,FGIA也取得了一系列进展。来自旷视南京研究院的研究人员们对近年来基于深度学习FGIA的发展进行了系统的梳理和分类,同时给出了一系列行业内具体的应用实例,最后从目前面临的挑战和开放问题中展望了这一领域的发展趋势和研究方向。

细粒度图像分析所面临的任务是分析和处理某个类别目标下的一系列子类别的问题,例如狗的类别下包含了各种不同外形、颜色、身材的狗。这一任务最大的挑战在于子类间的差异很小,而在同一类别中的对象却因为姿态、大小或者位置呈现出较大的差别。

如何通过准确的特征表述,从细微的不同中辨别出不同的子类别,是细粒度图像分析任务所面临的最大挑战。

细粒度图像分析的主要任务是从同一父类中辨别出不同子类间的差异。

目前细粒度图像分析主要分为识别、检索和生成三个部分,在学术界和产业界扮演了重要的作用:从生物领域的监测和识别到零售领域的商品处理,从天气和气候变化分析到交通运输,细粒度图像分析拥有广泛的应用前景。

研究人员们在各大顶会上也发表了大量研究成果,举办了诸多FGIA的比赛,例如鱼类识别和鲸鱼识别等,也为FGIA指明了一系列未来的发展方向。

细粒度图像识别

细粒度图像识别任务是FGIA中最为活跃的研究领域,目前的研究思路重要分为三个方向:

一种是基于定位与分类的方法来实现;

另一种则直接利用端到端的方法实现特征编码从而进行识别;

最后一种则依赖于容易获取的外部信息进行辅助以实现细粒度图像识别。

定位-分类方法将细粒度图像识别转换成了两个细分的子任务。首先通过对图像中细粒度目标的可识别语义部分进行抽取作为中介,随后利用模型构建起对于这些部分的特征表达并分类来实现。

这需要一个用于定位这些类别关键部分的子网络,和一个可以对这些关键部分进行有效分类的子网络。通常研究人员们会使用bbox框或者语义分割掩膜等来为关键部分定位。基于端到端的方法则直接从数据中学习可辨别的特征表达,构建出强大的细粒度识别算法。例如双线心CNN方法利用高阶统计特征来提高中级cnn的学习能力,但过高的维度限制了这种方法在大规模数据中的现实应用。

最近研究人员利用低维嵌入的聚合以及双线性特征的近似等方法来改进端到端模型,并设计了特殊的损失函数来驱动模型学习出细粒度的表达。外部信息辅助下的细粒度图像识别充分利用了文本、网络数据、多模态数据和人类的帮助来更有效地进行细粒度任务。由于人类标记的数据成本很高,研究人员开始选用互联网上带有弱标签和噪声的数据。

其中一种方法是为需要测试的类别爬取含有标记噪声的数据作为训练数据,其主要的研究方向在于克服标记数据与易获取网络数据间的差距、减小噪声数据的负面影响。研究人员通常使用对抗学习和注意力机制来处理。

另一种方式是将良好标记类别上学习的能力迁移到测试类别上,通常采用元学习和无样本学习方法。

除了网络数据外,研究人员们还使用多模态数据进行辅助学习,包括自然语言描述和知识图谱等数据都是辅助细粒度图像识别的有力工具,实现视觉与语言的联合表示。

最后人工智能中一定需要人的参与,通过将难识别的样本、关键特征定位等任务加入人与机器的合作来实现更好的细粒度识别。

细粒度图像检索

图像检索也是细粒度图像分析中重要的一部分,在给定某类图像的前提下可以从数据库中返回相同的子类,而无需其他的监督信号。但与通常检索不同的是,细粒度任务所要检索的对象都是极为相似的子类别内容,子类间仅仅只有细微的差异,而同一目标则因为位姿、尺度和旋转的不同而差异巨大。

这一任务在电子商务和在线平台上有着巨大的需求,近年来研究人员利用深度学习的方法探索了对于图像中关键对象或部分的深度表达,发现新的损失函数和子结构来对这一问题进行处理。

细粒度图像生成

随着无监督学习和图像生成领域的发展,研究人员们开始探索细粒度的图像合成问题,包括人脸、人体和不同环境下的物体合成都展开了一系列研究。

例如结合变分自编码器和生成对抗方法的CVAE-GAN方法基于概率模型构建了标签和隐含属性,通过细粒度的类别来引导生成模型进行细粒度的图像生成。还有研究人员利用文本描述的方法结合生成模型得到具有细粒度特征的合成结果。

数据和基准

目前在细粒度图像领域有一系列基准数据,包括了动植物、飞机、零售商品等,这些数据不仅为这个领域的算法提供了有效的测评基准,同时也推动了这一领域的不断进步。作者在下表列出了常见的FGIA数据,包括了元类别、数量、标签类别等:

值得注意的是CUB200-2011数据是一个使用最为广泛的数据集,数据包含了详尽的标签,包括部分标注、属性标签甚至是一段对应的自然语言描述,近年来研究人员还在不断拓展这个数据。

此外还有很多数据集在不断地放出,人们更深入地研究新颖的特征、大规模、多层级的结构、域间的差异和数据长尾分布等,同时更多的研究如何在真实场景中进行有效落地。

广泛的应用

细粒度的图像分析在产业界中有诸多的应用,包括推荐系统中的衣服鞋帽检索、时尚识别,电子商务网站中的产品检索等等。此外人脸识别也可以视为细粒度图像识别的一个子问题,针对的是人脸这个类别下的身份细粒度识别。同时行人和车辆的重识别问题也是细粒度识别问题的一种体现。

FGIA将为会这些具体的问题提供一系列解决方案,包括可识别特征的捕捉和层层递进的信息结构等,都为这些领域的发展做出了贡献。

开放的问题

尽管细粒度图像分析在近年来取得了一系列的进步,但在很多方面还存在一系列开放问题值得进一步深度地研究,在文章的最后研究人员提出了四个未来潜在的发展方向,为未来的研究给出了建议。1. 自动化的细粒度建模。随着自动机器学习AutoML和自动架构搜索NAS的发展,未来细粒度机器学习将通过这些方法提高建模的效率和精度,并将寻找到表现更好的模型,同时也将反过来促进自动机器学习领域的发展。2. 细粒度小样本学习。人类可以通过少量的样本抽象出对于某个类型的认识。目前最好的深度学习模型也需要众多样本进行学习,既耗时也需要大量的数据成本。而细粒度图像识别拥有比粗尺度更为精细的标签,未来研究人员也许会利用更小的样本数量来对分类器进行训练,强化FGIA的实用性和应用规模。3. 细粒度哈希。随着这一领域的应用和数据规模的扩大,检索的难度也随之加大。哈希作为一种有效的领域搜索技术正在受到人们的关注,对于细粒度图像检索的哈希研究将有望成为处理大规模数据问题的有效手段。4. 真实细粒度分析。为了适应真实应用场景需要进一步研究在各种真实条件下的FGIA问题,例如在超市货架上的商品和野外的动物细粒度分析问题中,无法控制环境和对象的条件,这会对视觉任务带来一系列挑战。随着这一领域的发展,算法和模型将会具有更强的域适应性,基于知识迁移、长尾数据以及在资源受限的端上运行的细粒度图像分析将会有更多深入的研究,实现更加先进和可用的FGIA系统。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像分析
    +关注

    关注

    0

    文章

    80

    浏览量

    18561
  • 深度学习
    +关注

    关注

    73

    文章

    5224

    浏览量

    119866

原文标题:FGIA——细粒度图像分析的昨天、今天和明天

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    处理器低功耗物联网应用面临什么挑战

    许多物联网应用依靠小型电池运行,或者至少一段时间内依靠收集的能量而运行,因此,这些应用在能耗方面的预算非常严格。针对物联网市场的系统系统 (SoC) 设计人员面临着独特挑战,包括提
    发表于 08-12 07:33

    细粒度图像分析技术详解

    有别于我们熟悉的图像识别,细粒度图像分析所属类别和粒度更为精细,本文将向读者全面介绍这一领域的相关技术。 有别于通用
    发表于 09-30 11:27 0次下载
    <b class='flag-5'>细粒度</b><b class='flag-5'>图像</b><b class='flag-5'>分析</b>技术详解

    一种细粒度的面向产品属性的用户情感模型

    传统情感模型在分析商品评论中的用户情感时面临两个主要问题:1)缺乏针对产品属性的细粒度情感分析;2)自动提取的产品属性其数量须提前确定。针对上述问题,提出了一种
    发表于 12-26 10:29 0次下载

    基于Modbus功能码细粒度过滤算法的研究

    细粒度过滤算法。然而大量匹配规则的存储管理对数据过滤过程的查询效率有着决定性的影响,结合对规则集进行分类管理以提高匹配效率。通过构建有效的数据存储结构及对白名单规则的组织与配置,实现了Modbus TCP协议的细粒度过滤,更大
    发表于 01-16 15:32 0次下载
    基于Modbus功能码<b class='flag-5'>细粒度</b>过滤算法的研究

    基于ABS细粒度隐私隔绝的身份追溯研究

    面临互联网服务器端证书存储和身份认证任务成爆炸增加的严峻形势,细粒度隐私隔绝能身份追溯工作急需适用的方法。本文基于多属性基签名技术,将身份验证与管理建立在多属性认证的基础之上,排除身份唯一性标识符
    发表于 02-24 15:50 0次下载
    基于ABS<b class='flag-5'>细粒度</b>隐私隔绝的身份追溯研究

    使用深度模型迁移进行细粒度图像分类的方法说明

    针对细粒度图像分类方法中存在模型复杂度较高、难以利用较深模型等问题,提出深度模型迁移( DMT)分类方法。首先,在粗粒度图像数据集上进行深度模型预训练;然后,使用
    发表于 01-18 17:01 5次下载
    使用深度模型迁移进行<b class='flag-5'>细粒度</b><b class='flag-5'>图像</b>分类的方法说明

    FGIA 中的主要问题和挑战

    本文对基于深度学习的细粒度图像分析进行了综述,从细粒度图像识别、检索和生成三个方向展开论述。
    的头像 发表于 07-23 16:04 3043次阅读

    工业控制系统的设计过程面临着严峻挑战

    由于通过一个控制器所支持的节点数量正在逐渐增加,除了能耗、长电源使用寿命和可靠性要求等与所有工业自动化设计相关的挑战外,控制级设备的设计人员还面临着某些特定的挑战
    发表于 12-28 11:48 929次阅读
    工业控制系统的设计<b class='flag-5'>过程</b>将<b class='flag-5'>面临着</b>严峻<b class='flag-5'>挑战</b>

    结合非局部和多区域注意力机制的细粒度识别方法

    细粒度图像识别的目标是对细粒度级别的物体子类进行分类,由于不同子类间的差异非常细微,使得细粒度图像识别具有非常大的
    发表于 04-20 11:25 3次下载
    结合非局部和多区域注意力机制的<b class='flag-5'>细粒度</b>识别方法

    基于文本的细粒度美妆图谱视觉推理问题

    文中研究了化妆领域中基于文本的细粒度视觉推理问题,具体探究了一个新颖的多模态任务,即根据有序的化妆步骤描述,对化妆过程中打乱顺序的人脸图片进行排序。针对这个新颖的任务,通过数据的处理和
    发表于 04-23 14:15 1次下载
    基于文本的<b class='flag-5'>细粒度</b>美妆图谱视觉推理问题

    机器翻译中细粒度领域自适应的数据集和基准实验

    细粒度领域自适应问题是一个重要的实际应用问题。当研发人员需要为某个特定主题提供翻译服务(比如为某个主题的会议提供翻译)时,往往需要在特定的细粒度领域上取得更好的翻译性能。
    的头像 发表于 04-26 10:08 988次阅读

    通过对比学习的角度来解决细粒度分类的特征质量问题

    细粒度分类任务与常规的分类问题不同,它希望分类器能够看到不同类别之间的细微差异。当前流行的细粒度方法通常从两个方面设计以洞察到更加细微的特征:“更有区分度的表征学习”与“定位特征显著的部分”。然而,学习更有区分度的
    的头像 发表于 05-13 16:54 1806次阅读
    通过对比学习的角度来解决<b class='flag-5'>细粒度</b>分类的特征质量问题

    Leptos利用细粒度的响应式来构建声明性用户界面

    Leptos 是一个全栈、同构的 Rust Web 框架,利用细粒度的响应式来构建声明性用户界面。
    的头像 发表于 10-17 09:58 859次阅读

    细粒度图像识别深度学习开源工具库Hawkeye解析

      Hawkeye 是一个基于 PyTorch 的细粒度图像识别深度学习工具库,专为相关领域研究人员和工程师设计。目前,Hawkeye 包含多种代表性范式的细粒度识别方法,包括 “基于深度滤波器”、“基于注意力机制”、“基于高阶
    的头像 发表于 11-06 20:26 727次阅读

    飞速发展的HBM仍面临着一些挑战

    飞速发展的HBM仍面临着一些挑战
    的头像 发表于 07-22 10:36 1254次阅读
    飞速<b class='flag-5'>发展</b>的HBM仍<b class='flag-5'>面临着</b>一些<b class='flag-5'>挑战</b>