0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何对图像中的实体精准“配对”?

传感器技术 来源:未知 作者:李倩 2018-04-12 11:21 次阅读

近日,李飞飞的斯坦福大学视觉实验室发布了一篇即将在 CVPR 2018上要介绍的论文 Referring Relationships(指称关系),这篇论文主要研究的问题是给出一张图像中实体的关系网络,从而让 AI 迅速定位出某一主体所对应的客体,或者某一客体所对应的主体。

图像不仅仅是对象集合,每个图像都代表一个互相关联的关系网络。实体之间的关系具有语义意义,并能帮助观察者区分实体的实例。例如,在一张足球比赛的图像中,可能有多人在场,但每个人都参与着不同的关系:一个是踢球,另一个是守门。

在本文中,我们制定了利用这些“指称关系”来消除同一类别实体之间的歧义的任务。我们引入了一种迭代模型,它将指称关系中的两个实体进行定位,并相互制约。我们通过建模谓语来建立关系中实体之间的循环条件,这些谓语将实体连接起来,将注意力从一个实体转移到另一个实体。

我们证明了我们的模型不仅好于在三种数据集上实现的现有方法--- CLEVR,VRD 和 Visual Genome ---而且它还可以产生视觉上有意义的谓语变换,可以作为可解释神经网络的一个实例。最后,我们展示了将谓语建模为注意力转换,我们甚至可以在没有其类别的情况下进行定位实体,从而使模型找到完全看不见的类别。

▌指称关系任务

指称表达可以帮助我们在日常交流中识别和定位实体。比如,我们能够指出“踢球人”来区分“守门员”(图 1)。在这些例子中,我们都可以根据他们与其它实体的关系来区分这两人。 当一个人射门时,另一个人守门。 最终的目标是建立计算模型,以识别其他人所指的实体。

图1:指称关系通过使用实体间的相对关系来消除同一类别实例之间的歧义。给出这种关系之后,这项任务需要我们的模型通过理解谓语来正确识别图像中的踢球人。

▌指称关系模型

我们的目标是通过对指称关系的实体进行定位,从而使用输入的指称关系来消除图像中的实体歧义。 形式上而言,输入是具有指称关系的图像 I,R = ,它们分别是主体,谓语和对象类别。 预计这个模型可以定位主体和客体。

▌模型设计

图 2:指称关系的推理首先要提取图像特征,这是用于生成主体和客体的基础。接下来,这些估值可以用来执行转换注意力,注意力使用了从主体到我们所期望客体位置的谓语。在对客体的新估值进行细化的同时,我们通过关注转换区域来修改图像特征。同时,我们研究了从初始客体到主体的反向移位。通过两个预测移位模块迭代地在主体和对象之间传递消息,可以最终定位这两个实体。

▌实验

我们在跨三个数据集的指称关系中评估模型性能来进行实验操作,其中每个数据集提供了一组独特的特征来补充我们的实验。 接下来,我们评估在输入指称关系中缺少其中一个实体的情况下如何改进模型。 最后,通过展示模型如何模块化并用于场景图注意力扫视来结束实验。

以下是我们在 CLEVR、VRD 和 Visual Genome 上的评估结果。 我们分别标出了对主题和对象定位的 Mean IoU 和 KL 分歧:

在三种测试条件下缺少实体的指称关系结果:

图 3:(a)相对于图像中的主体,当使用关系来查找客体时,左边的谓语会把注意力转移到右边。相反,当使用物体找到主体时,左侧的逆谓语会将注意力转移到左侧。在辅助材料中,我们可视化了 70 个 VRD、6 个 CLEVR 和 70 个 Visual Genome 的谓语和逆谓语转化(b)我们还看到,在查看用于了解它们的数据集时,这些转换是直观的。

图 4:这是 CLEVR 和 Visual Genome 数据集的注意力转移如何跨越多次迭代的示例。在第一次迭代时,模型仅接收试图找到以及尝试定位这些类别中所有实例的实体信息。在后面的迭代中,我们看到谓语转换注意力,这可以让我们的模型消除相同类别的不同实例之间的歧义。

图 5:我们可以将我们的模型分解成其注意力和转换模块,并将它们堆叠起来作为场景图的节点。 在这里,我们演示了如何使用模型从一个节点(手机)开始,并使用指称关系来通过场景图连接节点,并在短语<拿电话的人旁边有人身穿夹克>中定位实体。 第二个例子是关于<在戴帽子的人的右边有个人一张桌子前>中的实体。

▌结论

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4574

    浏览量

    98758
  • 图像
    +关注

    关注

    2

    文章

    1063

    浏览量

    40041

原文标题:李飞飞团队最新论文:如何对图像中的实体精准“配对”?

文章出处:【微信号:WW_CGQJS,微信公众号:传感器技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    蓝牙配对之——密钥生成方法

    在《蓝牙配对之——配对特性交换》中,我们谈到了低功耗(Low Energy,简称LE)的蓝牙配对特性交换。配对特性交换让连接的发起设备和响应设备双方都能够获悉彼此的
    发表于 06-29 14:13 1.2w次阅读

    实体按键操作STemWin控件

    转在实际的项目中使用实体按键操作GUI的产品还挺多。借此专门做一个相关的例子,这个例子主要是给大家提供一种思路,实际的使用还会遇到各种各样的情况,争取以后在论坛再发相关的例子时也配上实体按键操作
    发表于 10-19 09:42

    VHDL程序实体

    设计实体是VHDL语言设计的基本单元,设计实体是VHDL语言设计的基本单元,简单的可以是一个与门,复杂的可以是一个微处理器或一个数字系统,其结构基本是一致的,都是由实体说明和结构体两部分组成。
    发表于 01-22 11:10

    API修改配对请求功能?

    有哪位大侠知道怎么用代码关闭配对请求,前提是我在Top配置了请求配对,这个功能必需要,但是功能中有时候是不需要请求配对的;所以需要代码来开关请求
    发表于 07-22 17:38

    HanLP分词命名实体提取详解

    推荐 1.文本推荐(句子级别,从一系列句子挑出与输入句子/词语最相似的那一句) 2.语义距离(基于《同义词词林扩展版》) 命名实体提取 HanLP分词提供词性标注的功能,所以调用分词接口后获得带有词性标注
    发表于 01-11 14:32

    如何手动进入配对模式?

    你好,在我的Pro—BLE应用程序,它是一个外围服务器,没有输入,没有输出设备,现在它可以在广告时被扫描,并且可以无限地接受任何配对请求,但是我需要这个设备只有当用户激活配对机制时才可以配对
    发表于 09-25 13:58

    【HarmonyOS HiSpark AI Camera】军用打靶精准识别器

    项目名称:军用打靶精准识别器试用计划:项目名称: 军用打靶精准识别器申请理由: 公司正在研制军用打靶精准识别系统,整套系统包括枪支激光发射器、枪靶激光识别器、数据管理终端及4G网关通讯器四大部分,每
    发表于 09-25 10:11

    CAD制图初学入门之CAD实体填充边界

    `当我们在CAD绘图软件绘制图纸的时候,有时候需要进行CAD实体填充边界操作,在上一节的CAD教程我们给大家介绍了CAD边界创建,接下来介绍一下CAD实体填充边界。CAD
    发表于 02-23 14:40

    CAD怎么将普通对象线缆转换为新实体线缆?

    `在使用国产CAD软件绘制电气图纸的过程,有些时候会需要将普通对象线缆与新实体线缆之间的相互转换,你知道具体如何操作吗?其实很简单,只需要调用浩辰CAD电气软件的类型转换命令即可。接下来的CAD
    发表于 03-12 15:55

    结型场效应管巧配对

    结型场效应管巧配对
    发表于 08-12 11:39 6550次阅读
    结型场效应管巧<b class='flag-5'>配对</b>

    蓝牙配对之——配对特性交换

    蓝牙(Bluetooth®)核心规格中有三大主要架构层:控制器、主机和应用。主机层中有一个为配对和密钥分配定义方法和协议的安全管理器模块、相应的安全工具箱、以及定义配对指令框架形式、框架架构和超时限制的安全管理器协议。安全管理器采用密钥分配的方式执行无线电通讯中的身份和加
    发表于 06-29 14:02 5433次阅读

    BLE协议栈配对过程

    主要描述配对过程、配对方法、安全属性、IO能力、配对算法、OOB和BLE安全等
    发表于 08-24 16:30 4次下载

    自制晶体管配对仪电路

    本文开始介绍了两款晶体管配对电路,其次介绍了结型场效应晶体管配对测试电路,最后阐述了自制晶体管配对仪电路方法。
    发表于 03-19 15:24 1.9w次阅读
    自制晶体管<b class='flag-5'>配对</b>仪电路

    教程 5:配对、绑定和安全

    教程 5:配对、绑定和安全
    发表于 03-15 19:39 0次下载
    教程 5:<b class='flag-5'>配对</b>、绑定和安全

    教程 5:配对、绑定和安全

    教程 5:配对、绑定和安全
    发表于 07-06 18:49 0次下载
    教程 5:<b class='flag-5'>配对</b>、绑定和安全