0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

GA-RPN:Region Proposal by Guided Anchoring 引导锚点的建议区域网络

jf_96884364 来源:代码的路 作者:代码的路 2023-01-12 09:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

原文链接

论文地址:https://arxiv.org/pdf/1901.03278.pdf

代码地址:GitHub - open-mmlab/mmdetection: OpenMMLab Detection Toolbox and Benchmark

1.RPN

RPN即Region Proposal Network,是用RON来选择感兴趣区域的,即proposal extraction。例如,如果一个区域的p>0.5,则认为这个区域中可能是80个类别中的某一类,具体是哪一类现在还不清楚。到此为止,网络只需要把这些可能含有物体的区域选取出来就可以了,这些被选取出来的区域又叫做ROI(Region of Interests),即感兴趣的区域。当然RPN同时也会在feature map上框定这些ROI感兴趣区域的大致位置,即输出Bounding Box。

RPN详细介绍:https://mp.weixin.qq.com/s/VXgbJPVoZKjcaZjuNwgh-A

2.Guided Anchoring

通常用(x,y,w,h)来描述一个anchor,即中心点坐标和宽高。文章将anchor的分布用条件概率来表示,公式为:

p(x,y,w,h|I)=p(x,y|I)p(w,h|x,y,I)

两个条件概率的分布,代表给定图像特征之后anchor的 中心点概率分布 ,和给定图像特征和中心点之后的 形状概率分布 。这样看来,原来我们所获取anchor的方法就可以看成上述条件概率分布的一个特例,即p(x,y|I)是均匀分布而p(w,h|x,y,I)是冲激函数。

根据上面的公式,anchor的生成过程可以分解为两个步骤,anchor位置预测和形状预测。

论文中用到的方法如下:

这个框架就是在原始的RPN的特征图基础上,采用两个分值分别预测anchor的位置和形状,然后再结合到一起得到anchor。之后采用一个Feature Adaption模块进行anchor特征的调整,得到新的特征图供之后的预测使用(anchor的分类和回归)。整个方法可以端到端训练,而且相比之前只是增加了3个1×1 conv 和一个3×3 deformable conv,带来的模型参数量变化很小。

(1)位置预测

位置预测分支的目标是预测哪些区域应该作为中心点来生成anchor,也是一个二分类问题,但是不同于RPN的分类,我们并不是预测每个点是前景还是背景,而是预测是不是物体中心。

我们将整个feature map的区域分为物体中心区域、外围区域和忽略区域,大致思路就是将groundtruth 框的中心一小块对应在feature map上的区域标为物体中心区域,在训练的时候作为 正样本 ,其余区域按照离中心的距离标为忽略或者 负样本 。最后通过选择对应概率值高于预定阈值的位置来确定可能存在对象活动的区域。F1 对输入的特征图使用 1×1 的卷积,得到与 F1 相同分辨率的输出,N_L 得到输出的每个位置的值表示原图I上对应位置出现物体的可能性,也就是概率图,最后通过选择对应概率值高于预定阈值的位置来确定可能存在对象活动的区域。

通过位置预测,我们可以筛选出一小部分区域作为anchor的候选中心点位置,使得anchor数量大大降低。这样在最后我们就可以只针对有anchor的地方进行计算。

(2)形状预测

形状预测分支是目标是给定anchor中心点,预测最佳的长和宽,这是一个回归问题。

采用1×1的卷积网络 N_s 输入 F_1,输出与 F_1 尺寸相同的2通道的特征图,每个通道分别代表 dw 和 dh,表示每个位置可能的最好的 anchor 尺寸。虽然我们的预测目标是 w 和 h,但是直接预测这两个数字不稳定,因为范围很大,所以将空间近似 [0,1000] 映射到了 [-1,1] 中,公式为:

w=\\sigma \\times s \\times e^{dw},w=\\sigma \\times s \\times e^{dh}

其中 s 是步幅,σ 是经验因子,实验中取 σ=8。实验中产生 dw,dh 的双通道映射,通过这个方程实现了逐像素转换。文章中直接用 IOU 作为监督来学习 w 和 h。

对于 anchor 和 ground truth 匹配问题,传统 RPN 都是直接计算 anchor 和所有 ground truth 的 IOU,然后将anchor 匹配给 IOU 最大的那个 ground truth,但是现在由于我们的改进,anchor 的 w 和 h 都是不确定的,是一个需要预测的变量。文中将这个 anchor 和某个 ground truth 的 IOU 表示为:

vIOU(a_{wh},gt)=\\max_{w>0,h>0}IOU_{normal}(a_{wh},gt)

我们不可能把所有可能的 w 和 h 遍历一遍求 IOU 的最大值,文中采用了9组可能的 w 和 h 作为样本,近似效果已经足够。

到这里我们就可以生成 anchor 了。这时所生成的 anchor 就是稀疏而且每个位置不一样的。实验可得此时的平均 recall 已经超过普通的 RPN 了,仅仅是增加了两个 conv。

(3)特征精调模块

由于每个位置的形状不同,大的anchor对应较大感受野,小的anchor对应小的感受野。所以不能像之前基于anchor的方法那样直接对feature map进行卷积来预测,而是要对feature map进行feature adaptation。作者利用可变形卷积(deformable convolution)的思想,根据形状对各个位置单独进行转换。

方法就是把anchor的形状信息直接融入到特征图当中,得到新的特征图去适应每个位置anchor的形状。这里就利用了上述的3×3的可变形卷积进行对原始特征图的修正,可变形卷积的变化量是通过anchor的w和h经过一个1×1 conv得到的。

f'_i=N_t(f_i,w_i,h_i)

其中,fi 是第 i 个位置的特征,(wi, hi) 是对应的 anchor 形状。NT 通过 3×3 的变形卷积实现。首先通过形状预测分支预测偏移字段 offset field,然后对带偏移的原始 feature map 做变形卷积获得 adapted features。之后进一步做分类和 bounding box 回归。

通过这样的操作,达到了让 feature 的有效范围和 anchor 形状更加接近的目的,同一个 conv 的不同位置也可以代表不同形状大小的 anchor 了。

文中实验结果示例:

学习更多编程知识,请关注我的公众号:

[代码的路]

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4845

    浏览量

    108376
  • 代码
    +关注

    关注

    30

    文章

    4983

    浏览量

    74539
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    正确选择功率分析仪的五建议

    简单的任务。 建议1 精度 测量精度是最基本的,当你在优化逆变器,电机或传动系统的性能时。通过降低测量不确定性,可以产生更可靠的结果。选择具有高基本功率精度的 功率分析仪 能确保您的投资更有价值。 建议2 输入数量和
    的头像 发表于 05-19 16:01 46次阅读
    正确选择功率分析仪的五<b class='flag-5'>点</b><b class='flag-5'>建议</b>

    赋能蓝牙中继定位:云里物里 MBM04 与 nRF54L15

    借助 Nordic nRF54L15系统级芯片的强大性能与高能效优势, 云里物里 充分释放了 其 MBM04 中继定位 的全部潜能 挪威奥斯陆 – 2026年5月 11 日– 总部位于深圳的云里
    的头像 发表于 05-11 10:18 485次阅读
    赋能蓝牙中继定位<b class='flag-5'>锚</b><b class='flag-5'>点</b>:云里物里 MBM04 与 nRF54L15

    华为面向北非区域全面升级星河AI网络

    “华为数据通信创新峰会2026”全球首站在埃及开罗圆满落幕,本次大会吸引了来自埃及、摩洛哥、塞内加尔等10多个国家的500余位行业领袖、技术专家和优秀生态伙伴。大会期间,华为面向北非区域,以安全智联理念,全面升级星河AI网络,携手客户与伙伴共赢Agentic AI时代新增
    的头像 发表于 05-07 16:58 813次阅读

    避坑指南:MCX 连接器方向装反了怎么办?PCB 布局时的三建议

    本文针对 MCX 连接器方向装反的常见痛,提出了应急返修流程,并从丝印防呆、空间布局以及自动化贴片三个维度给出了专业的 PCB 选型与设计建议
    的头像 发表于 04-15 16:36 250次阅读
    避坑指南:MCX 连接器方向装反了怎么办?PCB 布局时的三<b class='flag-5'>点</b><b class='flag-5'>建议</b>

    UWB 定位中的 ToF、TWR、TDoA 是什么?

    时间同步,部署更灵活。 ToF/TWR 方法基于标签和之间的双向通信,将飞行时间转换为距离测量。距离是一种非常直观的度量方式,有助于简化网络的配置和故障排查。 局限: 由于双向通信的特性和确定
    发表于 04-08 11:18

    如何在 K82 微控制器中使用 QSPI 别名区域

    引导加载程序区域。 但是,如果我手动将程序计数器设置为 main() 的地址(从 .map 文件中检索),则调试会话将成功启动。 您能否澄清可能导致此行为的原因?是否有推荐的方法可以绕过此启动问题,特别是考虑到 MBOOTQSPIUG 文档中的过程在我的情况下似乎不起作
    发表于 04-06 06:32

    LTM9001-GA:16位IF/基带接收器子系统的深度解析

    LTM9001-GA:16位IF/基带接收器子系统的深度解析 在电子工程领域,高性能的接收器子系统对于处理宽动态范围信号至关重要。LTM9001-GA作为一款集成式的16位IF/基带接收器子系统
    的头像 发表于 04-01 11:55 289次阅读

    疆鸿智能EtherNet/IP和Modbus TCP技术应用,建议赞收藏!

    疆鸿智能EtherNet/IP和Modbus TCP技术应用,建议赞收藏! 随着工业自动化向数字化、智能化迈进,不同通信协议间的互联互通已成为构建高效生产网络的基础。EtherNet/IP
    的头像 发表于 03-18 14:56 241次阅读
    疆鸿智能EtherNet/IP和Modbus TCP技术应用,<b class='flag-5'>建议</b><b class='flag-5'>点</b>赞收藏!

    疆鸿智能PROFIBUS集线器:医药冷链AGV网络的稳定之

     疆鸿智能PROFIBUS集线器:医药冷链AGV网络的稳定之 在医药生产与物流领域,自动化系统的可靠性直接关乎药品安全与患者生命。随着AGV(自动导引车)在生物实验室、无菌车间及冷链运输中
    的头像 发表于 01-04 14:07 301次阅读
    疆鸿智能PROFIBUS集线器:医药冷链AGV<b class='flag-5'>网络</b>的稳定之<b class='flag-5'>锚</b>

    疆鸿智能PROFIBUS六路集线器详细讲解,建议赞收藏

    疆鸿智能PROFIBUS六路集线器详细讲解,建议赞收藏 JH-DP6是一款专业的Profibus网络优化设备,能够将传统总线结构转换为稳定的星型拓扑,有效支持复杂布线需求。它具备信号整形与放大
    的头像 发表于 12-24 14:59 381次阅读
    疆鸿智能PROFIBUS六路集线器详细讲解,<b class='flag-5'>建议</b><b class='flag-5'>点</b>赞收藏

    5G网络通信有哪些技术痛

    ,这些技术使得5G网络能够满足未来物联网、智能制造、自动驾驶等领域对高速、低时延、高可靠性的通信需求。 5G网络通信有哪些技术痛? 5G网络通信经过多年的高速发展,仍有一些技术痛
    发表于 12-02 06:05

    ATA-61411功率放大器在预应力GFRP杆节理面抗剪性能研究中的应用

    实验名称:预应力GFRP杆节理面抗剪性能及损伤力学模型研究 研究方向:复合材料在土木工程中的应用 实验内容:本文根据杆双剪试验方法设计并开展了不同预应力下GFRP杆节理面剪切试验,基于试验结果
    的头像 发表于 11-28 11:26 543次阅读
    ATA-61411功率放大器在预应力GFRP<b class='flag-5'>锚</b>杆节理面抗剪性能研究中的应用

    EtherNet/IP从站转CC-Link IEFB从站协议转换网关,建议赞收藏

    EtherNet/IP从站转CC-Link IEFB从站协议转换网关,建议赞收藏 一,设备主要功能 疆鸿智能JH-EIP-CCLKIE型网关实现CC-Link IE Field Basic网络
    的头像 发表于 11-18 15:32 590次阅读
    EtherNet/IP从站转CC-Link IEFB从站协议转换网关,<b class='flag-5'>建议</b><b class='flag-5'>点</b>赞收藏

    Profinet转CC-Link IE总线协议转换网关建议赞收藏

    Profinet转CC-Link IE总线协议转换网关建议赞收藏 一,主要功能 1、Profinet从转CC-Link IE从工业级Profinet网关。‌这种网关设备允许将Profinet网络
    的头像 发表于 11-13 16:32 1229次阅读
    Profinet转CC-Link IE总线协议转换网关<b class='flag-5'>建议</b><b class='flag-5'>点</b>赞收藏

    功率放大器:预应力GFRP杆节理面抗剪性能研究的关键驱动力

    实验名称: 预应力GFRP杆节理面抗剪性能及损伤力学模型研究 研究方向: 复合材料在土木工程中的应用 实验内容: 本文根据杆双剪试验方法设计并开展了不同预应力下GFRP杆节理面剪切试验
    的头像 发表于 09-17 09:39 515次阅读
    功率放大器:预应力GFRP<b class='flag-5'>锚</b>杆节理面抗剪性能研究的关键驱动力