0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种新的分割模型Stable-SAM

3D视觉工坊 来源:3D视觉工坊 2023-12-29 14:35 次阅读

0. 笔者个人体会

分割一切模型(SAM)这几年在CV领域应用很多,很多文章都在努力提高SAM的分割精度,但SAM分割的前提是高质量的提示(点、框)。但是实践中的SAM经常遇到不准确的提示,尤其是众包标注平台,这种不准确的提示会导致分割错误。

这也就是Stable Segment Anything Model这篇文章想要解决的问题,提出了一种新的分割模型Stable-SAM,希望遇到错误提示时也能实现稳定分割!

1. 效果展示

SAM、HQ-SAM、Stable-SAM在提供次优提示时的性能比较,Stable-SAM明显优于其他算法。

0a281586-9d31-11ee-8b88-92fbcf53809c.jpg

SAM和Stable-SAM的预测Mask和图像特征的权重对比,橙色圆圈表示注意力权重,半径越大表示得分越高。(a) 当提供高质量提示时,SAM分割结果很好。(b) 微小的提示修改会导致不稳定的分割输出,SAM错误分割了背景。(c) Stable-SAM通过将更多的特征采样注意力转移到目标对象上来准确地分割目标对象。

2. 具体原理是什么?

Stable-SAM的具体pipeline由三部分组成:

(a)是SAM的Mask解码器中的可变形采样插件(DSP)和可变形路由插件(DRP)。DSP采用小偏移网络(b)来预测特征采样偏移。随后DSP在更新的采样位置对可变形图像特征进行重新采样,并将它们馈送到SAM的标记到图像注意力。DRP采用一个小型MLP网络(c)来根据输入提示质量调节DSP激活的程度。注意,DSP自适应地单独调整图像特征采样位置,不会改变原始SAM模型。

0a573726-9d31-11ee-8b88-92fbcf53809c.jpg

3. 和其他SOTA方法对比如何?

在不同质量的提示下,SAM、DT-SAM(微调SAM的Mask解码器)、PT-SAM(微调SAM的提示token及其对应的输出MLP层)、HQ-SAM和Stable-SAM在HQ数据集上的对比。这里也推荐工坊推出的新课程《如何将深度学习模型部署到实际工程中?(分类+检测+分割)》。

0a6b0bac-9d31-11ee-8b88-92fbcf53809c.jpg

MS COCO和SGinW数据集上的对比,Stable-SAM最优。

0a775bd2-9d31-11ee-8b88-92fbcf53809c.jpg

审核编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • dsp
    dsp
    +关注

    关注

    544

    文章

    7682

    浏览量

    344362
  • 解码器
    +关注

    关注

    9

    文章

    1073

    浏览量

    40158
  • 图像分割
    +关注

    关注

    4

    文章

    173

    浏览量

    17861
  • SAM
    SAM
    +关注

    关注

    0

    文章

    107

    浏览量

    33361

原文标题:SAM终结者:稳定分割一切!

文章出处:【微信号:3D视觉工坊,微信公众号:3D视觉工坊】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何在SAM时代下打造高效的高性能计算大模型训练平台

    Segment Anything Model (SAM)是Meta 公司最近推出的一个创新AI 模型,专门用于计算机视觉领域图像分割任务。借鉴ChatGPT 的学习范式,将预训练和特定任务结合
    的头像 发表于 08-21 04:02 1357次阅读
    如何在<b class='flag-5'>SAM</b>时代下打造高效的高性能计算大<b class='flag-5'>模型</b>训练平台

    【爱芯派 Pro 开发板试用体验】+ 图像分割和填充的Demo测试

    例子的可读性非常不错。 下面简单介绍SAM的工作原理,帮助大家理解这个程序并进行后续的改进。 SAM一种深度学习模型(基于 tran
    发表于 12-26 11:22

    一种新的粘连字符图像分割方法

    一种新的粘连字符图像分割方法针对监控画面采样图像中数字的自动识别问题,提出一种新的粘连字符图像分割方法。该方法以预处理后二值图像的连通状况来判定字符粘连的存在,并对粘连字符图像采用上下
    发表于 09-19 09:19

    基于GAC模型实现交互式图像分割的改进算法

    基于GAC模型实现交互式图像分割的改进算法提出了一种改进的交互式图像分割算法。采用全变分去噪模型对图像进行预处理,在去除噪声的同时更好地保护
    发表于 09-19 09:19

    一种在金上生成硫醇封端的SAM的新方法

    一种在金上生成硫醇封端的SAM的新方法 - 应用简报
    发表于 10-30 11:05

    SAM-Adapter:首次让SAM在下游任务适应调优!

    在这些基础模型中,Segment Anything Model(SAM)作为一个在大型视觉语料库上训练的通用图像分割模型取得了显著的突破。事实证明,
    的头像 发表于 04-20 10:13 1118次阅读

    使用OpenVINO™在算力魔方上加速stable diffusion模型

    Stable Diffusion 是 stability.ai 开源的 AI 图像生成模型,实现输入文字,生成图像的功能。Stable Diffusion 将 AI 图像生成提升到了全新高度,将引发媒体创作领域的革命。
    的头像 发表于 05-12 09:10 948次阅读
    使用OpenVINO™在算力魔方上加速<b class='flag-5'>stable</b> diffusion<b class='flag-5'>模型</b>

    SAM分割模型是什么?

    SAM是一类处理图像分割任务的通用模型。与以往只能处理某种特定类型图片的图像分割模型不同,SAM
    的头像 发表于 05-20 09:30 1563次阅读

    近期分割模型发展情况

    SAM(Segment Anything Model)Meta 的 FAIR 实验室发布的一种最先进的图像分割模型,该模型将自然语言处理领域
    的头像 发表于 05-22 16:26 527次阅读
    近期<b class='flag-5'>分割</b>大<b class='flag-5'>模型</b>发展情况

    第一篇综述!分割一切模型(SAM)的全面调研

    SAM 是一个提示型模型,其在 1100 万张图像上训练了超过 10 亿个掩码,实现了强大的零样本泛化。许多研究人员认为「这是 CV 的 GPT-3 时刻,因为 SAM 已经学会了物体是什么的一般
    的头像 发表于 05-24 14:36 631次阅读
    第一篇综述!<b class='flag-5'>分割</b>一切<b class='flag-5'>模型</b>(<b class='flag-5'>SAM</b>)的全面调研

    SAM 到底是什么

    的有这么强大吗?让我们一起通过本文了解详情! SAM 是一个由 Meta AI 实验室推出的强大人工智能图像分割应用,可以自动识别哪些图像像素属于一个对象,并且对图像中各个对象进行自动风格处理,可广泛用于分析科学图像、编辑照片等。 SA
    的头像 发表于 06-12 10:46 2913次阅读
    <b class='flag-5'>SAM</b> 到底是什么

    YOLOv8最新版本支持SAM分割一切

    分割任何模型 (Segment Anything Model - SAM) 是一种突破性的图像分割模型
    的头像 发表于 06-18 11:42 1138次阅读
    YOLOv8最新版本支持<b class='flag-5'>SAM</b><b class='flag-5'>分割</b>一切

    中科院提出FastSAM快速分割一切模型!比Meta原版提速50倍!

    通过将分割⼀切任务重新划分为全实例分割和提⽰指导选择两个⼦任务,⽤带实例分割分⽀的常规 CNN 检测器以⾼出50倍的运⾏速度实现了与SAM⽅法相当的性能,是⾸个实时
    的头像 发表于 06-28 14:33 1210次阅读
    中科院提出FastSAM快速<b class='flag-5'>分割</b>一切<b class='flag-5'>模型</b>!比Meta原版提速50倍!

    基于SAM设计的自动化遥感图像实例分割方法

    RSPrompter的目标是学习如何为SAM生成prompt输入,使其能够自动获取语义实例级掩码。相比之下,原始的SAM需要额外手动制作prompt,并且是一种类别无关的分割方法。
    发表于 07-04 10:45 530次阅读
    基于<b class='flag-5'>SAM</b>设计的自动化遥感图像实例<b class='flag-5'>分割</b>方法

    ICCV 2023 | 超越SAM!EntitySeg:更少的数据,更高的分割质量

    ,需要在不同的图像领域、新的物体类别以及各种图像分辨率和质量下都能够保持鲁棒性。为了解决这个问题,早在 SAM[6] 模型一年之前,一种不考虑类别的实体分割任务 [1] 被提出,作为评
    的头像 发表于 10-02 10:40 525次阅读
    ICCV 2023 | 超越<b class='flag-5'>SAM</b>!EntitySeg:更少的数据,更高的<b class='flag-5'>分割</b>质量