一种新的分割模型Stable-SAM-电子发烧友网

0. 笔者个人体会

分割一切模型（SAM）这几年在CV领域应用很多，很多文章都在努力提高SAM的分割精度，但SAM分割的前提是高质量的提示（点、框）。但是实践中的SAM经常遇到不准确的提示，尤其是众包标注平台，这种不准确的提示会导致分割错误。

这也就是Stable Segment Anything Model这篇文章想要解决的问题，提出了一种新的分割模型Stable-SAM，希望遇到错误提示时也能实现稳定分割！

1. 效果展示

SAM、HQ-SAM、Stable-SAM在提供次优提示时的性能比较，Stable-SAM明显优于其他算法。

SAM和Stable-SAM的预测Mask和图像特征的权重对比，橙色圆圈表示注意力权重，半径越大表示得分越高。(a) 当提供高质量提示时，SAM分割结果很好。(b) 微小的提示修改会导致不稳定的分割输出，SAM错误分割了背景。(c) Stable-SAM通过将更多的特征采样注意力转移到目标对象上来准确地分割目标对象。

2. 具体原理是什么？

Stable-SAM的具体pipeline由三部分组成：

(a)是SAM的Mask解码器中的可变形采样插件(DSP)和可变形路由插件(DRP)。DSP采用小偏移网络(b)来预测特征采样偏移。随后DSP在更新的采样位置对可变形图像特征进行重新采样，并将它们馈送到SAM的标记到图像注意力。DRP采用一个小型MLP网络(c)来根据输入提示质量调节DSP激活的程度。注意，DSP自适应地单独调整图像特征采样位置，不会改变原始SAM模型。