0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌提出FlexiViT:适用于所有Patch大小的模型

CVer 来源:CVHub 作者:CVHub 2022-12-20 13:42 次阅读

太长不看版,果然还是延续谷歌的风格,创新不够,实验来凑。

废话不多说,直接上图,一图胜千言:

c6e4c8c0-8024-11ed-8abf-dac502259ad0.png

FlexiViT

顾名思义,FlexiViT,翻译过来不就是灵活的 ViT 嘛?

Ooo,那怎么体现灵活?我们先回顾下 Vision Transformers 的工作流程。

一句话总结就是,ViT 是一种通过将图像切割成一个个小方块(patch)将图像转换为序列从而输入到Transformer网络进行训练和推理的一种神经网络架构。

本文的重点便是在研究这些小块块对性能的最终影响。通常来说:

方块切的越小,精度会越高,但速度就变慢了;

方块切的越大,精度会降低,但速度就上来了;

So,我们究竟是要做大做强,还是做小做精致?不用急,来自谷歌大脑的研究人员为你揭晓答案:成年人才做选择,老子大小通吃。

正经点,让我们切回来,古哥通过燃烧了数不尽的卡路里向我们证明了,在训练期间随机改变方块的大小可以得到一组在广泛的方块大小范围内表现良好的权重(泛化性能好)。

这结论有什么用?那便是使得在部署时大家可以根据不同的计算预算来调整模型。

通过在以下五大版图进行广泛的投资,可以清晰的发现收益率远超沪深300:

图像分类

图像-文本检索

开放世界检测

全景分割

语义分割

c7162d34-8024-11ed-8abf-dac502259ad0.png

c780db7a-8024-11ed-8abf-dac502259ad0.png

为了照顾下你们这些散(韭)户(菜),古哥说你们可以将它任意添加到大多数依赖ViT骨干架构的模型来实现计算自由,即模型可以根据不同的计算资源调整自己的工作方式,从而获得更好的性能和效率。

说了这么多,怎么做?直接把代号都发给你了,明天早盘直接梭哈即可:

c7c41764-8024-11ed-8abf-dac502259ad0.png

看到看到这里了,总不能白嫖吧?点个赞友情转发下再走咯~~~

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5866

    浏览量

    103292
  • 图像
    +关注

    关注

    2

    文章

    1065

    浏览量

    40049
  • 模型
    +关注

    关注

    1

    文章

    2709

    浏览量

    47729

原文标题:谷歌提出FlexiViT:适用于所有Patch大小的模型

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    谷歌模型合成工具在哪下载安装

    谷歌模型合成工具通常不是作为一个独立的软件产品提供下载和安装的。相反,它们可能是作为谷歌云平台的一部分,通过云服务的方式提供。以下是一些可能适用于
    的头像 发表于 03-01 18:16 1224次阅读

    谷歌模型框架是什么软件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌开发的用于机器学习和人工智能的软件框架,其中最著名的是TensorFlow。TensorFlow是一个开源的机器学习框架,由
    的头像 发表于 03-01 16:25 260次阅读

    谷歌模型合成软件有哪些

    谷歌模型合成软件通常指的是谷歌提供的用于创建、修改和共享3D模型的软件。目前,谷歌推出的
    的头像 发表于 02-29 18:20 901次阅读

    谷歌交互世界模型重磅发布

    谷歌模型
    北京中科同志科技股份有限公司
    发布于 :2024年02月28日 09:13:06

    适用于电表的防干扰隔离反激式电源

    适用于电表的防干扰隔离反激式电源
    的头像 发表于 12-06 16:10 308次阅读
    <b class='flag-5'>适用于</b>电表的防干扰隔离反激式电源

    IGBT适用于ZVS 还是 ZCS?

    IGBT适用于ZVS 还是 ZCS?
    的头像 发表于 12-01 16:10 618次阅读
    IGBT<b class='flag-5'>适用于</b>ZVS 还是 ZCS?

    ODU TURNTAC®,适用于车制与开槽针孔

    ODU TURNTAC, 即使在恶劣环境下也适用的车制、开槽针孔 车制、开槽针孔 坚固的针孔系统,适用于恶劣的环境 10,000次插拔 低而稳定的插拔配合力 尽可能小的尺寸,针孔直径低至0.3mm
    的头像 发表于 08-15 09:50 279次阅读
    ODU TURNTAC®,<b class='flag-5'>适用于</b>车制与开槽针孔

    适用于快速模型模型调试器用户指南

    用于快速模型模型调试器是用于可扩展集群软件开发的完全可重定目标的调试器。它旨在满足SoC软件开发人员的需求。 Model Debugger具有易于使用的GUI前端,并支持: •源代码
    发表于 08-08 06:28

    适用于Linux的Emulex驱动程序 版本RHEL 7.x 12.6.240.48所有其他发行版12.6.240.45

    电子发烧友网站提供《适用于Linux的Emulex驱动程序 版本RHEL 7.x 12.6.240.48所有其他发行版12.6.240.45.pdf》资料免费下载
    发表于 08-04 09:55 0次下载
    <b class='flag-5'>适用于</b>Linux的Emulex驱动程序 版本RHEL 7.x 12.6.240.48<b class='flag-5'>所有</b>其他发行版12.6.240.45

    适用于Arduino的Adafruit NeoPixel Shield

    电子发烧友网站提供《适用于Arduino的Adafruit NeoPixel Shield.zip》资料免费下载
    发表于 06-09 10:27 0次下载
    <b class='flag-5'>适用于</b>Arduino的Adafruit NeoPixel Shield

    是否有适用于LPC4357的替代屏幕?

    我正在考虑使用 LPC4357-K43WQA 开发板开始一些开发。它适用于需要 LCD 屏幕的项目。LPC ARM 设备是我们在这里体验最多的,因此使用 LPC4357 并带有 LCD 屏幕的开发板
    发表于 06-02 07:57

    jscrane/TTS库不适用于NodeMCU 1.0吗?

    该库适用于 arduino nano,但我无法让它适用于 NodeMCU 1.0 esp8266。该库将文本转换为使用 PWM 信号生成为音频的现象。库 2 的 github 页面在其自述文件中确实
    发表于 06-01 06:01

    yolov5训练的tflite模型进行对象检测不适用于NNStreamer 2.2.0-r0?

    yolov5 训练的 tflite 模型进行对象检测不适用于 NNStreamer 2.2.0-r0。在之前的 NNStreamer 2.1.1 版本中,我曾经获取检测框,而当前版本显示框架的标签
    发表于 05-17 12:44

    NNStreamer是否只适用于YOLO5模型

    为 tflight。 但是 nnstreamer 似乎不接受我的模型。 我的问题是: 1. NNStreamer 是否只适用于 YOLO5 模型? 2、有没有可以跑YOLO3模型
    发表于 05-11 06:28

    是否有适用于linux-qoriq的补丁程序?

    patch 0135-arm-Add-support-for-lazy-preemption.patch 我猜这些补丁与 linux-qoriq 为主线 linux 制作的补丁有冲突。那么是否有适用于 linux-qoriq
    发表于 05-05 11:13