0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CVPR 2023 | 清华大学提出LiVT,用视觉Transformer学习长尾数据

智能感知与物联网技术研究所 来源:未知 2023-06-18 21:30 次阅读

aff2221c-0ddb-11ee-962d-dac502259ad0.png  背景

机器学习领域中,学习不平衡的标注数据一直是一个常见而具有挑战性的任务。近年来,视觉 Transformer 作为一种强大的模型,在多个视觉任务上展现出令人满意的效果。然而,视觉 Transformer 处理长尾分布数据的能力和特性,还有待进一步挖掘。

目前,已有的长尾识别模型很少直接利用长尾数据对视觉 Transformer(ViT)进行训练。基于现成的预训练权重进行研究可能会导致不公平的比较结果,因此有必要对视觉 Transformer 在长尾数据下的表现进行系统性的分析和总结。

b004ada6-0ddb-11ee-962d-dac502259ad0.png

论文链接:

https://arxiv.org/abs/2212.02015

代码链接:

https://github.com/XuZhengzhuo/LiVT 本文旨在填补这一研究空白,详细探讨了视觉 Transformer 在处理长尾数据时的优势和不足之处。本文将重点关注如何有效利用长尾数据来提升视觉 Transformer 的性能,并探索解决数据不平衡问题的新方法。通过本文的研究和总结,研究团队有望为进一步改进视觉 Transformer 模型在长尾数据任务中的表现提供有益的指导和启示。这将为解决现实世界中存在的数据不平衡问题提供新的思路和解决方案。 文章通过一系列实验发现,在有监督范式下,视觉 Transformer 在处理不平衡数据时会出现严重的性能衰退,而使用平衡分布的标注数据训练出的视觉 Transformer 呈现出明显的性能优势。相比于卷积网络,这一特点在视觉 Transformer 上体现的更为明显。另一方面,无监督的预训练方法无需标签分布,因此在相同的训练数据量下,视觉 Transformer 可以展现出类似的特征提取和重建能力。 基于以上观察和发现,研究提出了一种新的学习不平衡数据的范式,旨在让视觉 Transformer 模型更好地适应长尾数据。通过这种范式的引入,研究团队希望能够充分利用长尾数据的信息,提高视觉 Transformer 模型在处理不平衡标注数据时的性能和泛化能力。 b0232678-0ddb-11ee-962d-dac502259ad0.png  文章贡献 本文是第一个系统性的研究用长尾数据训练视觉 Transformer 的工作,在此过程中,做出了以下主要贡献: 首先,本文深入分析了传统有监督训练方式对视觉 Transformer 学习不均衡数据的限制因素,并基于此提出了双阶段训练流程,将视觉 Transformer 模型内在的归纳偏置和标签分布的统计偏置分阶段学习,以降低学习长尾数据的难度。其中第一阶段采用了流行的掩码重建预训练,第二阶段采用了平衡的损失进行微调监督。 b035076c-0ddb-11ee-962d-dac502259ad0.png    其次,本文提出了平衡的二进制交叉熵损失函数,并给出了严格的理论推导。平衡的二进制交叉熵损失的形式如下: b0498976-0ddb-11ee-962d-dac502259ad0.png    与之前的平衡交叉熵损失相比,本文的损失函数在视觉 Transformer 模型上展现出更好的性能,并且具有更快的收敛速度。研究中的理论推导为损失函数的合理性提供了严密的解释,进一步加强了我们方法的可靠性和有效性。 b06900a8-0ddb-11ee-962d-dac502259ad0.png▲不同损失函数的收敛速度的比较 基于以上贡献,文章提出了一个全新的学习范式 LiVT,充分发挥视觉 Transformer 模型在长尾数据上的学习能力,显著提升模型在多个数据集上的性能。该方案在多个数据集上取得了远好于视觉 Transformer 基线的性能表现。 b0827376-0ddb-11ee-962d-dac502259ad0.png▲不同参数量下在ImageNet-LT上的准确性

b09d72de-0ddb-11ee-962d-dac502259ad0.png▲在ImagNet-LT(左)和iNaturalist18(右)数据集上的性能表现

同时,本文还验证了在相同的训练数据规模的情况下,使用ImageNet的长尾分布子集(LT)和平衡分布子集(BAL)训练的 ViT-B 模型展现出相近的重建能力。如 LT-Large-1600 列所示,在 ImageNet-LT 数据集中,可以通过更大的模型和 MGP epoch 获得更好的重建结果。 wKgZomTYg3CAQbicAARAkEpPjg4567.png    b1201f86-0ddb-11ee-962d-dac502259ad0.png  

总结

本文提供了一种新的基于视觉 Transformer 处理不平衡数据的方法 LiVT。LiVT 利用掩码建模和平衡微调两个阶段的训练策略,使得视觉 Transformer 能够更好地适应长尾数据分布并学习到更通用的特征表示。该方法不仅在实验中取得了显著的性能提升,而且无需额外的数据,具有实际应用的可行性。 论文的更多细节请参考论文原文和补充材料。


原文标题:CVPR 2023 | 清华大学提出LiVT,用视觉Transformer学习长尾数据

文章出处:【微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2869

    文章

    41622

    浏览量

    358380

原文标题:CVPR 2023 | 清华大学提出LiVT,用视觉Transformer学习长尾数据

文章出处:【微信号:tyutcsplab,微信公众号:智能感知与物联网技术研究所】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    直线电机生产厂家谈清华大学获芯片领域重要突破

    设备制造商、医学设备制造商、科研机构以及各大高校。 像大家熟知的清华大学、北京航空航天大学、西安交通大学、哈尔滨工业大学、浙江大学、南京
    的头像 发表于 04-24 08:18 40次阅读
    直线电机生产厂家谈<b class='flag-5'>清华大学</b>获芯片领域重要突破

    清华大学研发成功大规模干涉-衍射异构集成芯片——太极

    4月12日公布,清华大学研发出太极芯片,实现了每瓦160TOPS的高性能通用智能计算,这是该校电子工程系与自动化系共同攻克的难题。
    的头像 发表于 04-12 15:50 148次阅读

    清华大学突破性成果!全球首个无串扰量子网络节点诞生

    清华大学交叉信息研究院的段路明教授课题组长期以来进行了创新性的研究,并提出使用同种离子的双类型量子比特来实现量子网络节点的方案。
    的头像 发表于 01-24 16:07 542次阅读

    2023青年最关注改变未来十大变革的科技

    清华大学《探臻科技评论》2023“青年最关注的改变未来十大变革科技”榜单发布!为营造良好的科技创新生态,鼓励广大青年学子瞄准行业前沿,深入探索交叉领域,清华大学《探臻科技评论》开展了2023
    的头像 发表于 11-29 08:09 202次阅读
    <b class='flag-5'>2023</b>青年最关注改变未来十大变革的科技

    清华大学研发光电融合芯片,算力超商用芯片三千余倍

    清华大学官方消息,在计算能力方面,清华大学攻关团队创造性地提出的计算框架光电深度融合,从最本质的物理原理出发,电磁波传播的空间为基础的光计算和基尔霍夫定律为基础的纯结合了模拟电子计算。“
    的头像 发表于 10-31 11:18 598次阅读

    清华大学团队在超高性能计算芯片领域取得新突破

    清华大学团队在超高性能计算芯片领域取得新突破,相关研究发表在Nature上。
    的头像 发表于 10-29 09:20 624次阅读
    <b class='flag-5'>清华大学</b>团队在超高性能计算芯片领域取得新突破

    我国芯片突破!清华大学全球首枚!

    10月10日消息,据清华大学公众号,近日,清华大学集成电路学院教授吴华强、副教授高滨基于存算一体计算范式,研制出全球首颗全系统集成的、支持高效片上学习(机器学习能在硬件端直接完成)的忆
    的头像 发表于 10-14 08:11 352次阅读
    我国芯片突破!<b class='flag-5'>清华大学</b>全球首枚!

    存算一体芯片新突破!清华大学研制出首颗存算一体芯片

    这几天清华大学又火出圈了。但这次并不是因为招生抢人和饭堂,而是清华大学的芯片研发团队研制出全球首颗全系统集成的存算一体芯片。这是我国、乃至全世界对半导体行业的又一重大突破。 这个芯片由清华大学
    的头像 发表于 10-11 14:39 683次阅读

    清华大学重磅消息:全球首颗!我国芯片领域取得重大突破

    想象一下,一枚芯片上集成了记忆和计算的能力,在保护用户隐私同时,还具备了类似人脑的自主学习,能耗仅为先进工艺下专用集成电路系统的1/35,听起来是不是很神奇? 据清华大学公众号10月9日消息,近期
    的头像 发表于 10-11 08:39 464次阅读
    <b class='flag-5'>清华大学</b>重磅消息:全球首颗!我国芯片领域取得重大突破

    2023年开放原子校源行(清华大学站)成功举行

    清华大学举办了以“聚缘于校,开源共行”为主题的2023年开放原子校源行活动。该活动由开放原子开源基金会和清华大学共同主办,得到工信部的大力支持。活动吸引了政府部门、行业协会、全国高校、科技企业
    的头像 发表于 08-01 16:10 296次阅读
    <b class='flag-5'>2023</b>年开放原子校源行(<b class='flag-5'>清华大学</b>站)成功举行

    直播预告|开放原子校源行(清华大学站)

    校源行(清华大学站)活动将在清华大学蒙民伟音乐厅举办。本次活动拟通过邀请政府领导、知名高校嘉宾、头部科技企业、权威主流媒体代表共聚校园共话开源,集中展示“开放原子校源行”公益项目进展及成果,在高校学子中推广优秀开源项目
    的头像 发表于 06-26 21:55 324次阅读
    直播预告|开放原子校源行(<b class='flag-5'>清华大学</b>站)

    国仪量子携手清华大学!《如何精准测孔?》系列讲座开讲

    5月31日,清华大学分析中心磁共振实验室举行的《如何精准测孔?》系列讲座正式开讲,国仪精测总经理夏攀分享了《材料孔径精确测定要点及测试实例分析》报告,线上线下近60余位相关领域的研究人员参加并进
    的头像 发表于 06-09 10:28 398次阅读
    国仪量子携手<b class='flag-5'>清华大学</b>!《如何精准测孔?》系列讲座开讲

    清华大学在超快激光微纳制造领域获得新进展

    近日,清华大学机械系在超快激光微纳制造领域获得新进展,提出了基于超快激光等离激元分子调节实现自下而上的微纳功能器件加工制造策略,并揭示了激光诱导等离激元与材料的非线性作用机理,利用超快激光激发纳米腔等离激元效应
    的头像 发表于 05-31 14:38 585次阅读
    <b class='flag-5'>清华大学</b>在超快激光微纳制造领域获得新进展

    纵目科技与清华大学共同成立智能辅助驾驶系统联合研究中心

    今日,纵目科技宣布与国内顶尖学府——清华大学共同成立智能辅助驾驶系统联合研究中心(以下简称“联合研究中心”),并在清华园内举办了隆重的揭牌仪式。清华大学教授、副校长曾嵘、中国工程院院士、清华大
    的头像 发表于 05-31 09:52 322次阅读
    纵目科技与<b class='flag-5'>清华大学</b>共同成立智能辅助驾驶系统联合研究中心

    清华大学杨海军:国产仪器成为耀眼的新星

    4月14日至4月18日,时隔两年再度重启的全国电子顺磁共振波谱学术研讨会线下会议在浙江大学成功举办。来自清华大学的高级工程师杨海军老师在会后写下了饱含真情的感想。小编在征得杨老师同意后,将文章转载
    的头像 发表于 05-08 09:58 494次阅读
    <b class='flag-5'>清华大学</b>杨海军:国产仪器成为耀眼的新星