0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何让Transformer在多种模态下处理不同领域的广泛应用?

深度学习自然语言处理 来源:AI公园 作者:Synced 2021-03-08 10:30 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一个模型完成了CV,NLP方向的7个任务,每个任务上表现都非常好。

Transformer架构在自然语言处理和其他领域的机器学习(ML)任务中表现出了巨大的成功,但大多仅限于单个领域或特定的多模态领域的任务。例如,ViT专门用于视觉相关的任务,BERT专注于语言任务,而VILBERT-MT只用于相关的视觉和语言任务。

一个自然产生的问题是:我们能否建立一个单一的Transformer,能够在多种模态下处理不同领域的广泛应用?最近,Facebook的一个人工智能研究团队进行了一个新的统一Transformer(UniT) encoder-decoder模型的挑战,该模型在不同的模态下联合训练多个任务,并通过一组统一的模型参数在这些不同的任务上都实现了强大的性能。

Transformer首先应用于sequence-to-sequence模型的语言领域。它们已经扩展到视觉领域,甚至被应用于视觉和语言的联合推理任务。尽管可以针对各种下游任务中的应用对预先训练好的Transformer进行微调,并获得良好的结果,但这种模型微调方法会导致为每个下游任务创建不同的参数集。

Facebook的人工智能研究人员提出,一个Transformer可能就是我们真正需要的。他们的UniT是建立在传统的Transformer编码器-解码器架构上,包括每个输入模态类型的独立编码器,后面跟一个具有简单的每个任务特定的头的解码器。输入有两种形式:图像和文本。首先,卷积神经网络骨干网提取视觉特征,然后BERT将语言输入编码成隐藏状态序列。然后,Transformer解码器应用于编码的单个模态或两个编码模态的连接序列(取决于任务是单模态还是多模态)。最后,Transformer解码器的表示将被传递到特定任务的头,该头将输出最终的预测。

UniT模型概要

评估UniT的性能,研究人员进行了实验,需要共同学习来自不同领域的许多流行的任务:COCO目标检测和 Visual Genome数据集,语言理解任务的GLUE基准(QNLI, QQP、MNLI-mismatched SST-2),以及视觉推理任务VQAv2 SNLI-VE数据集。

8d044a88-7f2a-11eb-8b86-12bb97331649.png

多任务训练的UniT性能优于单独训练的目标检测和VQA

8d3f74fa-7f2a-11eb-8b86-12bb97331649.png

基于UniT模型的目标检测与VQA的分析

8d86f6fe-7f2a-11eb-8b86-12bb97331649.png

UniT模型在8个数据集的7个任务上的性能

具有共享解码器的UniT模型的预测

结果表明,所提出的UniT 模型同时处理8个数据集上的7个任务,在统一的模型参数集下,每个任务都有较强的性能。强大的性能表明UniT有潜力成为一种领域未知的transformer 架构,向更通用的智能的目标迈进了一步。

原文标题:【多模态】来自Facebook AI的多任务多模态的统一Transformer:向更通用的智能迈出了一步

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296465
  • 人工智能
    +关注

    关注

    1813

    文章

    49734

    浏览量

    261459
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136227

原文标题:【多模态】来自Facebook AI的多任务多模态的统一Transformer:向更通用的智能迈出了一步

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ELLON合金电阻特性及广泛应用

    ELLON 合金电阻电子领域有着独特地位。它具备高精度、高稳定性等特性,广泛应用于电源与能源管理、电池管理系统等诸多领域。本文将深入解析 ELLON 合金电阻的相关知识,帮助您全面了
    的头像 发表于 12-01 15:37 39次阅读
    ELLON合金电阻特性及<b class='flag-5'>广泛应用</b>

    Lora技术应用领域

    1. 物联网应用:Lora技术的远距离传输特性使其物联网应用中得到广泛应用。通过Lora技术,可以实现智能城市、智能家居、智能农业等多种物联网应用,为人们的生活带来便利和舒适。 2. 工业控制
    发表于 11-26 08:10

    Transformer如何自动驾驶变得更聪明?

    ]自动驾驶中常提的Transformer本质上是一种神经网络结构,最早在自然语言处理里火起来。与卷积神经网络(CNN)或循环神经网络(RNN)不同,Transformer能够自动审视所有输入信息,并动态判断哪些部分更为关键,同时
    的头像 发表于 11-19 18:17 1897次阅读

    格灵深瞳多模态大模型Glint-ME图文互搜更精准

    电商、安防等场景下,图文互搜应用广泛。随着以CLIP为代表的多模态表征方法相继提出,过去单一模态搜索(文搜文、图搜图)被突破,模型可以同时理解文本、图像、音频乃至视频,实现跨
    的头像 发表于 11-02 15:56 1233次阅读
    格灵深瞳多<b class='flag-5'>模态</b>大模型Glint-ME<b class='flag-5'>让</b>图文互搜更精准

    滚珠导轨工业制造领域如何实现高效运行?

    工业制造领域中滚珠导轨凭借其高精度、低摩擦、高刚性等特点,被广泛应用多种设备和场景,并在设备性能中起着关键作用。
    的头像 发表于 09-02 17:52 546次阅读
    滚珠导轨<b class='flag-5'>在</b>工业制造<b class='flag-5'>领域</b>如何实现高效运行?

    自动驾驶中Transformer大模型会取代深度学习吗?

    持续讨论。特别是自动驾驶领域,部分厂商开始尝试将多模态大模型(MLLM)引入到感知、规划与决策系统,引发了“传统深度学习是否已过时”的激烈争论。然而,从技术原理、算力成本、安全需求与实际落地路径等维度来看,
    的头像 发表于 08-13 09:15 3916次阅读
    自动驾驶中<b class='flag-5'>Transformer</b>大模型会取代深度学习吗?

    Transformer架构概述

    由于Transformer模型的出现和快速发展,深度学习领域正在经历一场翻天覆地的变化。这些突破性的架构不仅重新定义了自然语言处理(NLP)的标准,而且拓宽了视野,彻底改变了AI的许多方面。
    的头像 发表于 06-10 14:24 941次阅读
    <b class='flag-5'>Transformer</b>架构概述

    LMS Test.Lab:振动噪声测试领域的全能王者

    、航空航天、机械制造、能源等行业,提供高精度的数据采集、信号处理模态分析、声学测试等功能。凭借其强大的硬件兼容性、灵活的软件架构和行业领先的算法,LMS Test.Lab 已成为工程测试领域的标杆
    发表于 04-23 15:25

    AI多模态在建筑业安全领域广泛应用# 智慧工地#人工智能

    人工智能
    jf_60804796
    发布于 :2025年04月16日 11:05:07

    高温氧气分析仪OXY-Flex工业领域广泛应用及技术解析

    高温氧气分析仪OXY-FLEX是一种专为精确测量空气或气体混合物中氧气浓度而设计的设备,广泛应用于控制燃烧、确保产品质量和提高不同工业应用的整体效率。其独特的氧化锆氧传感器设计使其能够极端温度
    的头像 发表于 02-20 09:24 701次阅读
    高温氧气分析仪OXY-Flex<b class='flag-5'>在</b>工业<b class='flag-5'>领域</b>的<b class='flag-5'>广泛应用</b>及技术解析

    圆形连接器的广泛应用场景及其优势

    现代工业和科技领域,圆形连接器因其独特的结构和性能优势,被广泛应用于各种场景。本文将详细介绍圆形连接器的主要应用场景及其优势,帮助您更好地理解其重要性。 1. 工业自动化 工业自动
    的头像 发表于 02-17 11:30 695次阅读

    如何使用MATLAB构建Transformer模型

    Transformer 模型 2017 年由 Vaswani 等人在论文《Attentionis All You Need》中首次提出。其设计初衷是为了解决自然语言处理(Nature
    的头像 发表于 02-06 10:21 5719次阅读
    如何使用MATLAB构建<b class='flag-5'>Transformer</b>模型

    Norflash闪存芯片HT25Q20D广泛应用在汽车电子领域

    全球NOR Flash市场由四家主要制造商主导,除巨头之外,还有华芯邦等厂商市场上也占有一席之地,主要为蓝牙、音频、WIFI等SoC主控芯片生产商供货,其产品广泛应用于各种消费电子品牌。例如HT25Q20D广泛应用在汽车电子
    的头像 发表于 01-13 15:20 1224次阅读
    Norflash闪存芯片HT25Q20D<b class='flag-5'>广泛应用</b>在汽车电子<b class='flag-5'>领域</b>

    领域广泛应用,DSP芯片市场有多大?

    从全球范围来看,在数字化应用越来越广的情况下,DSP芯片使用率处于增长态势。那么,DSP芯片目前市场情况如何? 随着通信、消费电子、人工智能等领域的快速发展,对数字信号处理技术的要求也越来越高
    的头像 发表于 12-12 10:28 1194次阅读
    多<b class='flag-5'>领域</b><b class='flag-5'>广泛应用</b>,DSP芯片市场有多大?

    智慧交通技术的广泛应用领域

    智慧交通 是一种结合了信息技术、通信技术和交通管理的创新模式,旨在提高城市交通系统的效率、安全性和可持续性。智慧交通技术各个领域广泛的运用范围,涵盖了城市交通管理、公共交通系统、道路安全、车辆
    的头像 发表于 12-11 11:51 1381次阅读