0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新研究推动了多模式学习的最新发展

倩倩 来源:文财网 作者:文财网 2021-01-25 09:33 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

与大多数AI系统不同,人类在上下文中一起理解文本,视频,音频和图像的含义。例如,给定文本和图像,当它们分开看时似乎是无害的(例如,“看有多少人爱你”和一张荒芜的沙漠图片),人们就会认识到,这些元素在配对或配对时具有潜在的有害含义。并列。

尽管能够进行这些多模式推断的系统仍然遥不可及,但是已经取得了进步。过去一年中的新研究推动了多模式学习的最新发展,特别是在视觉问题解答(VQA)子领域,这是一种计算机视觉任务,其中向系统提供有关图像和图像的基于文本的问题。必须推断答案。事实证明,多模式学习可以承载互补的信息或趋势,只有当它们全部包含在学习过程中时,这些信息或趋势才会变得明显。这为从字幕到将漫画书翻译成不同语言的应用程序带来了希望。

在多模式系统中,计算机视觉和自然语言处理模型在数据集上一起训练,以学习组合的嵌入空间,或由代表图像,文本和其他媒体的特定特征的变量占据的空间。如果将不同的单词与相似的图像配对,则这些单词很可能用来描述相同的事物或对象,而如果某些单词出现在不同的图像旁边,则表示这些图像表示相同的对象。那么,多模式系统应该有可能从文本描述中预测诸如图像对象之类的东西,并且大量的学术文献已经证明是这种情况。

仅存在一个问题:众所周知,多峰系统会吸收数据集中的偏差。VQA等任务中涉及的问题和概念的多样性,以及缺乏高质量的数据,通常会使模型无法学习到“推理”,从而导致他们依靠数据集统计信息做出有根据的猜测。

关键见解可能在于Orange实验室和里昂国家应用科学研究院的科学家开发的基准测试。他们声称测量VQA模型准确性的标准度量标准具有误导性,因此提供了替代方法GQA-OOD,它可以评估无法推理得出的问题的表现。在一项涉及7个VQA模型和3种减少偏见的技术的研究中,研究人员发现这些模型未能解决涉及频率不高的概念的问题,这表明该领域需要开展工作。

该解决方案可能涉及更大,更全面的培训数据集。巴黎ÉcoleNormaleSupérieure的工程师,巴黎Inria巴黎以及捷克的信息学,机器人技术和控制论研究所的工程师发表的一篇论文提出了一个VQA数据集,该数据集是由数百万个旁白的视频创建的。研究人员称,该数据集由转录视频中自动生成的问题和答案对组成,消除了手动注释的需要,同时可以在流行的基准上实现出色的性能。(大多数机器学习模型学会根据自动或手工标记的数据做出预测。)

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 应用程序
    +关注

    关注

    38

    文章

    3346

    浏览量

    60421
  • 计算机视觉
    +关注

    关注

    9

    文章

    1715

    浏览量

    47723
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26261
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    骐俊物联共同推动物联网产业创新发展

    日前,工信部等九部门联合印发《推动物联网产业创新发展行动方案(2026—2028年)》,明确提出到2028年,物联网核心产业规模将突破3.5万亿元,终端连接数向百亿级迈进。这不仅为行业指明了方向,也为广大物联网从业者与数字化转型企业带来了
    的头像 发表于 04-10 09:33 236次阅读

    Gitee成为首批高端工业软件创新发展领航计划供应链安全号成员单位

    1月27日,国家工业信息安全发展研究中心(以下简称「中心」)在北京举办 2026 年高端工业软件生态创新发展思想汇。
    的头像 发表于 02-06 14:59 676次阅读

    闻泰科技荣膺“2025好公司50”创新发展大奖

    荣获“创新发展大奖”,标志着业界对闻泰科技“创新驱动+市场引领”双轮发展模式的高度认可。面向未来,公司将继续坚持以研发夯实根基、以市场为导向,持续为客户提供更具竞争力的价值,推动产业链
    的头像 发表于 12-25 09:38 577次阅读

    深兰科技亮相2025浦东新区产业智能化创新发展年度活动

    2025年11月21日,由上海市浦东新区科经委与浦东新区产业发展促进中心主办的 “2025浦东新区产业智能化创新发展年度活动” 在浙江大学上海高等研究院隆重举行,大会聚焦人工智能驱动的产业创新方向。
    的头像 发表于 11-27 11:53 520次阅读

    华为张磊出席第三届网络创新发展大会

    在第三届网络创新发展大会期间,华为数据通信业务规划高级专家(首席)张磊发表“智能体互联网架构与关键技术”主题演讲,旨在推动网络从“连接信息”向“连接智能”升级,支持千亿级智能体自主协作,重塑家庭、金融、医疗等领域的数字化服务。
    的头像 发表于 11-12 11:16 973次阅读

    碳化硅衬底 TTV 厚度测量技术的最新发展趋势与未来展望

    摘要 本文聚焦碳化硅衬底晶圆总厚度变化(TTV)厚度测量技术,剖析其在精度提升、设备小型化及智能化测量等方面的最新发展趋势,并对未来在新兴应用领域的拓展及推动半导体产业发展的前景进行展望,为行业技术
    的头像 发表于 09-01 11:58 1207次阅读
    碳化硅衬底 TTV 厚度测量技术的最<b class='flag-5'>新发展</b>趋势与未来展望

    研发品质零妥协,推动医疗器械创新发展

    近日,国家药监局正式发布“关于发布优化全生命周期监管支持高端医疗器械创新发展有关举措的公告”,提出了包含强化医疗器械上市后质量安全监测等10项关键举措,加强全生命周期监管,全力支持高端医疗器械创新发展
    的头像 发表于 07-24 15:14 5065次阅读
    研发品质零妥协,<b class='flag-5'>推动</b>医疗器械创<b class='flag-5'>新发展</b>

    摩川编码器助力木工机械创新发展

    在木工机械领域,精度、效率和可靠性是衡量设备性能的关键指标。随着科技的不断进步,木工机械也在朝着更加智能化、精准化的方向发展。而摩川编码器作为一种关键的测量和控制元件,正为木工机械的创新发展注入新的活力。
    的头像 发表于 07-21 17:17 800次阅读

    商汤科技荣登福布斯中国可持续创新发展企业榜单

    近日,2024-2025福布斯中国可持续发展工业企业系列评选结果正式发布。商汤凭借在环境保护、社会价值、企业管治等方面的卓越实践成功入选2024-2025福布斯中国可持续创新发展企业榜单,成为人工智能领域唯一入选企业。
    的头像 发表于 07-03 18:20 1204次阅读

    达实智能亮相2025年广东智能制造创新发展大会

    近日,“2025 年广东智能制造创新发展大会”在广州举办。达实智能董事长刘磅受邀前往大会现场,分享基于达实智能大厦的“AI+物联网”智慧园区的创新方案。
    的头像 发表于 07-03 15:32 1108次阅读

    格创东智亮相第三届软件创新发展大会

    近日,由武汉市人民政府、湖北省经济和信息化厅主办的第三届软件创新发展大会(以下简称“大会”)在武汉光谷举行。
    的头像 发表于 06-17 16:52 1236次阅读

    软通动力亮相第三届软件创新发展大会

    近日,由武汉市人民政府、湖北省经济和信息化厅主办的第三届软件创新发展大会在武汉开幕。软通动力董事兼首席技术官刘会福受邀出席主论坛,并发表题为“软硬一体全栈智能创新发展之势”的主题演讲,深入剖析了当前时代中国软件产业的变革趋势,分享了软通动力在“软硬一体全栈智能”领域的创新
    的头像 发表于 06-17 15:41 1121次阅读

    Vicor邀您相约2025中国国际低空经济产业创新发展大会

    Vicor 将在 2025 中国国际低空经济产业创新发展大会上展示 eVTOL 800V 平台 DC-DC 解决方案。
    的头像 发表于 06-03 17:40 1037次阅读

    ALVA亮相雄安新区RISC-V产业创新发展大会

    近日,雄安新区 RISC-V 产业创新发展大会在雄安国际酒店会议中心隆重举行。
    的头像 发表于 05-30 15:48 886次阅读

    踏歌智行亮相2025专用车产业创新发展大会暨专用车科技展

    近日,踏歌智行受邀参加中国电动汽车百人会专用车产业创新发展大会暨专用车科技展(2025)。
    的头像 发表于 05-20 14:45 1282次阅读