0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook推出新AI模型,希望给计算机视觉领域带来一次“革命”   

jf_f8pIz0xS 来源:贤集网 作者:AI新讯   2021-03-05 13:49 次阅读

3月5日消息,Facebook的研究人员推出了一种新的AI模型,该模型可以从网上任何未标记图像的中学习,这是一项突破,尽管该团队的研究仍处于早期阶段,但他们希望给计算机视觉领域带来一次“革命”。

该模型被称为SEER(SElf-SupERvised),被馈入了10亿张公开可用的Instagram图像,这些图像未经过手动标记。但是,即使没有通常在AI算法训练中使用的标签和注释,SEER仍能够自主地训练数据集,不断进行学习,并最终在诸如对象检测之类的任务上达到最高的准确性。

图片来自Facebook AI

这种被称为自监督学习(self-supervised learning)的方法在AI领域已经很成熟:它由可以直接从给定信息中学习的系统组成,而不必依赖经过仔细标记的数据集来教他们如何执行诸如识别照片中的对象或翻译文本之类的任务。

自监督式学习近来引起了很多关注,因为这意味着需要手工标记数据的工作要少很得,这对大多数研究人员而言是费时费力的工作。无需管理数据集的同时,自监督模型可以处理更大,更多样化的数据集。

在某些领域,特别是自然语言处理中,该方法已经取得了突破。在数量越来越多的未标记文本上训练算法已使诸如问答、机器翻译、自然语言推理等应用程序取得了进展。

相反,计算机视觉尚未完全进入自监督的学习革命。正如Facebook AI Research的软件工程师Priya Gopal解释的那样,SEER是该领域的首创。她告诉ZDNet:“与现有的在ImageNet数据集上训练的计算机视觉的自监督模型相比,SEER是第一个可以随机训练互联网上图像上的完全自监督的计算机视觉模型。”

ImageNet是一个大规模数据库,包含研究人员标记的数百万张图片,并向较大的计算机视觉社区开放,以促进AI的发展。

该项目的数据库被Facebook的研究人员用作评估SEER性能的基准,他们发现自监督模型在诸如低空拍摄、物体检测、分割和图像分类等任务上优于最新的监督AI系统。

Goyal说:“通过仅对随机图像进行训练,SEER优于现有的自监督模型。这一结果表明,我们不需要像ImageNet这样的高度精选的数据集,对随机图像的自监督学习就可以产生非常高质量的模型。”

随着自监督学习复杂度的提高,研究人员的工作并非没有挑战。在文本方面,AI模型的任务是为单词赋予含义。但是对于图像,该算法必须决定每个像素如何与一个概念相对应,同时考虑到其在不同图片中拍摄角度、视图和形状的差别。

换句话说,研究人员需要大量数据,并且需要一个能够从这种复杂的信息池中推导出所有可能的视觉概念。

为了完成此任务,Goyal和她的团队从Facebook AI在自监督学习中的现有工作中改编了一种新算法,称为SwAV,该算法将显示相似的图像聚集到单独的组中。科学家还设计了卷积网络,也就是一种深度学习算法,算法对人脑中神经元的连接模式进行建模,根据重要性分配给图像中的不同对象。

至少可以说,借助Instagram的10亿张图片的数据集,该系统的规模很大。Facebook的团队使用了具有32GB RAM的V100 Nvidia GPU,并且随着模型尺寸的增加,必须将模型放入可用的RAM中。但是Goyal解释说,进一步的研究将对确保计算功能适应新系统很有用。

“随着我们在越来越多的GPU上训练模型,这些GPU之间的通信需要快速进行。可以通过开发软件来解决给定的内存和运行时间带来的挑战。”她说。

尽管仍有许多工作要做,但是,在可以将SEER应用于现实世界的用例之前,Goyal认为不应低估该技术的影响。她说:“借助SEER,我们现在可以通过大量随机的互联网上的图像训练大型模型,在计算机视觉方面取得更大的进步。”

“这一突破可以实现计算机视觉的自监督学习革命,类似于我们在自然语言处理文本中所看到的。”

在Facebook内部,SEER可用于各种计算机视觉任务,从自动生成图像描述到帮助识别违反政策的内容。在公司外部,该技术还可用于图像和元数据有限的领域,例如医学成像

Facebook的团队呼吁开展更多工作,以将SEER推进到其下一阶段的开发。作为研究的一部分,该团队开发了一种基于PyTorch的全能库,用于自监督学习,称为VISSL,该库是开源的,鼓励更多的AI社区成员对该技术进行测试。

当被问及是否已通知Instagram用户使用其图像来训练SEER或用户是否有机会选择其图像不被用来学习时,Goyal指出,Facebook在其数据政策中告知Instagram帐户持有人,其使用图片等信息来支持研究,其中包括支持SEER的研究。也就是说,Facebook并不打算分享这些图片或SEER模型本身,部分原因是该模型可能包含无意识的偏见。

Facebook在一篇博客文章中写道:“自我监督学习一直是Facebook人工智能的重点,因为它使机器可以直接从世界上大量可用的信息中学习,而不仅仅是从专门为人工智能研究创建的训练数据中学习。就像在其他研究领域一样,自我监督学习对未来的计算机视觉有着不可思议的影响。消除了对人工注释和元数据的需要,使计算机视觉社区能够处理更大、更多样化的数据集,从随机公共图像中学习,并可能减轻数据管理中出现的一些偏见。自我监督学习还可以帮助在图像或元数据有限的领域(如医学成像)对模型进行专门研究。无需人工提前标记,模型可以更快地创建和部署,能够对快速变化的情况做出更快、更准确的反应。”
编辑:lyn

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26396

    浏览量

    264002
收藏 人收藏

    评论

    相关推荐

    【量子计算机重构未来 | 阅读体验】+量子计算机的原理究竟是什么以及有哪些应用

    计算方法的区别传统方法是,按照不走枚举所有情况,而量子计算一次处理所有情况,是步到位。但是这里又有疑惑了,量子计算如何实现的
    发表于 03-11 12:50

    【量子计算机重构未来 | 阅读体验】+ 初识量子计算机

    大语言模型训练会是个怎样的情景。。。。。。 希望量子计算机尽快走出实验室,能够早日进入寻常百姓家,更希望我国的量子
    发表于 03-05 17:37

    机器视觉、工业视觉计算机视觉这三者的关系

    机器视觉、工业视觉计算机视觉这三者的关系
    的头像 发表于 01-24 10:51 564次阅读
    机器<b class='flag-5'>视觉</b>、工业<b class='flag-5'>视觉</b>和<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>这三者的关系

    计算机视觉AI如何识别与理解图像

    计算机视觉是人工智能领域的一个重要分支,它致力于让机器能够像人类一样理解和解释图像。随着深度学习和神经网络的发展,人们对于如何让AI识别和理解图像产生了浓厚的兴趣。本文将探讨
    的头像 发表于 01-12 08:27 617次阅读
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>:<b class='flag-5'>AI</b>如何识别与理解图像

    最适合 AI 应用的计算机视觉类型是什么?

    计算机视觉是指为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 12-18 13:09 6851次阅读
    最适合 <b class='flag-5'>AI</b> 应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?

    什么是计算机视觉计算机视觉的三种方法

    计算机视觉是指通过为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 11-16 16:38 3108次阅读
    什么是<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>?<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的三种方法

    最适合AI应用的计算机视觉类型是什么?

    计算机视觉是指为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 11-15 16:38 232次阅读
    最适合<b class='flag-5'>AI</b>应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?

    STM32低功耗计算机视觉应用:后装智能无线抄表模型

    STM32低功耗计算机视觉应用:后装智能无线抄表模型
    的头像 发表于 09-21 17:55 515次阅读
    STM32低功耗<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>应用:后装智能无线抄表<b class='flag-5'>模型</b>

    人工智能计算机视觉方向是什么

    “看”并作出决策。 计算机视觉是人工智能领域的一大分支,是以计算机和数字图像处理技术为手段,通过对视觉信息的处理和分析来实现人工智能的各类应
    的头像 发表于 08-15 16:06 1184次阅读

    机器视觉计算机视觉的区别

    机器视觉计算机视觉的区别 机器视觉计算机视觉是两个相关但不同的概念。虽然许多人使用这两个术语
    的头像 发表于 08-09 16:51 1109次阅读

    计算机视觉是什么 计算机视觉历史及发展趋势

    正像其它学科一样,一个大量人员研究了多年的学科,却很难给出一个严格的定义,模式识别如此,目前火热的人工智能如此,计算机视觉亦如此。与计算机视觉密切相关的概念有
    发表于 07-20 15:41 0次下载

    计算机视觉的概念和主要任务

    作为人工智能的关键领域之一的计算机视觉近期再次成为了热点,那么你真的了解什么是计算机视觉吗?
    的头像 发表于 07-17 11:20 879次阅读

    浅谈深度学习在计算机视觉领域的三大瓶颈

    深度学习能够实现的前提是大量经过标注的数据,这使得计算机视觉领域的研究人员倾向于在数据资源丰富的领域搞研究,而不是去重要的领域搞研究。
    发表于 06-11 10:22 266次阅读
    浅谈深度学习在<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b><b class='flag-5'>领域</b>的三大瓶颈

    什么是机器视觉?机器视觉计算机有什么关系?

    机器视觉计算机视觉有什么区别
    的头像 发表于 06-05 09:28 854次阅读
    什么是机器<b class='flag-5'>视觉</b>?机器<b class='flag-5'>视觉</b>与<b class='flag-5'>计算机</b>有什么关系?

    计算机视觉相关概念总结

    为了帮助同事和客户了解更多有关计算机视觉AI的更多信息,我们言简意赅介绍一些计算机视觉AI
    的头像 发表于 05-31 10:11 512次阅读