0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook推出新AI模型,希望给计算机视觉领域带来一次“革命”   

jf_f8pIz0xS 来源:贤集网 作者:AI新讯   2021-03-05 13:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

3月5日消息,Facebook的研究人员推出了一种新的AI模型,该模型可以从网上任何未标记图像的中学习,这是一项突破,尽管该团队的研究仍处于早期阶段,但他们希望给计算机视觉领域带来一次“革命”。

该模型被称为SEER(SElf-SupERvised),被馈入了10亿张公开可用的Instagram图像,这些图像未经过手动标记。但是,即使没有通常在AI算法训练中使用的标签和注释,SEER仍能够自主地训练数据集,不断进行学习,并最终在诸如对象检测之类的任务上达到最高的准确性。

图片来自Facebook AI

这种被称为自监督学习(self-supervised learning)的方法在AI领域已经很成熟:它由可以直接从给定信息中学习的系统组成,而不必依赖经过仔细标记的数据集来教他们如何执行诸如识别照片中的对象或翻译文本之类的任务。

自监督式学习近来引起了很多关注,因为这意味着需要手工标记数据的工作要少很得,这对大多数研究人员而言是费时费力的工作。无需管理数据集的同时,自监督模型可以处理更大,更多样化的数据集。

在某些领域,特别是自然语言处理中,该方法已经取得了突破。在数量越来越多的未标记文本上训练算法已使诸如问答、机器翻译、自然语言推理等应用程序取得了进展。

相反,计算机视觉尚未完全进入自监督的学习革命。正如Facebook AI Research的软件工程师Priya Gopal解释的那样,SEER是该领域的首创。她告诉ZDNet:“与现有的在ImageNet数据集上训练的计算机视觉的自监督模型相比,SEER是第一个可以随机训练互联网上图像上的完全自监督的计算机视觉模型。”

ImageNet是一个大规模数据库,包含研究人员标记的数百万张图片,并向较大的计算机视觉社区开放,以促进AI的发展。

该项目的数据库被Facebook的研究人员用作评估SEER性能的基准,他们发现自监督模型在诸如低空拍摄、物体检测、分割和图像分类等任务上优于最新的监督AI系统。

Goyal说:“通过仅对随机图像进行训练,SEER优于现有的自监督模型。这一结果表明,我们不需要像ImageNet这样的高度精选的数据集,对随机图像的自监督学习就可以产生非常高质量的模型。”

随着自监督学习复杂度的提高,研究人员的工作并非没有挑战。在文本方面,AI模型的任务是为单词赋予含义。但是对于图像,该算法必须决定每个像素如何与一个概念相对应,同时考虑到其在不同图片中拍摄角度、视图和形状的差别。

换句话说,研究人员需要大量数据,并且需要一个能够从这种复杂的信息池中推导出所有可能的视觉概念。

为了完成此任务,Goyal和她的团队从Facebook AI在自监督学习中的现有工作中改编了一种新算法,称为SwAV,该算法将显示相似的图像聚集到单独的组中。科学家还设计了卷积网络,也就是一种深度学习算法,算法对人脑中神经元的连接模式进行建模,根据重要性分配给图像中的不同对象。

至少可以说,借助Instagram的10亿张图片的数据集,该系统的规模很大。Facebook的团队使用了具有32GB RAM的V100 Nvidia GPU,并且随着模型尺寸的增加,必须将模型放入可用的RAM中。但是Goyal解释说,进一步的研究将对确保计算功能适应新系统很有用。

“随着我们在越来越多的GPU上训练模型,这些GPU之间的通信需要快速进行。可以通过开发软件来解决给定的内存和运行时间带来的挑战。”她说。

尽管仍有许多工作要做,但是,在可以将SEER应用于现实世界的用例之前,Goyal认为不应低估该技术的影响。她说:“借助SEER,我们现在可以通过大量随机的互联网上的图像训练大型模型,在计算机视觉方面取得更大的进步。”

“这一突破可以实现计算机视觉的自监督学习革命,类似于我们在自然语言处理文本中所看到的。”

在Facebook内部,SEER可用于各种计算机视觉任务,从自动生成图像描述到帮助识别违反政策的内容。在公司外部,该技术还可用于图像和元数据有限的领域,例如医学成像

Facebook的团队呼吁开展更多工作,以将SEER推进到其下一阶段的开发。作为研究的一部分,该团队开发了一种基于PyTorch的全能库,用于自监督学习,称为VISSL,该库是开源的,鼓励更多的AI社区成员对该技术进行测试。

当被问及是否已通知Instagram用户使用其图像来训练SEER或用户是否有机会选择其图像不被用来学习时,Goyal指出,Facebook在其数据政策中告知Instagram帐户持有人,其使用图片等信息来支持研究,其中包括支持SEER的研究。也就是说,Facebook并不打算分享这些图片或SEER模型本身,部分原因是该模型可能包含无意识的偏见。

Facebook在一篇博客文章中写道:“自我监督学习一直是Facebook人工智能的重点,因为它使机器可以直接从世界上大量可用的信息中学习,而不仅仅是从专门为人工智能研究创建的训练数据中学习。就像在其他研究领域一样,自我监督学习对未来的计算机视觉有着不可思议的影响。消除了对人工注释和元数据的需要,使计算机视觉社区能够处理更大、更多样化的数据集,从随机公共图像中学习,并可能减轻数据管理中出现的一些偏见。自我监督学习还可以帮助在图像或元数据有限的领域(如医学成像)对模型进行专门研究。无需人工提前标记,模型可以更快地创建和部署,能够对快速变化的情况做出更快、更准确的反应。”
编辑:lyn

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    42023

    浏览量

    303097
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    工业边缘计算机是什么?有什么推荐?

    。以下介绍几个工业边缘计算机品牌(不分先后),大家些参考: 1. 西门子 —— 数字化工厂的工业边缘生态标杆 作为自动化领域的巨头,西门子推出
    的头像 发表于 05-22 14:57 120次阅读
    工业边缘<b class='flag-5'>计算机</b>是什么?有什么推荐?

    华北工控正式推出电力巡检机器人专用AI计算机方案

    近期,华北工控(NORCO)正式推出电力巡检机器人专用AI计算机方案——嵌入式AI主板 **MITX-6155** ,并提供全方位定制生产与服务。这款170mm×170mm的紧凑型主板
    的头像 发表于 05-15 10:01 1757次阅读

    计算机专业408考研科目

    408 跨考零基础:三个月入门到精通路线 站在2026年的节点回望,计算机考研408(计算机学科专业基础综合)早已超越了单纯的知识点考核,它更像是场对逻辑思维与系统观的深度洗礼。对于跨考且零基
    发表于 04-11 16:44

    传音相关研究成果入选计算机视觉顶会CVPR 2026

    (Mohamed bin Zayed University of Artificial Intelligence,简称MBZUAI)联合开展的“拍照解题”项目研究取得重要进展,相关成果论文已被计算机视觉领域的国际顶级学术会议CV
    的头像 发表于 04-03 17:45 3081次阅读
    传音相关研究成果入选<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>顶会CVPR 2026

    奕行智能论文入选国际计算机体系结构顶级会议 ISCA 2026

    ISCA 2026(International Symposium on Computer Architecture,国际计算机体系结构年会)。 ISCA 创立于 1973 年,是计算机体系结构领域最权威
    的头像 发表于 04-01 15:24 587次阅读
    奕行智能论文入选国际<b class='flag-5'>计算机</b>体系结构顶级会议 ISCA 2026

    十进制计算机硬件体系结构及“独值”量化逻辑运算革命

    采用“独值”量化逻辑理论设计十进制数字计算机,十进制网络计算机,十进制模拟计算机,十进制模糊计算机,实现计算机类型多样化,
    的头像 发表于 01-29 09:13 1192次阅读
    十进制<b class='flag-5'>计算机</b>硬件体系结构及“独值”量化逻辑运算<b class='flag-5'>革命</b>(<b class='flag-5'>一</b>)

    上海计算机视觉企业行学术沙龙走进西井科技

    12月5日,由中国图象图形学学会青年工作委员会(下简称“青工委”)、上海市计算机学会计算机视觉专委会(下简称“专委会”)联合主办,上海西井科技股份有限公司、江苏路街道商会承办的“上海计算机
    的头像 发表于 12-16 15:39 810次阅读

    使用代理式AI激活传统计算机视觉系统的三种方法

    当前的计算机视觉系统擅长于识别物理空间与流程中的事件,却难以诠释场景细节及其意义,也无法推理后续可能发生的情况。
    的头像 发表于 12-01 09:44 855次阅读

    蔚来出席CNCC 2025中国计算机大会技术论坛

    2025年10月23日,CNCC 2025中国计算机大会技术论坛「AI落地应用的主战场——智能电动汽车」在哈尔滨成功举行。论坛聚焦计算机技术与汽车产业的深度融合,汇聚产业界与学术界顶尖专家,围绕世界
    的头像 发表于 10-27 15:47 836次阅读

    NVIDIA DGX Spark桌面AI计算机开启预订

    DGX Spark 现已开启预订!丽台科技作为 NVIDIA 授权分销商,提供从产品到服务的站式解决方案,助力轻松部署桌面 AI 计算机
    的头像 发表于 09-23 17:20 1646次阅读
    NVIDIA DGX Spark桌面<b class='flag-5'>AI</b><b class='flag-5'>计算机</b>开启预订

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    保持停滞的情况下,依照目前计算机的能耗效率,至少还需要30年的努力才接近其水准,见图1所示。 图1 大脑与计算机的能量效率对比 图2 类脑芯片的前瞻性研究领域AI湿件 为此,
    发表于 09-06 19:12

    【作品合集】赛昉科技VisionFive 2单板计算机开发板测评

    VisionFive 2 上为目标检测准备软件环境并运行 MobileNet-SSD 模型【VisionFive 2单板计算机试用体验】VisionFive 2复古游戏机改造 作者:TLLED【VisionFive 2
    发表于 09-04 09:08

    易控智驾荣获计算机视觉顶会CVPR 2025认可

    近日,2025年国际计算机视觉与模式识别顶级会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美国田纳西州纳什维尔召开。
    的头像 发表于 07-29 16:54 1486次阅读

    任正非说 AI已经确定是第四工业革命 那么如何从容地加入进来呢?

    和实践项目经验。 考取相关的专业认证,如人工智能工程师认证等。这些认证可以证明自己在AI领域的知识水平,也有助于在求职或者参与相关项目时增加竞争力。 跨学科知识积累 结合计算机科学、物理学、生物学等
    发表于 07-08 17:44

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    现代高性能计算不仅使得更快的计算成为可能,它正驱动着 AI 系统解锁更多领域的科学突破。 高性能计算经历了多次迭代,每
    的头像 发表于 06-26 19:39 1495次阅读
    NVIDIA驱动的现代超级<b class='flag-5'>计算机</b>如何突破速度极限并推动科学发展