0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Facebook推出新AI模型,希望给计算机视觉领域带来一次“革命”   

jf_f8pIz0xS 来源:贤集网 作者:AI新讯   2021-03-05 13:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

3月5日消息,Facebook的研究人员推出了一种新的AI模型,该模型可以从网上任何未标记图像的中学习,这是一项突破,尽管该团队的研究仍处于早期阶段,但他们希望给计算机视觉领域带来一次“革命”。

该模型被称为SEER(SElf-SupERvised),被馈入了10亿张公开可用的Instagram图像,这些图像未经过手动标记。但是,即使没有通常在AI算法训练中使用的标签和注释,SEER仍能够自主地训练数据集,不断进行学习,并最终在诸如对象检测之类的任务上达到最高的准确性。

图片来自Facebook AI

这种被称为自监督学习(self-supervised learning)的方法在AI领域已经很成熟:它由可以直接从给定信息中学习的系统组成,而不必依赖经过仔细标记的数据集来教他们如何执行诸如识别照片中的对象或翻译文本之类的任务。

自监督式学习近来引起了很多关注,因为这意味着需要手工标记数据的工作要少很得,这对大多数研究人员而言是费时费力的工作。无需管理数据集的同时,自监督模型可以处理更大,更多样化的数据集。

在某些领域,特别是自然语言处理中,该方法已经取得了突破。在数量越来越多的未标记文本上训练算法已使诸如问答、机器翻译、自然语言推理等应用程序取得了进展。

相反,计算机视觉尚未完全进入自监督的学习革命。正如Facebook AI Research的软件工程师Priya Gopal解释的那样,SEER是该领域的首创。她告诉ZDNet:“与现有的在ImageNet数据集上训练的计算机视觉的自监督模型相比,SEER是第一个可以随机训练互联网上图像上的完全自监督的计算机视觉模型。”

ImageNet是一个大规模数据库,包含研究人员标记的数百万张图片,并向较大的计算机视觉社区开放,以促进AI的发展。

该项目的数据库被Facebook的研究人员用作评估SEER性能的基准,他们发现自监督模型在诸如低空拍摄、物体检测、分割和图像分类等任务上优于最新的监督AI系统。

Goyal说:“通过仅对随机图像进行训练,SEER优于现有的自监督模型。这一结果表明,我们不需要像ImageNet这样的高度精选的数据集,对随机图像的自监督学习就可以产生非常高质量的模型。”

随着自监督学习复杂度的提高,研究人员的工作并非没有挑战。在文本方面,AI模型的任务是为单词赋予含义。但是对于图像,该算法必须决定每个像素如何与一个概念相对应,同时考虑到其在不同图片中拍摄角度、视图和形状的差别。

换句话说,研究人员需要大量数据,并且需要一个能够从这种复杂的信息池中推导出所有可能的视觉概念。

为了完成此任务,Goyal和她的团队从Facebook AI在自监督学习中的现有工作中改编了一种新算法,称为SwAV,该算法将显示相似的图像聚集到单独的组中。科学家还设计了卷积网络,也就是一种深度学习算法,算法对人脑中神经元的连接模式进行建模,根据重要性分配给图像中的不同对象。

至少可以说,借助Instagram的10亿张图片的数据集,该系统的规模很大。Facebook的团队使用了具有32GB RAM的V100 Nvidia GPU,并且随着模型尺寸的增加,必须将模型放入可用的RAM中。但是Goyal解释说,进一步的研究将对确保计算功能适应新系统很有用。

“随着我们在越来越多的GPU上训练模型,这些GPU之间的通信需要快速进行。可以通过开发软件来解决给定的内存和运行时间带来的挑战。”她说。

尽管仍有许多工作要做,但是,在可以将SEER应用于现实世界的用例之前,Goyal认为不应低估该技术的影响。她说:“借助SEER,我们现在可以通过大量随机的互联网上的图像训练大型模型,在计算机视觉方面取得更大的进步。”

“这一突破可以实现计算机视觉的自监督学习革命,类似于我们在自然语言处理文本中所看到的。”

在Facebook内部,SEER可用于各种计算机视觉任务,从自动生成图像描述到帮助识别违反政策的内容。在公司外部,该技术还可用于图像和元数据有限的领域,例如医学成像

Facebook的团队呼吁开展更多工作,以将SEER推进到其下一阶段的开发。作为研究的一部分,该团队开发了一种基于PyTorch的全能库,用于自监督学习,称为VISSL,该库是开源的,鼓励更多的AI社区成员对该技术进行测试。

当被问及是否已通知Instagram用户使用其图像来训练SEER或用户是否有机会选择其图像不被用来学习时,Goyal指出,Facebook在其数据政策中告知Instagram帐户持有人,其使用图片等信息来支持研究,其中包括支持SEER的研究。也就是说,Facebook并不打算分享这些图片或SEER模型本身,部分原因是该模型可能包含无意识的偏见。

Facebook在一篇博客文章中写道:“自我监督学习一直是Facebook人工智能的重点,因为它使机器可以直接从世界上大量可用的信息中学习,而不仅仅是从专门为人工智能研究创建的训练数据中学习。就像在其他研究领域一样,自我监督学习对未来的计算机视觉有着不可思议的影响。消除了对人工注释和元数据的需要,使计算机视觉社区能够处理更大、更多样化的数据集,从随机公共图像中学习,并可能减轻数据管理中出现的一些偏见。自我监督学习还可以帮助在图像或元数据有限的领域(如医学成像)对模型进行专门研究。无需人工提前标记,模型可以更快地创建和部署,能够对快速变化的情况做出更快、更准确的反应。”
编辑:lyn

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38171

    浏览量

    296892
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    蔚来出席CNCC 2025中国计算机大会技术论坛

    2025年10月23日,CNCC 2025中国计算机大会技术论坛「AI落地应用的主战场——智能电动汽车」在哈尔滨成功举行。论坛聚焦计算机技术与汽车产业的深度融合,汇聚产业界与学术界顶尖专家,围绕世界
    的头像 发表于 10-27 15:47 318次阅读

    NVIDIA DGX Spark桌面AI计算机开启预订

    DGX Spark 现已开启预订!丽台科技作为 NVIDIA 授权分销商,提供从产品到服务的站式解决方案,助力轻松部署桌面 AI 计算机
    的头像 发表于 09-23 17:20 939次阅读
    NVIDIA DGX Spark桌面<b class='flag-5'>AI</b><b class='flag-5'>计算机</b>开启预订

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    保持停滞的情况下,依照目前计算机的能耗效率,至少还需要30年的努力才接近其水准,见图1所示。 图1 大脑与计算机的能量效率对比 图2 类脑芯片的前瞻性研究领域AI湿件 为此,
    发表于 09-06 19:12

    任正非说 AI已经确定是第四工业革命 那么如何从容地加入进来呢?

    和实践项目经验。 考取相关的专业认证,如人工智能工程师认证等。这些认证可以证明自己在AI领域的知识水平,也有助于在求职或者参与相关项目时增加竞争力。 跨学科知识积累 结合计算机科学、物理学、生物学等
    发表于 07-08 17:44

    NVIDIA驱动的现代超级计算机如何突破速度极限并推动科学发展

    现代高性能计算不仅使得更快的计算成为可能,它正驱动着 AI 系统解锁更多领域的科学突破。 高性能计算经历了多次迭代,每
    的头像 发表于 06-26 19:39 987次阅读
    NVIDIA驱动的现代超级<b class='flag-5'>计算机</b>如何突破速度极限并推动科学发展

    文带你了解工业计算机尺寸

    工业计算机是现代自动化、人工智能(AI)和边缘计算的支柱。这些坚固耐用的系统旨在承受恶劣的环境,同时为关键应用提供可靠的性能。然而,由于有这么多可用的外形尺寸,为您的工业计算机选择合适
    的头像 发表于 04-24 13:35 795次阅读
    <b class='flag-5'>一</b>文带你了解工业<b class='flag-5'>计算机</b>尺寸

    软通计算机重磅发布DeepSeek大模型体机产品

    3月20日,华为中国合作伙伴大会2025在深圳盛大启幕。大会上,软通计算机重磅发布了“DeepSeek大模型体机产品”,为用户提供站式的AI
    的头像 发表于 03-22 10:40 1344次阅读
    软通<b class='flag-5'>计算机</b>重磅发布DeepSeek大<b class='flag-5'>模型</b><b class='flag-5'>一</b>体机产品

    NVIDIA GTC2025 亮点 NVIDIA推出 DGX Spark个人AI计算机

    台式超级计算机由 NVIDIA Grace Blackwell 驱动,为开发者、研究人员和数据科学家提供加速 AI 功能;系统由头部计算机制造商(包括华硕、Dell Technologies、HP
    的头像 发表于 03-20 18:59 1283次阅读
    NVIDIA GTC2025 亮点  NVIDIA<b class='flag-5'>推出</b> DGX Spark个人<b class='flag-5'>AI</b><b class='flag-5'>计算机</b>

    NVIDIA 宣布推出 DGX Spark 个人 AI 计算机

    的 DGX™ 个人 AI 超级计算机。   DGX Spark(前身为 Project DIGITS)支持 AI 开发者、研究人员、数据科学家和学生,在台式电脑上对大模型进行原型设计、
    发表于 03-19 09:59 504次阅读
       NVIDIA 宣布<b class='flag-5'>推出</b> DGX Spark 个人 <b class='flag-5'>AI</b> <b class='flag-5'>计算机</b>

    英飞凌边缘AI平台通过Ultralytics YOLO模型增加对计算机视觉的支持

    计算机视觉的支持,扩大了当前对音频、雷达和其他时间序列信号数据的支持范围。在增加这项支持后,该平台将能够用于开发低功耗、低内存的边缘AI视觉模型
    的头像 发表于 03-11 15:11 661次阅读
    英飞凌边缘<b class='flag-5'>AI</b>平台通过Ultralytics YOLO<b class='flag-5'>模型</b>增加对<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的支持

    虹软推出新一视觉模型ArcMuse 2025 V1.1

    模型从最初的“不计成本”探索,到如今的“可持续”商业化落地,经历了从技术突破到工程优化,再到产业融合的深度演进。在这过程中,虹软始终走在创新前沿,依托深厚的视觉AI技术积累,以Ar
    的头像 发表于 03-05 17:19 1400次阅读

    Arm KleidiCV与OpenCV集成助力移动端计算机视觉性能优化

    生成式及多模态人工智能 (AI) 工作负载的广泛增长,推动了对计算机视觉 (CV) 技术日益高涨的需求。此类技术能够解释并分析源自现实世界的视觉信息,并可应用于人脸识别、照片分类、滤镜
    的头像 发表于 02-24 10:15 885次阅读

    NVIDIA推出个人AI超级计算机Project DIGITS

    NVIDIA 推出个人 AI 超级计算机 NVIDIA Project DIGITS,全球的 AI 研究员、数据科学家和学生都可获取 NVIDIA Grace Blackwell 平台
    的头像 发表于 01-08 11:03 1163次阅读

    NVIDIA 推出高性价比的生成式 AI 超级计算机

    Jetson Orin Nano Super 可将生成式 AI 性能提升至1.7 倍,支持科技爱好者、开发者和学生使用的主流模型。     NVIDIA 推出款全新的尺寸小巧的生成
    发表于 12-18 17:01 950次阅读
    NVIDIA <b class='flag-5'>推出</b>高性价比的生成式 <b class='flag-5'>AI</b> 超级<b class='flag-5'>计算机</b>

    云端超级计算机使用教程

    云端超级计算机种基于云计算的高性能计算服务,它将大量计算资源和存储资源集中在起,通过网络向
    的头像 发表于 12-17 10:19 963次阅读