0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Meta开源I-JEPA,“类人”AI模型

OSC开源社区 来源:OSC开源社区 2023-06-18 17:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Meta宣布推出一个全新的AI 模型Image Joint Embedding Predictive Architecture (I-JEPA),可通过对图像的自我监督学习来学习世界的抽象表征,实现比现有模型更准确地分析和完成未完成的图像。

目前相关的训练代码和模型已开源,I-JEPA 论文则计划在下周的 CVPR 2023 上发表。

根据介绍,I-JEPA 结合了 Meta 首席 AI 科学家 Yann LeCun 所提倡的类人推理方式,帮助避免 AI 生成图像常见的一些错误,比如多出的手指。

I-JEPA 在多项计算机视觉任务上表现出色,且计算效率比其他广泛使用的计算机视觉模型高得多。

I-JEPA 学习的表征也可以用于许多不同的应用程序,而无需进行大量微调。

例如,项目团队在 72 小时内使用 16 个 A100 GPU 训练了一个 632M 参数的视觉转换器模型,I-JEPA 在 ImageNet 上的 low-shot 分类中性能表现最优,每个类只有 12 个标记示例。

其他方法通常需要 2 到 10 倍的 GPU 时间,并且在用相同数量的数据进行训练时错误率更高。 I-JEPA 背后的想法是以更类似于人类一般理解的抽象表示来预测缺失的信息。

I-JEPA 使用抽象的预测目标,潜在地消除了不必要的 pixel-level 细节,从而使模型学习更多语义特征。

另一个引导 I-JEPA 产生语义表征的核心设计选择是多块掩码策略。

具体来说,项目团队证明了使用信息丰富的(空间分布的)上下文来预测包含语义信息(具有足够大的规模)的大块的重要性。

e452d002-0c36-11ee-962d-dac502259ad0.png

I-JEPA 中的预测器可以看作是一个原始的(和受限的)世界模型,它能够从部分可观察的上下文中模拟静态图像中的空间不确定性。

更重要的是,这个世界模型是语义的,因为它预测图像中不可见区域的高级信息,而不是 pixel-level 细节。

e46f3b5c-0c36-11ee-962d-dac502259ad0.png

为了解模型捕获的内容,团队还训练了一个随机解码器,将 I-JEPA 预测的表征映射回像素空间。

这种定性评估表明该模型正确地捕获了位置不确定性并生成了具有正确姿势的高级对象部分(例如,狗的头、狼的前腿)。

简而言之,I-JEPA 能够学习对象部分的高级表示,而不会丢弃它们在图像中的局部位置信息。

e49929f8-0c36-11ee-962d-dac502259ad0.pnge4b3ea04-0c36-11ee-962d-dac502259ad0.png





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 转换器
    +关注

    关注

    27

    文章

    9365

    浏览量

    155076
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134428
  • 计算机视觉
    +关注

    关注

    9

    文章

    1714

    浏览量

    47446

原文标题:Meta开源I-JEPA,“类人” AI 模型

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    成都汇阳投资关于国产开源模型持续突破,国产AI 竞争力增强

           国产开源模型领跑 ,AI 生态有望加速繁荣 根据独立 AI 基准测试与分析平台 Artificial Analysis 最新榜单 , 国产
    的头像 发表于 11-24 14:01 166次阅读

    AI模型的配置AI模型该怎么做?

    STM32可以跑AI,这个AI模型怎么搞,知识盲区
    发表于 10-14 07:14

    NVIDIA 利用全新开源模型与仿真库加速机器研发进程

    科研人员及开发者打造功能更强大、适应性更强的机器。   全新的 NVIDIA Isaac GR00T 开源基础模型将为机器赋予接近人类的推理能力,使其能够拆解复杂指令,并借助已有知
    的头像 发表于 09-30 09:52 2782次阅读
    NVIDIA 利用全新<b class='flag-5'>开源</b><b class='flag-5'>模型</b>与仿真库加速机器<b class='flag-5'>人</b>研发进程

    MetaAI之路,为何节节败退?

    如果继续自乱阵脚,MetaAI黄昏或许将正式到来
    的头像 发表于 07-23 13:48 2383次阅读
    <b class='flag-5'>Meta</b>的<b class='flag-5'>AI</b>之路,为何节节败退?

    大象机器携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品

    全球80多个国家和地区。 近日,大象机器联合进迭时空推出全球首款RISC-V全栈开源六轴机器臂“myCobot 280 RISC-V”,为开发者打造全新的机器开源创新平台。 “my
    发表于 04-25 17:59

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    模型库的限制,联发科还首发了开源弹性架构。区别于过往的开放接口,只能部署特定架构模型,开放弹性架构允许开发者直接调整平台源代码,无需等待芯片厂商的支持,即可完成目标或其他自研大模型轻松
    发表于 04-13 19:52

    NVIDIA Isaac GR00T N1开源人形机器基础模型+开源物理引擎Newton加速机器开发

    NVIDIA Isaac GR00T N1开源人形机器基础模型+开源物理引擎Newton加速机器开发
    的头像 发表于 03-20 16:56 1273次阅读

    无法在OVMS上运行来自Meta的大型语言模型 (LLM),为什么?

    无法在 OVMS 上运行来自 Meta 的大型语言模型 (LLM),例如 LLaMa2。 从 OVMS GitHub* 存储库运行 llama_chat Python* Demo 时遇到错误。
    发表于 03-05 08:07

    AI开源模型库有什么用

    AI开源模型库作为推动AI技术发展的重要力量,正深刻改变着我们的生产生活方式。接下来,AI部落小编带您了解
    的头像 发表于 02-24 11:50 878次阅读

    Meta重磅发布Llama 3.3 70B:开源AI模型的新里程碑

    ​在人工智能领域,Meta的最新动作再次引起了全球的关注。今天,我们见证了Meta发布的 Llama 3.3 70B 模型,这是一个开源的人工智能
    的头像 发表于 12-18 16:46 877次阅读
    <b class='flag-5'>Meta</b>重磅发布Llama 3.3 70B:<b class='flag-5'>开源</b><b class='flag-5'>AI</b><b class='flag-5'>模型</b>的新里程碑

    Meta发布新AI模型Meta Motivo,旨在提升元宇宙体验

    Meta在人工智能领域迈出了重要一步。通过这款模型Meta希望能够为用户提供更加自然、流畅的元宇宙交互体验。数字代理在元宇宙中的动作将更加逼真,从而增强用户的沉浸感和参与度。 除了Meta
    的头像 发表于 12-16 10:34 1345次阅读

    开源AI模型库是干嘛的

    开源AI模型库是指那些公开源代码、允许自由访问和使用的AI模型集合。这些
    的头像 发表于 12-14 10:33 1287次阅读

    Meta AI高管批评OpenAI闭源模式

    Meta生成式AI工程副总裁Manohar Paluri近日对闭源AI模式提出了尖锐批评,他认为要充分发挥AI的全部潜力,开源是唯一的出路。
    的头像 发表于 12-12 11:14 1060次阅读

    Meta推出Metamate AI工具,进军企业市场

    近日,社交媒体巨头Meta正积极进军企业市场,推出了一款内部研发的AI工具——Metamate。这款AI软件以提高企业生产力为目标,旨在为企业提供更高效、智能的解决方案。 Metamate
    的头像 发表于 12-09 14:57 1344次阅读

    Meta推出Llama 3.3 70B,AI模型竞争白热化

    在今年的AI领域,Meta也不甘落后,推出了其压轴之作——Llama 3.3 70B大模型。与此同时,马斯克的xAI也宣布其Grok模型从今天起全球免费开放(但存在一定的使用限制)。
    的头像 发表于 12-09 14:50 1014次阅读