0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌DeepMind重磅发布了基础世界模型:Genie(精灵)

vliwulianw 来源:软件质量报道 2024-02-28 10:45 次阅读

大家都喜欢玩游戏吧?因为游戏最大的吸引力是让我们逃避现实、幻想一个远离我们眼前现实的世界,掌控这个虚拟的现实世界。现在,我们可以想象一下,如果我们有能力创造自己的世界,那该多好了。 让我们激动的这一天来了! 北美时间26号下午,GoogleGenie团队的负责人Tim Rocktäschel非常兴奋地宣布:Google DeepMindOpen Endedness团队开发的基于互联网视频训练的基础世界模型(foundation world model)——Genie

(幽灵)发布了,它可以根据图像提示生成无穷无尽的可控动作2D世界的各种变化。这个110亿参数大模型Genie,能从一张图片就能创造出可玩的虚拟世界,动作可控,这也预示着,AI已经真正杀到视频游戏领域了。

084845f0-d5db-11ee-a297-92fbcf53809c.png

0853455e-d5db-11ee-a297-92fbcf53809c.png

什么是Genie(精灵)?

根据 Google DeepMind 的官方博客文章,Genie 是一个基础世界模型,它是根据来自互联网的视频进行训练的。该模型可以“从合成图像、照片甚至草图中生成无穷无尽的可玩(动作可控)世界”。 研究论文 “Genie:Generative Interactive Environments” 指出,Genie是第一个从未标记的互联网视频中以无监督方式训练的生成式交互式环境。在大小方面,Genie 的参数为 11B,由时空视频标记器(spatiotemporal videotokenizer)、自回归动力学模型(autoregressive dynamics model)和简单且可扩展的潜在动作模型(simple and scalable latent action model)组成。

这些技术规范允许 Genie 在生成的环境中逐帧运行,即使在没有训练、标注或任何其他特定领域要求的情况下也是如此。

Genie 能做什么的?

根据这篇研究论文,Genie是一种新型的生成式人工智能,它使任何人(甚至是儿童)都能梦想并进入类似于人类设计的模拟环境的生成世界。可以提示 Genie 生成一组不同的交互式和可控环境,尽管它是在纯视频数据上训练的。

简而言之,我们已经看到了许多生成式 AI 模型,它们使用语言、图像甚至视频生成创意内容。Genie 是一个突破,因为它可以从单个图像提示中创建可玩的环境。

试着记住《哈利·波特与魔法石》中哈利和他的朋友们在前往格兰芬多公共休息室的路上进入霍格沃茨城堡的场景。年轻的学生们看到一面墙上挂满了画作,每个角色都在他们的画面中慢慢地移动,这些画作栩栩如生。Genie能使静止图像栩栩如生,赋予我们一个自己的世界。

根据 Google DeepMind 的说法,Genie 可以收到它从未见过的图像提示,这包括现实世界的照片、草图,允许人们与他们想象的虚拟世界互动,这就是称之为“基础世界模型”。在培训方面,研究论文强调,他们更关注2D平台游戏和机器人技术的视频。Genie 使用通用方法进行训练,使其能够在任何类型的域上运行,并且可以扩展到更大的 Internet 数据集。

为什么Genie很重要?

Genie 的突出之处在于它能够从互联网视频中学习和重现游戏中角色的控制。这是值得注意的,因为互联网视频没有关于视频中执行的动作的标签,甚至没有关于应该控制图像的哪一部分的标签。

Google 博客文章写道:“Genie不仅可以学习观察的哪些部分通常是可控的,还可以推断出在生成的环境中一致的各种潜在行为。请注意,相同的潜在动作如何在不同的提示图像中产生相似的行为,“ 根据 Google DeepMind 的说法,该模型最独特的方面是:它允许您从单个图像创建一个全新的交互式环境。这开辟了许多可能性,尤其是创建和进入虚拟世界的新方法。为了证明这一点,研究人员使用文本到图像模型Imagen 2创建了一个图像,然后将其用作创建虚拟世界的提示。草图也可以做同样的事情。

有了 Genie,任何人都可以创建自己完全想象的虚拟世界。此外,该模型学习和开发新世界模型的能力标志着向通用人工智能代理(一个独立的程序或实体,通过传感器感知其周围环境来与环境交互)的重大飞跃。 开启另一个旅程:




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    5861

    浏览量

    103264
  • 人工智能
    +关注

    关注

    1776

    文章

    43871

    浏览量

    230624
  • 大模型
    +关注

    关注

    2

    文章

    1532

    浏览量

    1126

原文标题:基础世界模型Google Genie诞生了:根据提示生成无穷无尽的、可交互的2D世界

文章出处:【微信号:软件质量报道,微信公众号:软件质量报道】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    谷歌发布用于辅助编程的代码大模型CodeGemma

    谷歌发布了用于辅助编程的代码大模型 CodeGemma。CodeGemma 基于谷歌今年 2 月发布的轻量级开源大
    的头像 发表于 04-17 16:07 137次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>发布</b>用于辅助编程的代码大<b class='flag-5'>模型</b>CodeGemma

    谷歌发布全新AI基础世界模型Genie

    谷歌近日宣布推出其最新研发的AI基础世界模型——Genie。这款模型拥有惊人的110亿参数,其独特之处在于,仅需一张图片,便能生成一个充满活
    的头像 发表于 03-04 14:02 264次阅读

    谷歌模型软件有哪些功能

    谷歌模型软件通常指的是谷歌推出的一系列人工智能模型和软件工具,其中最具代表性的是Google Gemini。Google Gemini是谷歌
    的头像 发表于 03-01 16:20 209次阅读

    谷歌发布全新AI模型Genie

    谷歌近日发布了其全新的AI模型Genie,这一模型彻底改变了我们与数字世界的互动方式。
    的头像 发表于 02-28 18:25 1148次阅读

    谷歌发布基础世界模型Genie世界模型领域竞争升温

    继OpenAI和Meta之后,谷歌也在世界模型领域公布了其最新进展。据谷歌官网介绍,Genie是一个基于互联网视频训练的基础
    的头像 发表于 02-28 18:20 1058次阅读

    谷歌发布AI基础世界模型Genie

    谷歌近日宣布了其生成式AI的全新里程碑——全新AI基础世界模型Genie。这一创新技术允许用户通过单张图像提示,生成一个可玩的、交互式的虚拟环境,从而开启了一个全新的数字体验时代。
    的头像 发表于 02-28 17:41 397次阅读

    谷歌发布开源AI大模型Gemma

    近日,谷歌发布了全新AI大模型Gemma,这款模型为各种规模的组织提供了前所未有的机会,以负责任的方式在商业应用中进行分发。
    的头像 发表于 02-28 17:38 408次阅读

    谷歌发布新型AI模型Genie

    近日,谷歌推出了一款革命性的AI模型——Genie。这款模型能够将简单的文本提示、草图或初步想法迅速转化为一个可以互动和游戏的虚拟世界。这一
    的头像 发表于 02-28 10:05 301次阅读

    谷歌公布基础模型Genie,主攻2D平台类游戏及机器人应用

    DeepMind指出,Genie有能力根据最新的文生图大模型生成初始帧,再借助Genie的能力赋予这些图像更深层次的含义。Genie作为一个
    的头像 发表于 02-28 10:02 153次阅读

    谷歌交互世界模型重磅发布

    谷歌模型
    北京中科同志科技股份有限公司
    发布于 :2024年02月28日 09:13:06

    谷歌DeepMind推新AI模型Genie,能生成2D游戏平台

    据报道,谷歌公司的DeepMind团队近期发布了AI模型Genie,此模型拥有多达110亿个参数
    的头像 发表于 02-27 14:53 350次阅读

    谷歌宣布Gemma大模型全球开放使用

    谷歌公司近日宣布,其先进的AI大模型Gemma即日起在全球范围内开放使用。这一新模型谷歌DeepMind和其他团队合作开发,并与其最大的A
    的头像 发表于 02-23 10:41 353次阅读

    谷歌DeepMind资深AI研究员创办AI Agent创企

    近日,刚从谷歌DeepMind离职的资深AI研究员Ioannis Antonoglou宣布创办了一家名为“AI Agent”的创企。Ioannis Antonoglou常驻伦敦,此前曾担任谷歌
    的头像 发表于 02-04 10:02 374次阅读

    GPT-5正秘密训练!DeepMind联创爆料,这模型比GPT-4大100倍

    另外,采访中,Suleyman还爆出了很多自己在DeepMind和Inflection AI工作时的内部信息,包括了谷歌当时收购DeepMind和之后的抓马,某种程度上解释了为什么DeepMi
    的头像 发表于 09-04 16:28 468次阅读
    GPT-5正秘密训练!<b class='flag-5'>DeepMind</b>联创爆料,这<b class='flag-5'>模型</b>比GPT-4大100倍

    谷歌DeepMind发布机器人大模型RT-2,提高泛化与涌现能力

    7月28日,谷歌DeepMind推出了一款新的机器人模型Robotics Transformer 2(RT-2)。
    发表于 08-02 14:22 273次阅读
    <b class='flag-5'>谷歌</b><b class='flag-5'>DeepMind</b><b class='flag-5'>发布</b>机器人大<b class='flag-5'>模型</b>RT-2,提高泛化与涌现能力