0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌公布基础模型Genie,主攻2D平台类游戏及机器人应用

微云疏影 来源:综合整理 作者:综合整理 2024-02-28 10:02 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在OpenAI研发出Sora后不久,谷歌Deep Mind团队公开了在世界模型领域的新进展——基础世界模型Genie。该模型主要借鉴非对抗方式进行训练,可根据各类图像乃至草图生成具有丰富动作表现的2D世界,从而实现人们与虚构世界的深度互动。只需输入一张图像,Genie便可构建一个全新的交互环境。

DeepMind指出,Genie有能力根据最新的文生图大模型生成初始帧,再借助Genie的能力赋予这些图像更深层次的含义。Genie作为一个包含110亿参数的基础世界模型,成功研发得益于谷歌声名在外的潜在动作模型,用于推断视频帧间的运动,视频分词器则可以将原始视频帧转化为离散标记,而动态模型则负责预测下一帧的活动情况。

值得注意的是,相较于号称“高清晰度、高真实感”的Sora, Genie似乎更注重潜在行为的预测,而不是极力展现画面的真实性。现阶段,从图像或文本中生成高质量视频尚未成为Genie关注的核心业务点。DeepMind进一步透露,Genie主要围绕“2D平台类游戏及大约率算法”展开应用,这种处理方法具有广泛适应性,可应用于各领域,也可以扩展至更大规模的互联网数据集。

然而,这个还在试验阶段的Genie尚不能视为商业产品问世。据DeepMind人士解释,Genie的训练视频为160x90像素且每秒仅10帧的超低分辨率视频,生成的模拟游戏以每秒1帧的速率运行。因此,实际场景更为复杂且要求更高实时性的商业应用仍需耐心等待解决方案。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DeepMind
    +关注

    关注

    0

    文章

    131

    浏览量

    12430
  • genie
    +关注

    关注

    0

    文章

    10

    浏览量

    4438
  • OpenAI
    +关注

    关注

    9

    文章

    1249

    浏览量

    10270
  • 大模型
    +关注

    关注

    2

    文章

    3759

    浏览量

    5269
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    再谈低温烧结银的应用:从春晚四家机器人出镜的幕后推手说起

    科技:《武 BOT》:H2机器人31个高精度关节、单臂7自由度,完成醉拳、双截棍、舞剑,同步误差**< 0.1秒;核心是高功率密度伺服电机+高速控制+**强散热。 **魔法原子:《智造
    发表于 02-17 14:07

    富唯智能复合机器人:推动智慧医院与产业自动化的核心技术创新

    富唯智能复合机器人通过融合协作机器人、移动机器人2D/3D视觉引导技术,为医疗、制造等行业提供高精度、自动化的物料搬运解决方案。本文探讨富
    的头像 发表于 01-14 14:19 296次阅读

    探索RISC-V在机器人领域的潜力

    利用Gazebo仿真环境(在x86主机上运行)和MUSE Pi Pro上的ROS 2节点进行了联合仿真。 • 场景: 在PC的Gazebo中运行一个TurtleBot3机器人模型,MUSE Pi
    发表于 12-03 14:40

    高精度机器人控制的核心——基于 MYD-LT536 开发板的精密运动控制方案

    处理器,支持 1.8 GHz 主频,并集成2Tops NPU、G2D、VPU 4K高清视频编解码器,为复杂控制算法与视觉融合计算提供充足算力。米尔MYD-LT536开发板 在“高精度机器人控制”场景中
    发表于 11-14 15:48

    RK3576机器人核心:三屏异显+八路摄像头,重塑机器人交互与感知

    任务并行处理,是服务机器人开发的理想高性能平台。 RK3576:机器人领域的性能突破在机器人技术飞速发展的今天,如何让机器人"看得
    发表于 10-29 16:41

    小萝卜机器人的故事

    经过我的申请, 马老师发放了, 小萝卜机器人的, 开发权限, 原来的小萝卜公司, 因为经营不善倒闭, 作为科研产品, 几个技术对此惋惜, 自掏腰包, 要让小萝卜机器人, 再生, 每次听到小萝卜说
    发表于 10-23 05:24

    15分钟快速部署,复合机器人如何重塑“上下料机器人哪家好”的行业答案

    富唯智能复合机器人突破传统技术边界,将协作机器人、移动机器人及视觉引导技术深度融合。其搭载的ICD系列核心控制器,实现了对整个系统的一体化控制,彻底摆脱多设备协同时的“兼容性焦虑”。无论是产线系统对接,还是搭配自研
    的头像 发表于 10-17 16:18 345次阅读
    15分钟快速部署,复合<b class='flag-5'>机器人</b>如何重塑“上下料<b class='flag-5'>机器人</b>哪家好”的行业答案

    INDEMIND解锁陪伴机器人能力新边界

    2D感知到3D感知,从单一语音到多模态交互,解锁陪伴机器人能力新边界。
    的头像 发表于 10-09 14:25 886次阅读

    谷歌DeepMind重磅发布Genie 3,首次实现世界模型实时交互

    电子发烧友网综合报道 当地时间2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。这款被英伟达科学家Jim Fan誉为“游戏引擎2.0”的
    的头像 发表于 08-13 08:27 7163次阅读

    工业机器人的特点

    的基础,也是三者的实现终端,智能制造装备产业包括高档数控机床、工业机器人、自动化成套生产线、精密仪器仪表、智能传感器、汽车自动化焊接线、柔性自动化生产线、智能农机、3D 打印机等领域。而智能制造装备中工业
    发表于 07-26 11:22

    机器人看点:越疆机器人正式发布六足仿生机器狗 智元公布机器人运动控制模型专利

    ”具身机器人平台的企业。 此前越疆机器人发布的六足仿生机器狗是集“认知、动作、机动”三大核心能力于一体的创新产品,而且六足架构既具备优于四足结构的稳定性和负载能力。 越疆六足仿生机器
    的头像 发表于 07-09 15:03 2469次阅读

    盘点#机器人开发平台

    Athena机器人****开发平台思岚推出Athena机器人开发平台,有望主导机器人开发平台未来
    发表于 05-13 15:02

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    阅读心得体会:ROS2机器人视觉与地图构建技术 通过对本书第7章(ROS2视觉应用)和第8章(ROS2地图构建)的学习,我对机器人视觉感知和
    发表于 05-03 19:41

    【「# ROS 2智能机器人开发实践」阅读体验】机器人入门的引路书

    的非常好的,特别是一些流程图,很清晰的阐释了概念 很适合作为初学者入门的引路书 还能了解很多技术和框架,破除初学者的自负困境,让初学者知道功能是由很多开发者维护的,前人已经为各种产品搭建了完善的框架。避免陷入得一个单打独斗的错觉 一直蠢蠢欲动ros2
    发表于 04-30 01:05

    大象机器人携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品

    全球80多个国家和地区。 近日,大象机器人联合进迭时空推出全球首款RISC-V全栈开源六轴机器臂“myCobot 280 RISC-V”,为开发者打造全新的机器人开源创新平台。 “my
    发表于 04-25 17:59