继OpenAI和Meta之后,谷歌也在世界模型领域公布了其最新进展。 近日,谷歌发布了一种新的AI模型Genie,据谷歌官网介绍,Genie是一个基于互联网视频训练的基础世界模型,能够从合成图像、照片、草图等多种来源生成多种动作可控的环境。
随着谷歌的加入,世界模型领域的竞争愈发激烈,但目前尚难以确定谁能引领这一领域的发展风向。此前,Sora作为一款世界模型已引发争议。反对者认为其视频生成方式与世界模型的因果预测存在很大不同。从Sora发布的视频来看,虽然保真度较高,但模拟物理规律似乎是其弱点,且目前难以看出其交互能力。
相比之下,谷歌的Genie在交互性方面下了不少功夫。它能够推断出生成环境中的潜在动作,为用户提供一个可玩的、交互式的虚拟环境。然而,在视频真实性和清晰度的层面,Genie尚未展现出与Sora相当的水平。
总的来说,谷歌的Genie和Sora各自具有不同的优势和挑战。世界模型领域正迎来一场激烈的竞争,未来的发展方向将取决于各大公司在技术创新和市场应用上的表现。我们期待看到这一领域能够涌现出更多创新成果,推动人工智能技术的不断发展和进步。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
谷歌
+关注
关注
27文章
6257浏览量
111942 -
模型
+关注
关注
1文章
3810浏览量
52253 -
OpenAI
+关注
关注
9文章
1248浏览量
10263
发布评论请先 登录
相关推荐
热点推荐
小鹏发布 X-World 世界模型:已全面应用第二代VLA
电子发烧友网综合报道 近日,小鹏汽车正式发布 X-World 生成式世界模型技术报告,并同步公开 arXiv 技术论文,这是业内面向端到端自动驾驶、可工程化落地的多摄像头可控世界
大晓机器人开源实时生成世界模型Kairos 3.0-4B
近日,大晓机器人重磅开源开悟世界模型3.0(Kairos 3.0)-4B 系列具身原生世界模型。作为业内首个实现 “多模态理解 — 生成 — 预测” 一体化的开源具身原生
如何构建适合自动驾驶的世界模型?
[首发于智驾最前沿微信公众号]世界模型经历了系统动力学阶段(1960年~2000年)、认知科学阶段(2001年~2017年)、深度学习阶段(2018年至今),但将其应用到自动驾驶汽车上,还是近几年才
NVIDIA Cosmos世界基础模型如何塑造机器人未来
在这一演进过程中,世界模型逐渐成为连接高层智能与底层执行的关键基础设施。通过对环境状态及其时间演化进行建模,世界模型使机器人系统能够在受控环境中进行仿真、训练与决策推演,从而为机器人在
VLA与世界模型有什么不同?
Language Action,VLA),另一些则致力于构建并应用世界模型(World Model)。这两种路径有什么不同? 什么是VLA,什么是世界模型 先说说VLA。VLA是英文
世界模型是让自动驾驶汽车理解世界还是预测未来?
[首发于智驾最前沿微信公众号]世界模型在自动驾驶技术中已有广泛应用。但当谈及它对自动驾驶的作用时,难免会出现分歧。它到底是让自动驾驶汽车得以理解世界,还是为其提供了预测未来的视角? 世界
云知声入选甲子光年2025中国AI大模型领域最具商业潜力榜
12月3日,“2025甲子引力年终盛典”在北京举行,大会现场发布了【甲子100】与【甲子Cool Vendor】等榜单。云知声(股票代码:09678.HK)凭借其在大模型领域扎实的技术积累与领先
利用NVIDIA Cosmos开放世界基础模型加速物理AI开发
NVIDIA 最近发布了 NVIDIA Cosmos 开放世界基础模型(WFM)的更新,旨在加速物理 AI 模型的测试与验证数据生成。借助 NVIDIA Omniverse 库和 Co
谷歌DeepMind重磅发布Genie 3,首次实现世界模型实时交互
电子发烧友网综合报道 当地时间2025年8月5日,谷歌DeepMind正式推出第三代通用世界模型Genie3。这款被英伟达科学家Jim Fan誉为“游戏引擎2.0”的
自动驾驶中常提的世界模型是个啥?
[首发于智驾最前沿微信公众号]随着自动驾驶技术的不断成熟,车辆需要在复杂多变的道路环境中安全地行驶,这就要求系统不仅能“看见”周围的世界,还要能“理解”和“推测”未来的变化。世界模型可以被看作一种
世界模型:多模态融合+因果推理,解锁AI认知边界
电子发烧友网综合报道 在人工智能的蓬勃发展进程中,世界模型正崭露头角,成为推动其迈向更高智能水平的关键力量。世界模型作为 AI 系统对外部世界
谷歌发布基础世界模型Genie,世界模型领域竞争升温
评论