OpenAI的视频生成模型Sora持续引发关注,而围绕Sora到底懂不懂物理世界?这个讨论越发火热,甚至是在讨论Sora 到底是不是物理引擎甚至世界模型?
当然Sora 目前看起来似乎还微有瑕疵,但是视频效果已经足以震撼人心,而且OpenAI自己也认为确实还是有很多问题,比如Sora可能会混淆左右,比如Sora难以准确体现随时间推移而发生的事件,但是这些问题似乎都不会是Sora改进的阻碍。
业界当然还有多种声音,比如英伟达高级研究科学家Jim Fan 认为Sora 是一个数据驱动的物理引擎,是一个可学习的模拟器,或者可以说是一个世界模型。
还有图灵奖得主Yann LeCun则认为仅仅根据 prompt 生成逼真视频并不能代表一个模型理解了物理世界,生成视频的过程与基于世界模型的因果预测完全不同。
还有观点认为Sora可以说确实是已经嵌入了物理模型,但问题是这个物理模型是否已经就是准确的?逻辑能力依然不行。
不管大牛们怎么看,Sora的能力确实很强大,Sora 生成的视频能够展现出精细的场景,还有生动的角色表情和复杂的镜头动态。文本转视频模型似乎已经非常完美。
有网友评论称“首个大型视频生成模型”的名号肯定没跑了,期待国产大模型反超。
当然未来Sora落地应用,克服算力需求也是一大问题。
这一次Sora 让大家看到了AI的技术已经扩展到了视频领域;Sora的强大令人震惊,业界多认为Sora展示了人工智能在理解真实世界场景并与之互动的能力,这被认为是朝着实现通用人工智能(AGI)的重要一步。未来Sora会将在更多领域得到推广应用。
尽管目前Sora尚未对外开放公测,也未提供内部测试的申请途径。还只是在内部测试,但是全球都充满了期待。
-
OpenAI
+关注
关注
9文章
1238浏览量
9814 -
大模型
+关注
关注
2文章
3440浏览量
4967 -
Sora
+关注
关注
0文章
86浏览量
752
发布评论请先 登录
利用NVIDIA Cosmos开放世界基础模型加速物理AI开发
OpenAI Sora 2模型上线微软Azure AI Foundry国际版
看点:谷歌Veo 3.1迎来重大更新硬刚Sora 2 12英寸硅片国产龙头西安奕材今日申购
Sora2五天下载量破百万!超越ChatGPT增长速度,App Store免费榜霸榜第一
声智科技声学模型赋予AI感知物理世界
NVIDIA通过全新 Omniverse库、Cosmos物理AI模型及AI计算基础设施,为机器人领域开启新篇章
泰克科技解析AI服务器电源架构的技术演进
10BASE-T1S 以太网 —— 连接物理世界和数字世界

Sora到底懂不懂物理世界? Sora开启更多可能
评论