OpenAI 在 AI 生成视频领域扔出一枚“王炸”，视频生成模型“Sora”-电子发烧友网

ABSTRACT摘要

2 月 16 日凌晨，也就是中国大年初七，OpenAI 在 AI 生成视频领域扔出一枚“王炸”，宣布推出全新的生成式人工智能模型“Sora”。

这家旧金山公司周四推出的该工具使用生成人工智能，根据书面命令立即创建短视频。

JAEALOT

2024年2月16日

2 月 16 日凌晨，也就是中国大年初七，OpenAI 在 AI 生成视频领域扔出一枚“王炸”，宣布推出全新的生成式人工智能模型“Sora”。

这家旧金山公司周四推出的该工具使用生成人工智能，根据书面命令立即创建短视频。

Sora 并不是第一个展示这种技术的产品。但行业分析师指出，该工具迄今为止展示的视频质量很高，并指出它的推出标志着 OpenAI 和文本到视频生成的未来的整体重大飞跃。

尽管如此，与当今快速发展的人工智能领域的所有事物一样，此类技术也引发了人们对潜在道德和社会影响的担忧。

Sora 是一款文本到视频生成器 - 使用生成式 AI 根据书面提示创建长达 60 秒的视频。该模型还可以从现有的静态图像生成视频。

生成式人工智能是人工智能的一个分支，可以创造新的东西。示例包括聊天机器人（如 OpenAI 的 ChatGPT）以及图像生成器（如 DALL-E 和 Midjourney）。让人工智能系统生成视频是更新且更具挑战性的，但依赖于一些相同的技术。

OpenAI 在周四（2 月 15 日）的博客文章中表示， Sora可以根据用户的文本提示创建长达一分钟的视频。

OpenAI 在帖子中表示：“我们正在教人工智能理解和模拟运动中的物理世界，目的是训练模型来帮助人们解决需要现实世界交互的问题。”

OpenAI 在帖子中补充道：“Sora 能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。” “该模型不仅了解用户在提示中提出的要求，还了解这些东西在物理世界中的存在方式。”

此外，根据该帖子，生成式人工智能模型可以基于单个图像创建视频，以及扩展现有视频或填充缺失的帧。

Sora 尚未可供公众使用（OpenAI 表示，在正式发布该工具之前，它正在与政策制定者和艺术家进行接触），而且还有很多我们不知道的事情。但自周四宣布以来，该公司已经分享了一些 Sora 生成的视频示例，以展示其功能。

OpenAI 首席执行官 Sam Altman 还利用 X（以前称为Twitter 的平台）要求社交媒体用户及时发送想法。后来，他分享了逼真详细的视频，这些视频响应了“两只金毛猎犬在山顶上播客”和“在海洋上与不同动物进行自行车比赛，运动员在无人机摄像机视图下骑自行车”等提示。

虽然 Sora 生成的视频可以描绘复杂、极其详细的场景，但 OpenAI 指出仍然存在一些弱点，包括一些空间和因果元素。例如，OpenAI 在其网站上补充道，“一个人可能会咬一口饼干，但之后，饼干可能没有咬痕。”

OpenAI 的 Sora 并不是同类产品中的第一个。谷歌、Meta 和初创公司 Runway ML 等公司都展示了类似的技术。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

OpenAI 在 AI 生成视频领域扔出一枚“王炸”，视频生成模型“Sora”