0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI 在 AI 生成视频领域扔出一枚“王炸”,视频生成模型“Sora”

捷易物联 2024-02-22 08:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

ABSTRACT摘要

2 月 16 日凌晨,也就是中国大年初七,OpenAI 在 AI 生成视频领域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。

这家旧金山公司周四推出的该工具使用生成人工智能,根据书面命令立即创建短视频。

JAEALOT

2024年2月16日

2 月 16 日凌晨,也就是中国大年初七,OpenAI 在 AI 生成视频领域扔出一枚“王炸”,宣布推出全新的生成式人工智能模型“Sora”。

这家旧金山公司周四推出的该工具使用生成人工智能,根据书面命令立即创建短视频。

Sora 并不是第一个展示这种技术的产品。但行业分析师指出,该工具迄今为止展示的视频质量很高,并指出它的推出标志着 OpenAI 和文本到视频生成的未来的整体重大飞跃。

尽管如此,与当今快速发展的人工智能领域的所有事物一样,此类技术也引发了人们对潜在道德和社会影响的担忧。


Sora 是一款文本到视频生成器 - 使用生成式 AI 根据书面提示创建长达 60 秒的视频。该模型还可以从现有的静态图像生成视频。

生成式人工智能是人工智能的一个分支,可以创造新的东西。示例包括聊天机器人(如 OpenAI 的 ChatGPT)以及图像生成器(如 DALL-E 和 Midjourney)。让人工智能系统生成视频是更新且更具挑战性的,但依赖于一些相同的技术。

OpenAI 在周四(2 月 15 日)的博客文章中表示, Sora可以根据用户的文本提示创建长达一分钟的视频。


OpenAI 在帖子中表示:“我们正在教人工智能理解和模拟运动中的物理世界,目的是训练模型来帮助人们解决需要现实世界交互的问题。”

OpenAI 在帖子中补充道:“Sora 能够生成具有多个角色、特定类型的运动以及主题和背景的准确细节的复杂场景。” “该模型不仅了解用户在提示中提出的要求,还了解这些东西在物理世界中的存在方式。”

此外,根据该帖子,生成式人工智能模型可以基于单个图像创建视频,以及扩展现有视频或填充缺失的帧。

Sora 尚未可供公众使用(OpenAI 表示,在正式发布该工具之前,它正在与政策制定者和艺术家进行接触),而且还有很多我们不知道的事情。但自周四宣布以来,该公司已经分享了一些 Sora 生成的视频示例,以展示其功能。


OpenAI 首席执行官 Sam Altman 还利用 X(以前称为Twitter 的平台)要求社交媒体用户及时发送想法。后来,他分享了逼真详细的视频,这些视频响应了“两只金毛猎犬在山顶上播客”和“在海洋上与不同动物进行自行车比赛,运动员在无人机摄像机视图下骑自行车”等提示。


虽然 Sora 生成的视频可以描绘复杂、极其详细的场景,但 OpenAI 指出仍然存在一些弱点,包括一些空间和因果元素。例如,OpenAI 在其网站上补充道,“一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。”

OpenAI 的 Sora 并不是同类产品中的第一个。谷歌、Meta 和初创公司 Runway ML 等公司都展示了类似的技术。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    213

    文章

    31455

    浏览量

    223684
  • AI
    AI
    +关注

    关注

    91

    文章

    41156

    浏览量

    302619
  • 人工智能
    +关注

    关注

    1820

    文章

    50335

    浏览量

    266976
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    可灵推出AI原生4K直出功能:开启AI视频生成“院线级”新纪元

    4月23日,可灵AI视频3.0系列模型中推出业内首个原生4K直出功能,以“无需后期、直出4K”的颠覆性能力,直接匹配影视行业4K制作标准,标志着A
    的头像 发表于 04-27 13:39 233次阅读

    GS4901B/GS4900B:视频与音频时钟及定时生成的理想之选

    GS4901B/GS4900B:视频与音频时钟及定时生成的理想之选 电子设计领域,时钟和定时生成器对于确保系统的稳定运行和精确同步至关重要
    的头像 发表于 04-15 10:10 120次阅读

    昆仑万维天工AI模型SkyReels V4登上Artificial Analysis榜单全球第

    、Google Veo 3.1、Vidu Q3、OpenAI Sora 2等全球主流模型,成为全球AI视频生成能力最强的大
    的头像 发表于 03-26 10:10 961次阅读

    NVIDIA和ComfyUI携手简化本地AI视频生成工作流

    借助 ComfyUI 的应用视图、NVIDIA RTX Video 超分辨率和全新的 NVFP4 模型AI 驱动的视频生成更加易用。
    的头像 发表于 03-14 16:37 2508次阅读
    NVIDIA和ComfyUI携手简化本地<b class='flag-5'>AI</b><b class='flag-5'>视频生成</b>工作流

    商汤科技日日新Seko系列模型与寒武纪成功适配

    12月15日,商汤科技基于在生成AI与多模态交互领域的技术积累,正式发布Seko2.0——行业首个多剧集生成智能体。该智能体多剧集
    的头像 发表于 12-17 14:06 601次阅读

    OpenAI Sora 2模型上线微软Azure AI Foundry国际版

    我们非常激动地宣布,OpenAI 的新代多模态视频生成模型 Sora 2 现已在 Azure AI
    的头像 发表于 10-22 09:44 966次阅读
    <b class='flag-5'>OpenAI</b> <b class='flag-5'>Sora</b> 2<b class='flag-5'>模型</b>上线微软Azure <b class='flag-5'>AI</b> Foundry国际版

    全球首个动漫专属AI视频生成平台Animon,国内版&quot;萌动AI&quot;正式发布

    Animon国内版——"萌动AI"首秀:AI动漫创作进入全民时代 北京2025年9月25日 /美通社/ -- CreateAI(OTC:TSPH)今日宣布,其打造的全球首个专注于动漫的AI视频
    的头像 发表于 09-25 12:33 1348次阅读

    智能体化AI生成AI的区别

    生成AI 的核心是“生成内容” —— 比如用大模型写报告,是对输入指令的被动响应。而智能体化 AI(Agentic
    的头像 发表于 08-25 17:24 1906次阅读

    美泰与OpenAI联手,共探生成AI智能玩具新领域

    电子发烧友网综合报道 近期,全球知名玩具制造商美泰(Mattel)宣布与人工智能公司OpenAI达成战略合作,计划共同开发基于生成AI的智能玩具。这是OpenAI首次涉足玩具制造
    发表于 08-05 07:04 2039次阅读

    百度重磅发布!全球首创中文音视频模型

    电子发烧友网综合报道 2025年7月2日,百度北京正式发布全球首个中文音视频一体化生成模型——MuseSteamer,标志着其正式进军图生视频
    的头像 发表于 07-11 09:18 4618次阅读

    种基于扩散模型视频生成框架RoboTransfer

    机器人操作领域,模仿学习是推动具身智能发展的关键路径,但高度依赖大规模、高质量的真实演示数据,面临高昂采集成本与效率瓶颈。仿真器虽提供了低成本数据生成方案,但显著的“模拟到现实”(Sim2Real)鸿沟,制约了仿真数据训练策略
    的头像 发表于 07-09 14:02 954次阅读
    <b class='flag-5'>一</b>种基于扩散<b class='flag-5'>模型</b>的<b class='flag-5'>视频生成</b>框架RoboTransfer

    谷歌新生成AI媒体模型登陆Vertex AI平台

    我们 Vertex AI 上推出新生成AI 媒体模型: Imagen 4、Veo 3
    的头像 发表于 06-18 09:56 1309次阅读

    4K、多模态、长视频AI视频生成的下个战场,谁在领跑?

    电子发烧友网报道(文/李弯弯) 6月11日,豆包App上线视频生成模型豆包Seedance 1.0 pro。这是字节跳动最新视频模型,支持文字与图片输入,可
    的头像 发表于 06-16 00:13 7553次阅读

    AKOOL发布全球首款实时摄像头

    近日,硅谷新锐公司AKOOL发布全球首款实时摄像头Akool Live Camera,集虚拟数字人、AI视频翻译、实时换脸、实时AI视频生成四大功能于
    的头像 发表于 06-09 16:30 2431次阅读

    生成式人工智能认证:重塑AI职业生态的底层逻辑

    人工智能技术渗透至社会毛细血管的今天,生成式人工智能(Generative AI)的崛起正在改写人类与技术的协作范式。从ChatGPT引爆的全球热潮,到Sora
    的头像 发表于 05-23 09:17 957次阅读