0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

除了刷屏的Sora,国内外还有哪些AI视频生成工具

Carol Li 来源:电子发烧友网 作者:李弯弯 2024-02-26 08:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群



电子发烧友网报道(文/李弯弯)近日,OpenAI发布的文生视频模型Sora全网刷屏。相比之前的文生视频模型,Sora无论是视频时长,还是画面精细度,细节完整性,或是多镜头拍摄,都更为突出。Sora的发布也让AI生成视频有了突破性进展。

过去一年多,全球科技公司都在发布各种大模型,然而AI生成内容更多集中在文本和图片方面,AI视频生成方面却进展缓慢。从当前的形势来看,AI视频生成在今年或许会有一番新景象。那么目前国内外都有哪些AI视频生成工具,效果如何呢?

Sora

OpenAI发布的新型视频生成模型Sora,其核心能力是能够生成长达一分钟的高清视频,这一时长远超之前的生成模型。而且,Sora生成的视频不仅画质卓越,细节丰富,而且帧率高、连续性好,几乎达到了无缝衔接的效果。

从OpenAI官网展示的一个视频来看,输入提示词“一位时尚女士走在东京的街道上,街道上充满了温暖的霓虹灯和动画城市标志。她穿着黑色皮夹克、红色长裙和黑色靴子,拿着一个黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信而随意。街道潮湿且反光,形成了五颜六色灯光的镜面效果。许多行人四处走动。”

生成的视频,无论是运镜还是人物、地面、背景的细节,还有拉进镜头后人物面部上的皱纹、毛发、墨镜上的反光,都几乎可以以假乱真,画面稳定不错位。在长达60秒的视频里,画面随镜头的大幅度运动并没有出现错位的情况,整体风格保持了惊人的一致性。

IDC中国预测,Sora将率先在短视频、广告、互动娱乐、影视制作和媒体等行业中得到应用。在这些领域,利用Sora的多模态大模型能力,可以辅助内容行业的工作者更高效地创作视频,不仅加快了生产速度,还提高了产出数量,并为用户带来前所未有的视觉体验。这将助力企业实现成本降低、效率提升,并进一步优化用户体验。

Pika 1.0

在OpenAI发布视频生成模型Sora之前,去年11月29日,美国AI初创公司Pika labs发布的文生视频产品Pika 1.0呈现的效果在当时也相当惊艳。Pika labs是一家成立于去年4月份的初创公司,创始人郭文景和联合创始人兼CTO Chenlin Meng,都是斯坦福大学AI Lab博士生。一位专注于NLP(自然语言处理)和图形学,另一位主攻计算机视觉方向。

据介绍,该公司推出的视频生成模型Pika 1.0能够生成和编辑3D动画、动漫、卡通和电影。视频生成方面,可以通过文字生成视频,也可以图片生成视频。比如,只需输入提示词“马斯克穿着太空服,3D动画”,一个动画版本、穿着太空服准备乘坐火箭上太空的马斯克即可生成,外形、动作、背景等元素均十分逼真,可以媲美花大成本制作的3D动画影像。

Pika 1.0还可以通过原有视频生成更高质量的视频。该公司当时展示了一个骑马的黑白原视频,通过Pika 1.0生成了物种不同风格的动画,几乎涵盖现有电影和动画大部分风格,看上去质量效果非常好。除了视频生成,Pika 1.0还能够进行视频编辑,用户只需要选定编辑区域,就能根据文本提示词修改特定区域。

在当时来看,Pika 1.0的出现可以说效果好于之前的文生视频模型。然而随着现在Sora的出现,Pika或许会感觉到压力。Pika公司创始人郭文景表示,“我们觉得这是一个很振奋人心的消息,我们已经在筹备升级中,将直接对标 Sora。”

Gen-2

相比于OpenAI和Pika,成立于2018年的AI初创公司Runway应该是最早探索视频生成领域的企业。2022年2月,Runway发布了Gen-1,可以对原视频进行风格化的编辑。3月该公司又发布了生成式AI视频模型Gen-2,允许用户输入文本提示生成四秒长视频,8月,Runway添加了一个选项,可以将 Gen-2 中人工智能生成的视频延长至 18 秒。

在随后的几个月,Runway还对Gen-2 做了几次更新。之后更是推出动态笔刷Motion Brush,它是Runway视频生成工具Gen-2的一部分。Runway动态笔刷是一种利用人工智能技术让静止图片中的物体动起来的功能,你只需要在图片上用画笔涂抹你想要动起来的部分,Runway就会自动识别物体的运动轨迹和特征,生成逼真的动态效果。该工具的发布引起业界不小的关注。

在Pika 1.0和Sora出现之前,Runway的Gen-2模型被认为是AI视频制作的顶尖模型,它制作出来的视频效果逼真、流畅、高清。随着OpenAI Sora的发布,Runway接下来或许会有新动作,在Sora发布之后,Runway CEO第一时间在X上发推特称“game on(竞争开始了)”。

Stable Video Diffusion

在图片生成领域遥遥领先的Stability AI,去年11月发布了其最新的AI模型Stable Video Diffusion,这款模型能够通过现有图片生成视频,是基于之前发布的Stable Diffusion文本转图片模型的延伸,不过当时,这款模型并不是对所有人开放的。

据介绍,Stable Video Diffusion当时还处于Stability AI所谓的“研究预览”阶段。想要使用这款模型的人必须同意一些使用条款,其中规定了Stable Video Diffusion的预期应用场景(例如教育或创意工具、设计和其他艺术过程等)和非预期的场景(例如对人或事件的事实或真实的表达)。

从网友对比反馈来看,Stable Video Diffusion生成视频的效果可以与当时被看好的的Runway 和Pika Labs 的AI生成视频相媲美。不过局限性在于,Stability AI的视频生成模型,不能生成没有运动或缓慢的摄像机平移的视频,也不能通过文本进行控制,也不能渲染文字(至少不能清晰地渲染),也不能一致地“正确地”生成人脸和人物。

写在最后

目前来看,在视频生成方面,表现比较优秀的几个模型就是上文提到的OpenAI发布的Sora,以及Pika labs、Runway、Stability AI发布的视频模型。其中Sora无论是在时长,还是运镜、画面细节等方面都更为突出。Stability AI的模型目前还不能进行文本生成视频。

除了这几款视频生成工具之外,还有一些企业在文生视频方面也有动作,包括Adobe,该公司宣布已收购AI视频生成创业公司Rephrase.ai;谷歌,其团队已经发布发布了视频生成模型VideoPoet。

国内的字节跳动、百度、阿里在这方面也有动作。字节跳动此前就推出了一款视频模型Boximator,可以通过文本精准控制生成视频中人物或物体的动作。不过近日,字节跳动对此回应称,Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

另外值得关注的是,2月23日消息,谷歌资深科学家、VideoPoet项目负责人蒋路已加入字节跳动旗下短视频社交平台TikTok。字节跳动接下来在视频生成方面的研究还是可以期待一下。

早前就传出百度文心大模型视频生成功能在内测中,不过目前还没进展的消息。阿里在去年底也上线了Animate Anyone模型,通过一张图片就能生成视频,当时有网友用一张照片生成了一段跳舞视频,每一个动作都十分自然,几乎可以乱真,在网络上引起大量传播。

总的来说,目前国内外已经有不少企业在探索视频生成领域,包括国内的字节跳动、百度、阿里,虽然已经逐渐有一些进展。不过相比OpenAI、Pika labs、Runway等的视频模型,还存在差距。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • OpenAI
    +关注

    关注

    9

    文章

    1262

    浏览量

    10323
  • 大模型
    +关注

    关注

    2

    文章

    3862

    浏览量

    5295
  • Sora
    +关注

    关注

    0

    文章

    88

    浏览量

    864
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    可灵推出AI原生4K直出功能:开启AI视频生成“院线级”新纪元

    4月23日,可灵AI视频3.0系列模型中推出业内首个原生4K直出功能,以“无需后期、直出4K”的颠覆性能力,直接匹配影视行业4K制作标准,标志着AI视频生成技术从“内容
    的头像 发表于 04-27 13:39 507次阅读

    聚焦概念验证中国路径 国内外专家齐聚昱栎技术深入研讨

    近日,“探索概念验证的中国路径与国际对话”考察交流会在北京昱栎技术有限公司圆满举行。来自世界技术转移经理人联盟(ATTP)及国内外技术转移领域的专家代表齐聚昱栎技术,围绕概念验证平台建设、科技成果
    的头像 发表于 03-31 16:24 796次阅读
    聚焦概念验证中国路径 <b class='flag-5'>国内外</b>专家齐聚昱栎技术深入研讨

    昆仑万维天工AI大模型SkyReels V4登上Artificial Analysis榜单全球第一

    、Google Veo 3.1、Vidu Q3、OpenAI Sora 2等全球主流模型,成为全球AI视频生成能力最强的大模型,标志中国AI视频生成
    的头像 发表于 03-26 10:10 1175次阅读

    NVIDIA和ComfyUI携手简化本地AI视频生成工作流

    借助 ComfyUI 的应用视图、NVIDIA RTX Video 超分辨率和全新的 NVFP4 模型,AI 驱动的视频生成更加易用。
    的头像 发表于 03-14 16:37 2616次阅读
    NVIDIA和ComfyUI携手简化本地<b class='flag-5'>AI</b><b class='flag-5'>视频生成</b>工作流

    Sora惊恐到即梦反杀,中国的AI视频生成之路

    科技的发展,本就是在解决问题中前进的过程
    的头像 发表于 03-10 11:57 446次阅读
    从<b class='flag-5'>Sora</b>惊恐到即梦反杀,中国的<b class='flag-5'>AI</b><b class='flag-5'>视频生成</b>之路

    SeaVerse发布全球首个AI Native平台,“All in AI Native”引领AI创作前瞻革命

    2026年1月10日,SeaVerse宣布全球发布SeaVerse AI平台。这是全球首个AI原生的创建和部署平台,集合大语言模型、图像生成视频生成、Agent等多方面的能力,通过全
    的头像 发表于 01-14 17:41 1585次阅读

    国内哪些生成AI 工具最容易上手?企业真正看重的是“能马上用起来”

    生成AI 工具国内越来越多,但企业真正关心的问题并不是“谁的模型更大”“谁的 API 更多”,而是一个更现实的问题: 到底哪类工具最容
    的头像 发表于 12-08 10:55 522次阅读

    OpenAI Sora 2模型上线微软Azure AI Foundry国际版

    我们非常激动地宣布,OpenAI 的新一代多模态视频生成模型 Sora 2 现已在 Azure AI Foundry(国际版)上线,进入公共预览阶段。
    的头像 发表于 10-22 09:44 1042次阅读
    OpenAI <b class='flag-5'>Sora</b> 2模型上线微软Azure <b class='flag-5'>AI</b> Foundry国际版

    看点:谷歌Veo 3.1迎来重大更新硬刚Sora 2 12英寸硅片国产龙头西安奕材今日申购

    给大家带来一些业界资讯: 谷歌Veo 3.1迎来重大更新硬刚Sora 2 据外媒报道,在10月16日,谷歌发布了AI视频生成模型Veo 3.1,升级音频集成与叙事控制能力;以及更逼真的质感还原。在
    的头像 发表于 10-16 16:00 1224次阅读

    全球首个动漫专属AI视频生成平台Animon,国内版&quot;萌动AI&quot;正式发布

    Animon国内版——"萌动AI"首秀:AI动漫创作进入全民时代 北京2025年9月25日 /美通社/ -- CreateAI(OTC:TSPH)今日宣布,其打造的全球首个专注于动漫的AI
    的头像 发表于 09-25 12:33 1476次阅读

    直线模组品牌大起底:国内外优质品牌全解析

    全球范围内,众多品牌在直线电机模组领域不断深耕,以先进技术和卓越品质塑造了良好口碑。接下来,为您详细梳理国内外知名直线电机模组品牌。国外知名直线模组品牌美国派克(P
    的头像 发表于 07-16 11:26 1510次阅读
    直线模组品牌大起底:<b class='flag-5'>国内外</b>优质品牌全解析

    HarmonyOS AI辅助编程工具(CodeGenie)UI生成

    UI Generator基于BitFun Platform AI能力平台,用于快速生成可编译、可运行的HarmonyOS UI工程,支持基于已有UI布局文件(XML),快速生成
    发表于 07-10 11:51

    4K、多模态、长视频AI视频生成的下一个战场,谁在领跑?

    电子发烧友网报道(文/李弯弯) 6月11日,豆包App上线视频生成模型豆包Seedance 1.0 pro。这是字节跳动最新视频模型,支持文字与图片输入,可生成多镜头无缝切换的1080P高品质
    的头像 发表于 06-16 00:13 7635次阅读

    AKOOL发布全球首款实时摄像头

    近日,硅谷新锐公司AKOOL发布全球首款实时摄像头Akool Live Camera,集虚拟数字人、AI视频翻译、实时换脸、实时AI视频生成四大功能于一身,重新定义了
    的头像 发表于 06-09 16:30 2499次阅读

    国内外电机结构 工艺对比分析

    纯分享帖,需要者可点击附件免费获取完整资料~~~*附件:国内外电机结构 工艺对比分析.pdf【免责声明】本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,删除内容!
    发表于 05-29 14:06