文生视频，硬件成本是最大拦路虎-电子发烧友网

电子发烧友网报道（文/周凯扬）自文本与图片类的AIGC爆火以来，几乎所有互联网公司和应用开发商都在跟进。然而近期随着Sora的爆火，决定开发同类应用的厂商却少之又少，这就不得不谈到硬件成本的问题，毕竟一个能够实现文生视频的应用，服务器成本要远远高于GPT类应用。

从文生视频模型的配置谈硬件成本

对于目前市面上的一些文生视频模型而言，其配置往往决定了体验的好坏。就拿Runway的Gen-2模型来说，其最大的特点在于可以生成4K级别分辨率的视频，且具备影视级别的构图和运镜，支持图片和文本的指令输入。

然后是最近一炮走红的Sora，其将最大时长做到了1分钟，且支持符合部分物理规律的世界模型，以及多镜头的切换等。不过与Gen-2模型一样，其对分辨率也进行了限制，甚至只能生成1080p的视频。

其他文生视频模型的配置则更加捉襟见肘，比如Meta的Emu Video只能生成最长4秒的512x512分辨率视频等等。从以上文生视频模型看来，由于为了确保画面一致性，视频分辨率、视频长度和每秒帧数往往决定了生成单个视频的硬件负载。目前对于硬件要求最高的应该是Runway的Gen-2和OpenAI的Sora。

这也是为何文生视频应用均采用订阅模式，甚至是按量订阅的付费策略，比如生成视频的项目数量、存储空间、导出质量等，文生视频考验的不仅是服务器算力，还有存储成本。毕竟为了方便用户回溯，这些生成的视频依然需要存储在服务器上一段时间。

就以Runway为例，要想完全无限制地生成视频功能，每月订阅费用高达76美元，且这仅仅意味着450s的Gen-2视频生成，如果用户需要生成更多内容，则还需要额外购买。可见为了维持服务器费用，文生视频应用面临的成本压力要远大于GPT类应用。

不只是云端，硬件成本也决定了本地部署的难度

从ChatGPT和Stable Diffusion这两个最火的AIGC应用就可以看出，硬件是开发这类应用的最大门槛之一。基于低成本硬件打造的类ChatGPT应用响应时间慢，生成内容质量差。而Stable Diffusion这类文生图模型，已经可以在消费级硬件上实现不错的效果，甚至可以普及到一些低功耗的端侧设备上。

但对于Sora这类文生视频的模型而言，要想在消费级实现本地部署可谓是难于登天，在完成内容的基本生成工作后，还需要经历风格化、分镜、遮罩、渲染和自定义等一系列流程，可以说不仅考验硬件的AI算力，也对视频渲染能力提出了更高的要求。

据了解，一批开源开发者已经在构建OpenAI Sora的复制版本，且可以在使用消费级英伟达 GPU的高配电脑上跑通。不过马斯克也评论道，他也认为这是可行的，但是帧渲染速率会非常低。如果需要花上数小时，才能生成出一个质量较差的4秒视频，对于绝大多数用户来说，必然不是好的体验。

写在最后

要论硬件成本的话，对于应用开发者和用户而言，文生视频目前还是一个较为昂贵的“玩具”。但我们也不能否认其前景，随着算力成本逐渐下降，未来文生视频不仅可以作为内容创作途径，也可以作为辅助工具，替代掉一部分重复性工作，尤其是在广告视频行业。

不过这类应用的出现，也会让我们开始重新审视起GPU在AIGC硬件市场的地位，毕竟多出了图形渲染这一额外的硬件要求，其他的ASIC方案在这方面固然会逊色GPU一筹。再加上英伟达GPU在物理仿真上的优势，或许文生视频会给英伟达带来更多的市场机遇。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
26459

浏览量
264080
AIGC

AIGC

+关注

关注
1

文章
261

浏览量
909
大模型

大模型

+关注

关注
2

文章
1532

浏览量
1130
Sora

Sora

+关注

关注
0

文章
73

浏览量
129

文生视频Pika 1.0爆火！一句话生成视频，普通人也能当“导演”

电子发烧友网报道（文/李弯弯）11月29日，美国AI初创公司Pika labs发布了全新的文生视频产品Pika 1.0，这款产品能够生成和编辑3D动画、动漫、卡通和电影。用Pika 1.0制作视频

发表于 12-01 01:08 •2980次阅读

<b class='flag-5'>文生</b><b class='flag-5'>视频</b>Pika 1.0爆火！一句话生成<b class='flag-5'>视频</b>，普通人也能当“导演”

OpenAI发布文生视频大模型Sora、英伟达市值超谷歌

OpenAI加入文生视频大模型的战局，AI大模型进入视频生成的阶段，这将进一步刺激AI芯片的需求。 OpenAI发布文生视频大模型Sora，

发表于 03-28 18:13 •528次阅读

7万张H100打造的OpenAI文生视频Sora功能原理详解|Sora注册全攻略

近日，OpenAI发布的基于Transformer架构的文生视频Sora，可谓是在AI圈掀起新的热潮。该模型具有强大的视频生成能力，可产生高达一分钟的高清视频，并且用户可以自由指定

发表于 02-29 11:48 •467次阅读

7万张H100打造的OpenAI<b class='flag-5'>文生</b><b class='flag-5'>视频</b>Sora功能原理详解|Sora注册全攻略

OpenAI文生视频模型Sora要点分析

近日，美国人工智能公司OpenAI发布了首个视频生成模型Sora。不同于此前许多AI大模型文生图或视频时，会出现人物形象前后不一致等问题

发表于 02-22 16:37 •539次阅读

OpenAI<b class='flag-5'>文生</b><b class='flag-5'>视频</b>模型Sora要点分析

OpenAI新推文生视频大模型Sora引发热议，首批受益者涌现

在科技浪潮中，OpenAI再次引领潮流。继2023年的文生文大语言模型之后，2024年春节期间，OpenAI推出的文生视频大模型Sora迅速成为全球科技界的焦点。这款模型能够根据文本内容生成高质量的

发表于 02-22 14:15 •354次阅读

【国产FPGA+OMAPL138开发板体验】（原创）7.硬件加速Sora文生视频源代码

算法，如循环神经网络（RNN）或Transformer，用于文本处理，以及卷积神经网络（CNN）或生成对抗网络（GAN）用于视频生成。通常涉及对模型中的计算密集型部分进行硬件加速。文本到视频生成模型

发表于 02-22 09:49

OpenAI发布人工智能文生视频大模型Sora

近日，人工智能领域的领军企业OpenAI宣布推出其最新的人工智能文生视频大模型——Sora。这款模型在继承DALL-E 3卓越画质和遵循指令能力的基础上，实现了对真实物理世界的深度模拟，为视频制作领域带来了前所未有的变革。

发表于 02-20 13:54 •392次阅读

英伟达市值跃居全球第四文生视频大模型Sora带动

英伟达市值跃居全球第四文生视频大模型Sora带动文生视频大模型Sora引发市场关注；OpenAI的首款文生

发表于 02-19 16:48 •659次阅读

OpenAI发布文生视频模型Sora，引领AI视频生成新纪元

在人工智能(AI)领域掀起新一轮革命浪潮的，正是OpenAI最新推出的文生视频大模型——Sora。这款被业界广泛赞誉的模型，以其“逼真”和“富有想象力”的视频生成能力，彻底颠覆了传统视频

发表于 02-19 11:03 •446次阅读

OpenAI推出全新文生视频模型Sora

近日，全球领先的人工智能研究公司OpenAI宣布推出其最新的文生视频大模型“Sora”。该模型具有突破性的功能，能够根据用户提供的文本指令或静态图像，自动生成长达1分钟的高清视频。这些视频

发表于 02-19 10:56 •439次阅读

奥特曼发布王炸模型Sora OpenAI首个文生视频模型Sora正式亮相

奥特曼发布王炸模型Sora OpenAI首个文生视频模型Sora正式亮相 2月16日凌晨OpenAI的首个文生视频模型Sora正式亮相。Sora只需输入文字，便可生成一段长达60秒的高

发表于 02-18 17:41 •595次阅读

连接器的真正成本是多少？

连接器通常是根据购买价格来选择的，而没有充分考虑与使用它们相关的成本。连接器的真正成本是多少？

发表于 12-01 16:14 •765次阅读

哪位大佬能提供一下中科微CSM32RV003单片机开发系统中gpio.h文件的中文解释，及用法

却是拦路虎，还有那些英文水平差的人，电子技术水平较低的人，很是打击学习的积极性。哪位大佬能把gpio.h加上中文注释，在函数中怎么用的，配套的电路图等，让初学者少走些弯路。

发表于 10-26 09:47

钉钉AI具备文生文、文生图、应用生成等AI能力

钉钉AI具备文生文、文生图、应用生成等AI能力此前在4月18日的钉钉2023春钉峰会上宣布全面接入通义千问大模型，并实际演示了AI部分能力。此后，该公司开始了内部测试，此次是该公司的“/”能力首次

发表于 05-31 18:50 •1340次阅读

检测器故障怎么规避

检测开关是人工智能的最大拦路虎。因此我们我们可以进行双开关设计。当一个开关损坏就报错。要双开关到位才工作。这样就避免因为开关误报的情况。

发表于 05-22 14:18

搜索历史

文生视频，硬件成本是最大拦路虎

评论

文生视频Pika 1.0爆火！一句话生成视频，普通人也能当“导演”

OpenAI发布文生视频大模型Sora、英伟达市值超谷歌

7万张H100打造的OpenAI文生视频Sora功能原理详解|Sora注册全攻略

OpenAI文生视频模型Sora要点分析

OpenAI新推文生视频大模型Sora引发热议，首批受益者涌现

【国产FPGA+OMAPL138开发板体验】（原创）7.硬件加速Sora文生视频源代码

OpenAI发布人工智能文生视频大模型Sora

英伟达市值跃居全球第四文生视频大模型Sora带动

OpenAI发布文生视频模型Sora，引领AI视频生成新纪元

OpenAI推出全新文生视频模型Sora

奥特曼发布王炸模型Sora OpenAI首个文生视频模型Sora正式亮相

连接器的真正成本是多少？

哪位大佬能提供一下中科微CSM32RV003单片机开发系统中gpio.h文件的中文解释，及用法

钉钉AI具备文生文、文生图、应用生成等AI能力

检测器故障怎么规避