0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

文生视频,硬件成本是最大拦路虎

E4Life 来源:电子发烧友网 作者:周凯扬 2024-02-26 09:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群



电子发烧友网报道(文/周凯扬)自文本与图片类的AIGC爆火以来,几乎所有互联网公司和应用开发商都在跟进。然而近期随着Sora的爆火,决定开发同类应用的厂商却少之又少,这就不得不谈到硬件成本的问题,毕竟一个能够实现文生视频的应用,服务器成本要远远高于GPT类应用。

从文生视频模型的配置谈硬件成本

对于目前市面上的一些文生视频模型而言,其配置往往决定了体验的好坏。就拿Runway的Gen-2模型来说,其最大的特点在于可以生成4K级别分辨率的视频,且具备影视级别的构图和运镜,支持图片和文本的指令输入。

然后是最近一炮走红的Sora,其将最大时长做到了1分钟,且支持符合部分物理规律的世界模型,以及多镜头的切换等。不过与Gen-2模型一样,其对分辨率也进行了限制,甚至只能生成1080p的视频。

其他文生视频模型的配置则更加捉襟见肘,比如Meta的Emu Video只能生成最长4秒的512x512分辨率视频等等。从以上文生视频模型看来,由于为了确保画面一致性,视频分辨率、视频长度和每秒帧数往往决定了生成单个视频的硬件负载。目前对于硬件要求最高的应该是Runway的Gen-2和OpenAI的Sora。

这也是为何文生视频应用均采用订阅模式,甚至是按量订阅的付费策略,比如生成视频的项目数量、存储空间、导出质量等,文生视频考验的不仅是服务器算力,还有存储成本。毕竟为了方便用户回溯,这些生成的视频依然需要存储在服务器上一段时间。

就以Runway为例,要想完全无限制地生成视频功能,每月订阅费用高达76美元,且这仅仅意味着450s的Gen-2视频生成,如果用户需要生成更多内容,则还需要额外购买。可见为了维持服务器费用,文生视频应用面临的成本压力要远大于GPT类应用。

不只是云端,硬件成本也决定了本地部署的难度

从ChatGPT和Stable Diffusion这两个最火的AIGC应用就可以看出,硬件是开发这类应用的最大门槛之一。基于低成本硬件打造的类ChatGPT应用响应时间慢,生成内容质量差。而Stable Diffusion这类文生图模型,已经可以在消费级硬件上实现不错的效果,甚至可以普及到一些低功耗的端侧设备上。

但对于Sora这类文生视频的模型而言,要想在消费级实现本地部署可谓是难于登天,在完成内容的基本生成工作后,还需要经历风格化、分镜、遮罩、渲染和自定义等一系列流程,可以说不仅考验硬件的AI算力,也对视频渲染能力提出了更高的要求。

据了解,一批开源开发者已经在构建OpenAI Sora的复制版本,且可以在使用消费级英伟达GPU的高配电脑上跑通。不过马斯克也评论道,他也认为这是可行的,但是帧渲染速率会非常低。如果需要花上数小时,才能生成出一个质量较差的4秒视频,对于绝大多数用户来说,必然不是好的体验。

写在最后

要论硬件成本的话,对于应用开发者和用户而言,文生视频目前还是一个较为昂贵的“玩具”。但我们也不能否认其前景,随着算力成本逐渐下降,未来文生视频不仅可以作为内容创作途径,也可以作为辅助工具,替代掉一部分重复性工作,尤其是在广告视频行业。

不过这类应用的出现,也会让我们开始重新审视起GPU在AIGC硬件市场的地位,毕竟多出了图形渲染这一额外的硬件要求,其他的ASIC方案在这方面固然会逊色GPU一筹。再加上英伟达GPU在物理仿真上的优势,或许文生视频会给英伟达带来更多的市场机遇。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38170

    浏览量

    296871
  • AIGC
    +关注

    关注

    1

    文章

    391

    浏览量

    3153
  • 大模型
    +关注

    关注

    2

    文章

    3448

    浏览量

    4974
  • Sora
    +关注

    关注

    0

    文章

    86

    浏览量

    757
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    华为数据存储与「DaoCloud 道客」发布AI推理加速联合解决方案

    规模化发展的拦路虎。在有限算力下,长序列输入导致首Token时延(TTFT)增加,甚至超长序列超出模型上下文窗口限制;随着并发数增加,推理吞吐开始下降,任务频繁卡顿;历史对话和行业知识的重复调用造成算力浪费,加大推理成本。如何优化
    的头像 发表于 11-28 10:03 196次阅读
    华为数据存储与「DaoCloud 道客」发布AI推理加速联合解决方案

    中国制造设备出海拦路虎:电压不匹配的技术解决方案

    一、子主题1:电压不匹配——中国制造出海的“隐性壁垒” 定义与解释 电压不匹配指中国制造设备(多采用380V/50Hz标准)与目标市场电网电压/频率的差异,导致设备无法正常启动、运行不稳定甚至烧毁的问题。其根源是全球电力标准的碎片化:不同国家因历史、技术路径差异,形成了独特的电压(如美国480V、古巴440V、菲律宾220V)、频率(如美国60Hz、中国50Hz)及接线方式(如星形/三角形)标准。 关键事实与趋势 数据支撑:据中国机电产品进出口商
    的头像 发表于 10-17 16:07 250次阅读
    中国制造设备出海<b class='flag-5'>拦路虎</b>:电压不匹配的技术解决方案

    从“能跑”到“能替代人”,自动驾驶普及的真实拦路虎是什么?

    大规模商业化”中间,好似有道横亘的鸿沟,即便已经多年过去,自动驾驶仍旧没有质的提升。 到底是什么在挡路?技术不够、成本太高、法规没跟上、还是公众不信任?这个答案不是单一要素能概括的,但如果把所有因素往根源上追一追,会发现一个核
    的头像 发表于 10-17 09:27 296次阅读
    从“能跑”到“能替代人”,自动驾驶普及的真实<b class='flag-5'>拦路虎</b>是什么?

    降低无人门店运营成本:大厦无人超市解决方案

    在零售行业竞争日益激烈的当下,运营成本高企成为不少门店发展的“拦路虎”,人工开支、低效收银等问题更是让经营者倍感压力。而大厦无人超市解决方案的出现,凭借前沿技术赋能,为破解这一难题提供了全新思路,也
    的头像 发表于 10-10 16:33 465次阅读
    降低无人门店运营<b class='flag-5'>成本</b>:大厦无人超市解决方案

    艾德克斯IT2705直流电源分析仪助力低功耗设备测试

    在电子产品更新中用户总在期待更长的续航时间,但一边是功能的增加,另一边是体积的缩减,这两者成了电池容量提升的“拦路虎”,让电池容量始终处于“紧平衡”状态。这使得续航能力一直是消费电子、医疗电子与通讯模块等产品的一个重要竞争点。
    的头像 发表于 09-08 16:10 838次阅读

    光伏电站效率低、电费高还影响电网?安科瑞电能质量治理方案为您解忧--安科瑞潘丽

    稳定。别担心,安科瑞电能质量治理方案来了,为您破解难题! 一、分布式光伏电站的两大 “拦路虎” 1. 关口功率因数过低:电费考核的隐形 “杀手” 当企业屋顶光伏发电量充足,基本能满足内部负荷时,企业用电主要取自光伏
    的头像 发表于 08-27 11:20 430次阅读
    光伏电站效率低、电费高还影响电网?安科瑞电能质量治理方案为您解忧--安科瑞潘丽

    工业质检再升级:复杂网络检测模型破解多场景检测难题

    在工业视觉检测领域,缺陷类型多样、目标尺度差异大、图像质量参差不齐等问题,一直是企业提升质检效率的拦路虎。阿丘科技最新发布《检测工具复杂网络功能白皮书》,带来了一款针对复杂场景的检测利器,让低对比度
    的头像 发表于 07-16 15:52 584次阅读
    工业质检再升级:复杂网络检测模型破解多场景检测难题

    7 PLUS和瑞7高能版换新上市

    近日,瑞7系列迎来双车焕新——瑞7 PLUS&瑞7 高能版新版型在知名歌手林依轮直播间上市。以“全球销冠,价值标杆”之姿,定义A级SUV价值新标杆!瑞7 高能版新版型限时红包价
    的头像 发表于 06-18 16:13 665次阅读

    光网络全面革新!ADOP 400ZR+技术深度解析:从原理到实战,一文读懂如何省电80%、降本70%

    引言 : 全球数据中心能耗正以每年10%的速度增长,传统光网络的高功耗、复杂架构和昂贵成本已成为企业数字化转型的“拦路虎”。ADOP(前沿光学科技)推出的 400ZR+相干可插拔光学技术 ,凭借
    的头像 发表于 05-29 17:24 340次阅读
    光网络全面革新!ADOP 400ZR+技术深度解析:从原理到实战,一文读懂如何省电80%、降本70%

    福田汽车800V高压平台技术打造绿色物流运输新体验

    在新能源商用车领域,充电慢、续航短的难题,一直是新能源物流车用户拓展业务的“拦路虎”。每一次长时间的充电等待,都意味着运输效率的降低和运营成本的增加;每一段有限的续航里程,都限制了物流配送的范围,让
    的头像 发表于 05-21 09:31 693次阅读

    智慧路灯的成本是多少

    引言 在数字化转型的时代浪潮中,叁仟智慧路灯凭借其强大的功能,成为智慧城市建设的标志性元素。然而,在其推广与落地过程中,成本问题如影随形,不仅关系到项目的预算规划,更左右着行业的未来走向。深入剖析
    的头像 发表于 03-27 22:50 781次阅读
    智慧路灯的<b class='flag-5'>成本是</b>多少

    DeepSeek一体机:加速AI训推超融合,推动行业智能化落地

    在人工智能技术迅猛发展的今天,大模型技术正加速从“实验室”迈向“产业场景”,然而数据工程复杂、模型适配难、训练成本高等问题,仍是行业化落地的“拦路虎”。 华为DCS AI解决方案针对DeepSeek
    的头像 发表于 02-20 11:14 1266次阅读
    DeepSeek一体机:加速AI训推超融合,推动行业智能化落地

    富唯智能复合机器人:解锁工业生产新效能

    在当下工业生产的激烈竞争中,降本增效、提升产品质量是企业发展的关键。然而,传统生产模式在搬运效率、定位精度等方面的短板,成了企业前行路上的 “拦路虎”。别担心,富唯智能复合机器人的出现,为企业带来了破局之道。
    的头像 发表于 02-15 16:11 857次阅读
    富唯智能复合机器人:解锁工业生产新效能

    腾讯混元文生图登顶智源FlagEval评测榜首

    近日,北京智源人工智能研究院(BAAI)发布了最新的FlagEval大模型评测排行榜,其中多模态模型评测榜单的文生图模型引起了广泛关注。结果显示,腾讯混元的文生图能力在此次评测中表现出色,成功登顶
    的头像 发表于 12-25 10:06 1197次阅读

    简述讯飞星火文生图技巧

    AI文生图不会取代设计师,但让每个人都有机会设计自己的作品。
    的头像 发表于 12-13 13:45 1870次阅读