搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

AI视频创作一条龙！达摩院“寻光”平台炸场WAIC，突破可控编辑难题

卡奥斯智能交互引擎是卡奥斯基于海尔近40年工业生产经验积累和卡奥斯7年工业互联网平台建设的最佳实践，基于大语言模型和RAG技术，集合海量工业领域生态资源方优质产品和知识服务，旨在通过智能搜索、连续交互，实时生成个性化的内容和智能化产品推荐，为用户提供快速、可靠的交互式搜索服务，首创了聚焦工业领域的智能交互引擎。

详情戳：卡奥斯智能交互引擎

AIGC时代，视频创作这事儿真的不一样了。

就像这样，轻轻一圈，选定目标立刻变身单独图层，再丝滑嵌入不同的背景视频，场景变换so easy~

想要调整一下镜头角度，交给AI，同样能一键完成：

还能一键消除、修改目标：

后期再也不用加班加到手抽筋（doge）。

划！重！点！这还不是实验室里的单一技术demo，而是马上就要开放内测，让创作者们直接可以用起来的一站式AI视频创作平台——“寻光”。

就是说，传统上分散在不同制作流程中的剧本创作、分镜图设计、视频素材编辑等步骤，现在都可以在AI加持下，在同一个平台上流畅完成。

这就是阿里达摩院在上海世界人工智能大会上带来的最新惊喜。

演示一出，现场的观众都坐不住了。

而达摩院官方，也透露出了AI视频领域新成果背后更大的“野心”：

不对标Sora，而是走自己的路，希望更快让AI生产力匹配人类想象力。

“寻梦光影间”

所谓寻光，意指“寻梦光影间”：

即通过人工智能技术，提供全新的视频创作模式。

与Sora等今年备受关注的AI视频生成模型不同，寻光关注到的，是“Sora之后，视频工作流的变革”。

达摩院认为，Sora等AI视频生成模型给足了人们对视频生产方式彻底变革的想象力，但一方面，AI视频内容的可控编辑，包括对复杂剧情的理解、生成对象的一致性等，仍然是当前算法所面临的一大挑战。

另一方面，业界尚没有统一的AI视频编辑平台，能让创作者们一站式体验到AI加持的视频创作全流程。

举个例子，OpenAI创始成员Andrej Karpathy最近也玩上了AI视频，整出了个AI版《傲慢与偏见》。

在这个短片的制作过程中，他用到的工具包括Claude、Ideogram、Luma、ElevenLabs、VEED……而他本人也抱怨说：

老实说这个工作流非常混乱，工具与工具之间存在大量的复制粘贴，3个片段的简单小视频就花了我大约1个小时的时间。
这里面存在一个巨大的机会。谁正在打造100%的AI原生视频制作平台？

达摩院打造寻光，定位为PUGC一站式AI视频创作平台，目标正是针对以上问题，用AI能力重塑传统视频制作的全流程。

具体来说，寻光可以辅助用户创作剧本、分镜图等，支持对生成及上传素材进行丰富的AI编辑，包括人物控制、场景控制、运镜控制、目标新增/消除/修改等10多种功能。

并且在交互方面，主打“让视频编辑像操作PPT一样简单”。

以分镜设计环节为例，上传到寻光的原始视频素材，会由算法切分成多个分镜头。

在创作空间里，用户可以方便地查看到每一个分镜头，并用简单的拖拽操作对其进行调整。

在新建的空白分镜中，除了添加已有素材，寻光平台还支持用户调用多种多模态生成模型，生产新的内容。

而在编辑功能方面，寻光强调的是精细化的编辑和控制：在AI加持下，依据用户意图，在语义层面而不是像素层面实现编辑；同时，视频里的人体、人脸、前景、背景等任意局部目标，都可以进行精细化的编辑和修改。

在现场，达摩院视觉技术实验室高级算法专家陈威华着重提到了基于视频图层的编辑能力。

以前景图层功能为例，用户通过文本输入，即可生成符合描述的、具有透明背景的视频，并且一键就能将其融合到其他背景视频当中。

寻光也支持图层拆解功能，用户在视频第一帧选择想要提取的物体，算法就会自动跟踪，把整段视频中对应的目标拆解出来，形成独立的带透明背景的视频图层。

飘动的头发也扣得很精细的那种：

另外，在对视频全局元素的编辑方面，风格迁移上，寻光平台提供了20+不同风格。

运镜控制上，左右平移、上下平移、推进拉远、左右环绕等都能支持。

在对视频局部元素的编辑方面，除了目标消除，寻光平台还能实现人脸的精准控制：

△

视频取自国风武侠动漫《少年白马醉春风》第三集

轻轻一拉实现运动控制：

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
89

文章
38111

浏览量
296656
人工智能

人工智能

+关注

关注
1813

文章
49739

浏览量
261548

评论

精选推荐
更多

文章

资料

帖子

从系统视角选时钟：一张“应用分层地图”讲清 TCXO / OCXO / SAW 的正确打开方式

FCom富士晶振
1小时前

65 阅读

基于AIK-RA8D1的人脸识别的应用演示

RA生态工作室
6天前

473 阅读

2025中国人工智能大会，藏着AI的行动派时刻

脑极体
18小时前

1055 阅读

T型三电平拓扑架构深入剖析与碳化硅MOSFET技术优势的全面研究报告

杨茜
1天前

2426 阅读

温补晶振选型有哪些关键参数呢？

赛思电子
4天前

3359 阅读

matlab实验讲义下载

jsqueh
33333

10积分

218下载

制冷技术手册

ejlwj
3540

10积分

158下载

Fairchild Go语言通用代码生成器

熊本熊
25.06 MB

2积分

1下载

INA168电流传感器模块开源分享

李泳瑜
0.10 MB

免费

2下载

微功耗电压基准LMx85-2.5、LM385B-2.5数据表

刘玉兰
1.33MB

免费

1下载

【社区之星】李杨——把头扎进沙漠，发现沙子下是星辰大海

dianzi_0101
16小时前

16 阅读

我们计划设计一个基于电容的自举电路，招募英雄！

jf_53150340
16小时前

10 阅读

【瑞萨RA6E2地奇星开发板试用】+ 1.点灯测试1500ms跳转一次

jf_43382582
16小时前

11 阅读

飞凌嵌入式ElfBoard-文件I/O的深入学习之文件锁

jf_13411809
16小时前

9 阅读

低功耗STM8L052C6T6+LCD屏

jf_85666024
16小时前

158 阅读

推荐专栏
更多

企业产品

资料

方案
更多

华秋（原“华强聚丰”）：

电子发烧友

华秋开发

华秋电路(原"华强PCB")

华秋商城(原"华强芯城")

华秋智造

My ElecFans

APP
网站地图

设计技术

可编程逻辑

电源/新能源

MEMS/传感技术

测量仪表

嵌入式技术

制造/封装

模拟技术

RF/无线

接口/总线/驱动

处理器/DSP

EDA/IC设计

存储技术

光电显示

EMC/EMI设计

连接器

行业应用

LEDs

汽车电子

音视频及家电

通信网络

医疗电子

人工智能

虚拟现实

可穿戴设备

机器人

安全设备/系统

军用/航空电子

移动通信

工业控制

便携设备

触控感测

物联网

智能电网

区块链

新科技

特色内容

专栏推荐

学院

设计资源

设计技术

电子百科

电子视频

元器件知识

工具箱

VIP会员

最新技术文章

产品地图

品牌地图

社区

小组

论坛

问答

评测试用

企业服务

产品

资料

文章

方案

企业

供应链服务

硬件开发

华秋电路

华秋商城

华秋智造

nextPCB

BOM配单

媒体服务

网站广告

在线研讨会

活动策划

新闻发布

新品发布

小测验

设计大赛

华秋

关于我们

投资关系

新闻动态

加入我们

联系我们

举报投诉

社交网络

微博

移动端

发烧友APP

硬声APP

WAP

联系我们

广告合作

王婉珠：wangwanzhu@elecfans.com

内容合作

黄晶晶：huangjingjing@elecfans.com

内容合作（海外）

张迎辉：mikezhang@elecfans.com

供应链服务 PCB/IC/PCBA

江良华：lanhu@huaqiu.com

投资合作

曾海银：zenghaiyin@huaqiu.com

社区合作

刘勇：liuyong@huaqiu.com

关注我们的微信

下载发烧友APP

电子发烧友观察

电子工程师社区

1-32层PCB打样·中小批量

元器件现货·全球代购·SmartBOM

SMT贴片·PCBA加工

PCB Manufacturer

华秋简介

企业动态

联系我们

企业文化

企业宣传片

加入我们

版权所有 © 湖南华秋数字科技有限公司

长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层（0731-88081133）
电子发烧友 （电路图） 湘公网安备43011202000918 工商网监湘ICP备2023018690号-1