0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用URL2Video可以将网页快速生成有创意的短视频

LiveVideoStack 来源:LiveVideoStack 作者:LiveVideoStack 2020-12-07 14:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器学习可以实现对网页内容的理解,并选取关键对象生成有趣的短视频。Google研究团队通过使用URL2Video可以将网页快速生成有创意的短视频。包括百度、快手、字节跳动等都有相关的短视频自动化生产工具,随着技术的成熟,将有大量的短视频出自自动化工具之手。在12月的LiveVideoStackCon 2020 SFO线上大会上,百度美国研究院资深研究员陈曦将会介绍“无人值守的大规模AI视频生产”。

在Google,我们正在积极探索在制作多媒体内容时,人们如何使用由机器学习和计算方法提供的创造性工具,从创作音乐、重新架构视频,到绘画等等都涉及到了这方面内容。尤其是视频制作这样一个颇具创意的过程,它可以很好地受益于这些工具,因为它需要做出一系列决策,确定哪些内容最适合目标受众,如何在视图中妥善排布现有资源,以及怎样进行时间安排能够带来最具吸引力的描述。但假如一个人能利用现有的资源,比如一个网站,来开启视频创作呢?大多数企业主办的网站都呈现了关于其产品或服务丰富的视图内容,所有这些内容都可以被重新应用到其他多媒体格式,比如视频,这可能使那些没有大量资源的人能够接触到更广泛的受众。 2020年UIST上发表的“网页端视频的自动化制作”里,我们介绍了一种基于内容所有者提供的时间和视图限制,将网页自动转换为短视频的研究原型——URL2Video。URL2Video从HTML源中提取资源(文本、图像或视频)及其设计风格(包括字体、颜色、图形布局和层次结构),并将这些可视资源组合成一系列的快照,同时保持与源页面相似的外观和感觉,然后根据用户指定的纵横比和持续时间,将这些材料重新利用,渲染成一个适合产品和服务广告的视频。

URL2Video概述

假设用户提供了一个阐述他们业务的网页URL,URL2Video会自动从页面中选择关键内容,并根据一组针对熟悉网页设计和视频广告制作的设计师的访谈研究得到的启发式算法,决定每个资源的时间和视图展示。这些如设计师般熟知的启发式算法捕获常见的视频编辑样式,包括内容层次结构,限制一个快照中的信息量及其持续时间,为品牌提供一致的颜色和样式等等。利用这些信息,URL2Video解析网页,分析内容,选择视觉突出的文本或图像,同时保留它们的设计风格,并根据用户提供的视频规范进行组合。

通过在输入的网页中提取结构内容和设计,URL2Video做出自动编辑决策,在视频中呈现关键信息。它考虑到用户定义的输出视频的时间限定(比如以秒为单位的持续时间)和空间限定(比如高宽比)。

网页分析

一个网页的URL,URL2Video会提取它的文档对象模型(DOM)信息和多媒体材料。出于研究模型的目的,我们将域限制在静态网上,这些页面包含HTML层次结构中保存的突出资源和标题,这些层次结构遵循最近的网页设计原则,鼓励使用重点的元素、更清晰的部分以及引导读者感知信息的视觉焦点顺序。URL2Video将这些视觉上可区分的元素标记到资源组的候选列表,每个元素可能包含一个标题、一个产品图象、详细描述和调用操作按钮,并捕获每个元素的原始素材(文本和多媒体文件)和详细的设计规范(HTML标签、CSS样式和呈现位置)。然后,通过根据每个资源组的视觉外观和注释,包括它们的HTML标签、呈现的尺寸还有显示在页面上的顺序对每个组进行排序。这样,在页面顶部占据较大区域的资源组将获得更高的分数。

限定型的资源选择

在制作视频时,我们考虑了两个目标:(1)每个镜头都应该提供简洁的视频信息;(2)视觉设计应该与源网页一致。基于这些目标和用户提供的视频限定条件,包括预期的视频持续时间(以秒为单位)和高宽比(通常为16:9、4:3、1:1等),URL2Video自动选择并命令资源组优化总体优先级分数。为了使内容简洁,它只显示页面中的主要元素,例如标题和一些多媒体资源。它限定了观众所感知内容的每个视觉元素的持续时间。这样,简短的视频强调了页面顶部最突出的信息,时间长一些的视频则包含了更多的商业活动或产品信息。

画面构图与视频渲染

根据基于DOM层次结构的有序资源列表,URL2Video并行依照从访谈研究中获得的设计启发,对时间和空间安排做出决策,将资源在单个镜头中展现出来。它将元素的图形布局转换为视频的纵横比,并应用了包括字体和颜色在内的样式选择。为了使视频更具动感和吸引力,它调整了资源的显示时间。最后,它将内容渲染为MPEG-4格式的视频。

用户控制

研究原型界面允许用户查看源网页提取的每个视频镜头中的设计属性,以及重新排版材料,更改细节设计,如颜色和字体,并更改限制条件来生成新的视频。

在URL2Video的创作界面(左)中,用户指定源页面输入的URL、目标页面视图的大小以及输出视频参数。URL2Video分析网页,并提取主要的视觉组件。由它组成了一系列的镜头,并将关键画面可视化为一个故事板。这些组件满足输入时间和空间限定后输出呈现为视频。用户可以播放视频,检查设计属性(右下角),并进行调整以做视频更改,例如重新排序镜头(右上)。

URL2Video用例

我们在现有的各种网页上演示了端到端的URL2Video的性能。下面我们特别展示一个实例结果,其中URL2Video将嵌入多个短视频剪接的页面转换为一个12秒的输出视频。请注意它如何在从源网页面捕获的视频中对字体和颜色选择、时间和内容排序作出自动编辑决定的。

URL2Video从我们的Google搜索介绍页面(顶部)识别关键内容,包括标题和视频资源。通过综合考虑显示流程、源设计和输出限定,URL2Video将它们转换为视频(12秒的横向视频;底部) 下面的视频作了进一步的演示: https://www.youtube.com/watch?v=3yFYc-Wet8k&feature=youtu.be 为了评估自动生成的视频,我们与Google的设计师进行了一项用户研究。实验结果表明,URL2Video能够有效地从网页中提取设计元素,并通过引导视频创建的过程为设计师提供支持。

下一步

虽然目前的研究集中在视觉展示,但我们正在开发新的技术,以在视频编辑中支持音轨和画外音。总之,我们设想的未来是,创作者专注于做出高层决策,而机器学习模型配合其在多个平台上为最终视频的制作提供详细的时间和图形编辑建议。

致谢

我们非常感谢我们的论文合著者Zheng Sun(Research)和Katrina Panovich(YouTube)。我们还要感谢我们的同事,他们(按姓氏的字幕顺序)-JordanCanedy, Brian Curless, Nathan Frey, Madison Le, Alireza Mahdian, Justin Parra,Emily Ryan, Mogan Shieh, Sandor Szego和Weilong Yang-为URL2Video作出了贡献。我们感谢我们的领导人Tomas Izo, RahulSukthankar和Jay Yagnik的支持。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动化
    +关注

    关注

    30

    文章

    5886

    浏览量

    89244
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136233
  • 短视频
    +关注

    关注

    1

    文章

    128

    浏览量

    9518

原文标题:URL2Video:把网页自动创建为短视频

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    快手平台根据关键词获取视频列表的 API 接口详解

    ​ 引言 在开发与短视频内容相关的应用时,经常需要根据特定关键词搜索并获取平台上的视频列表。快手作为国内领先的短视频平台,其开放平台提供了丰富的 API 接口供开发者使用。本文详细介
    的头像 发表于 11-18 15:26 203次阅读
    快手平台根据关键词获取<b class='flag-5'>视频</b>列表的 API 接口详解

    定格假期,记录美好 | 安泰电子高温假短视频大赛颁奖典礼圆满落幕​!

    Aigtek高温假短视频大赛颁奖!秋意渐浓,丹桂飘香,9月17日,安泰电子“定格假期,记录美好”高温假短视频大赛精彩收官。这场比赛不仅是创意的比拼,更是员工们分享假期快乐的窗口。今天,让我们一同
    的头像 发表于 09-18 18:37 311次阅读
    定格假期,记录美好 | 安泰电子高温假<b class='flag-5'>短视频</b>大赛颁奖典礼圆满落幕​!

    中兴通讯如何提升短视频用户感知

    短视频业务发展迅猛,种类日趋复杂,由早期的爱奇艺、腾讯视频等发展到现在的南抖音北快手、小红书等,另外,短视频业务也已经占据了日常生活大量的碎片时间。
    的头像 发表于 08-20 10:26 719次阅读

    鸿蒙5开发宝藏案例分享---在线短视频流畅切换

    的优化方案躺在那儿,从短视频秒切到金融App防崩溃,连代码都给你打包好了!**最离谱的是,这么硬核的案例库居然没几个人知道? 今天必须当回课代表,把压箱底的黑科技掏出来,尤其那个让短视频切换如德芙般丝滑
    发表于 06-12 11:31

    鸿蒙5开发宝藏案例分享---一多开发实例(短视频

    ?【干货预警】今天在鸿蒙开发者文档里挖到宝了!原来官方早就藏了这么多\"一多开发\"的实战案例,难怪我之前的跨端适配总踩坑... 这就把最新发现的短视频开发秘籍整理分享给大家
    发表于 06-03 15:59

    S-Video接口概述和分类

    S-Video接口在当下视频接口中,存在感已经渐渐减少,它们的样式与“古早”的很多接口相似。在视频接口的发展中,它依然是必不可少的。本期我们围绕S-
    的头像 发表于 04-11 10:59 2768次阅读
    S-<b class='flag-5'>Video</b>接口概述和分类

    Ntag424使用Sun功能编写URL的卡片中的URL是否可以在每次读取时更改?

    必须更改(类似于动态值)实际上我几个问题,他们的答案解释一切。我想根据场景提出一些问题; 1- 我使用 Sun 功能编写 URL 的卡片中的 URL 是否
    发表于 04-10 06:20

    DLP6500FYE如何使用video mode?

    问题1:我想试用DMD的视频模式,但是我HDMI线连接DMD控制板和电脑,并完成video mode 设置后,DMD并没有投影出电脑端的图案(激光照明),具体该如何使用video
    发表于 02-24 07:59

    X平台推出短视频信息流,瞄准美国TikTok用户

    就在TikTok恢复美国服务之际,X平台也宣布了一项重要更新——上线短视频信息流服务。这一举措无疑加剧美国短视频市场的竞争。 X平台表示,他们正在为美国用户打造一个新的“沉浸式视频
    的头像 发表于 01-22 10:36 1059次阅读

    借助谷歌Gemini和Imagen模型生成高质量图像

    快速发展的生成式 AI 领域,结合不同模型的优势可以带来显著的成果。通过利用谷歌的 Gemini 模型来制作详细且富有创意的提示,然后使用 Imagen 3 模型根据这些提示
    的头像 发表于 01-03 10:38 1335次阅读
    借助谷歌Gemini和Imagen模型<b class='flag-5'>生成</b>高质量图像

    华为云 Flexus 云服务器 X 实例 Windows 系统部署一键短视频生成 AI 工具 moneyprinter

    在追求创新与效率并重的今天,我们公司迎难而上,决定自主搭建一款短视频生成 AI 工具——MoneyPrinter,旨在为市场带来前所未有的创意风暴。面对服务器选择的难题,我们经过深思熟虑与多方比较
    的头像 发表于 12-30 09:10 961次阅读
    华为云 Flexus 云服务器 X 实例 Windows 系统部署一键<b class='flag-5'>短视频生成</b> AI 工具 moneyprinter

    Luma AI Ray 2视频模型即将发布

    能够在短短10秒内,根据用户提供的文本和图像提示,生成高质量的视频内容。 Luma AI Ray 2视频模型是Luma AI为视频创作者量身
    的头像 发表于 12-20 11:37 981次阅读

    Lightricks与Shutterstock携手,推动开源LTXV视频人工智能生成视频模型发展

    ,Lightricks将能够利用高质量HD和4K视频素材,进一步训练其开源视频生成模型——LTX Video(LTXV)。 Lightricks成为首个在Shutterstock行业首创
    的头像 发表于 12-15 09:31 730次阅读
    Lightricks与Shutterstock携手,推动开源LTXV<b class='flag-5'>视频</b>人工智能<b class='flag-5'>生成</b>式<b class='flag-5'>视频</b>模型发展

    OpenAI推出AI视频生成模型Sora

    。用户只需输入自己期望的场景或构思,Sora便能根据这些输入,快速生成高清的视频剪辑结果。这一功能无疑为视频制作领域带来了革命性的变革。 通过Sora,用户
    的头像 发表于 12-12 09:40 1063次阅读

    OpenAI开放Sora视频生成模型

    升级,准备迎接广大用户的深入探索与广泛应用。 据官方公告介绍,Sora Turbo作为Sora的升级版本,具备强大的视频生成能力。它能够根据用户的文本提示,快速创建出最长达20秒的高清视频片段。更令人惊喜的是,Sora Turb
    的头像 发表于 12-10 11:16 1074次阅读