AVA新技术让剧照清晰又好看-电子发烧友网

电影、剧集等视频的创作、生产、分销等环节已经可以通过算法优化提升效率。Netflix的AVA平台可以自动的甄选最有代表性的剧照，从而针对不同人群推送最能打动观众的剧照。

在Netflix公司，无论是内容平台工程师团队，还是全球产品创意团队都知道，观众在寻找新的节目和电影观看时，封面插图扮演着非常重要的角色。我们可以透过封面插图，揭示故事的独特元素，而这些元素将我们的观众与不同的角色和故事线索联系起来。我们为此感到很自豪。随着我们的原创内容不断增多，我们的技术专家的任务是寻找新的方式来处理不多扩展的资源，并使我们的创意可以摆脱不断增长的令人厌烦的数字宣传需求。其中的一个方法是直接从我们的源视频中采集静态图像帧，以提供更加灵活的原始插图来源。

商业案例

宣传剧照是直接从源视频内容中获取的静态视频帧，用于扩大Netflix服务的标题范围。在一个一小时的新剧集中，有近86,000个静态视频帧。

通常来说，这些宣传剧照是由影片的策划人或编辑人工选择的，他们需要对打算呈现的源内容有深入的了解。通过A / B测试我们了解到，通过尽可能多地变换各种不同的标题，我们可以有效地推动预期和意外受众群体进行更多地观看。说到标题艺术，我们喜欢测试一个标题的许多艺术表现形式，以便为正确的观众找到“正确的”作品插图。虽然这为创新和测试提供了一个令人兴奋的机会，但它同时也提出了一个非常严峻的挑战，即在我们不断增长的全球内容目录中的每个标题上实践这种体验。

AVA

AVA是一个工具和算法的集合，旨在从我们服务的视频中提取高质量的图像。平均一个电视节目（约10集）包含近900万个总帧数。要求创意编辑们从许多视频帧中有效筛选出来一个能够吸引观众注意力的视频帧是乏味并且缺乏效率的。我们着手构建了一个工具，能够快速有效地识别Netflix服务上哪些帧能够最佳地表达主题和标题。

为了实现这个目标，我们首先提出了客观信号，它可以促使我们使用帧注解来衡量视频的每一帧。因此，我们可以收集视频的每个帧的有效表示。随后，我们创建了排序算法，使我们能够对符合审美、创意和多样性目标的视频帧子集进行排序，以准确地为我们产品的各种画面呈现内容。

由AVA提供的备选图像

从源视频到编辑备选图像的高级阶段

帧注解

作为我们自动化流水线的一部分，我们在视频的每个帧中都处理和注释不同的变量，以便最好地得出帧的内容，并理解该帧对于故事是否重要。为了进行横向扩展，并为不断增长的内容目录提供可预测的SLA，我们利用Archer框架更有效地处理视频。Archer允许我们把视频分成更小的可以并行处理的视频块。这使我们能够通过提高视频处理流水线的效率来扩展规模，并允许我们将越来越多的内容智能算法集成到我们的工具集中。

通过一系列计算机视觉算法处理一段内容中的每一帧视频，以收集客观帧元数据、帧的潜在表示，以及这些帧所包含的一些上下文元数据。我们处理和应用到视频帧的注解属性大致可以分为三大类：

视觉元数据

通常这些属性是客观的、可测量的，并且主要包含在像素级。视觉属性包括亮度、颜色、对比度和运动模糊等等。

我们在帧级捕获到的一些视觉属性的例子。

上下文元数据

上下文元数据由多个元素的组合组成，这些元素被聚合以从帧的角色、对象和摄影机的动作或移动中获得含义。下面是一些例子：

人脸识别。使用面部特征跟踪、姿态估计和情感分析技术 —— 这使我们能够估计该帧中主体的姿势和情绪。

运动估计—— 这使我们能够估计特定镜头中包含的运动量（包括摄影机运动和主体运动）。这使我们能够控制诸如运动模糊之类的元素，以及识别产生高质量静止图像的摄影机移动。

摄影机拍摄识别—— （例如，近距离拍摄与移动摄影车拍摄）这提供了对电影摄影师意图的洞察，使我们能够快速识别并显现出摄影师选择的体裁风格，以提供对主题表达的情绪、基调和流派的更深入洞察。

对象检测—— 道具和动画对象的分割检测使我们能够找到该帧中重要的非人类主体。

面部特征和姿势估计的例子; 我们用一些因子来检测帧特征，发现有令人信服的面部表情出现。

用于预测摄影机运动的光流分析示例，以估计Black Mirror的拍摄手法（缩小和平移镜头）。

构图元数据

构图元数据是指我们根据摄影、电影拍摄和视觉美学设计中的一些核心原理确定和定义的一组特殊的启发式特征。有一些构图的基本原则：三分法原则、景深原则和对称原则。

对象检测和语义分割的例子，以识别三分法美学的前景对象。

图像排名

在给定视频中的每一帧都经过处理和注解后，下一步就是通过一个自动艺术品流水线从这些帧中选出最佳的候选图像。这样，当我们的创意团队准备好开始一段内容的工作时，他们会自动提供一个高质量的图像集供您选择。下面，我们概述一些我们用来为给定标题提供最佳图像的关键考虑元素。

演员

演员在艺术品中起着非常重要的作用。我们确定给定情节的关键角色的一种方法是利用脸部聚类和角色识别的组合来对主要角色，而不是次要角色或额外角色进行优先顺序。为了达到这个目的，我们训练了一个深度学习模型，从所有符合帧注解的候选帧中追踪面部相似性，以找到并排序该标题的主要演员，而不知道该剧演员的任何情况。

除了演员重要性之外，我们还会考虑演员的姿势，面部标志以及角色的整体位置。

Wynona Ryder出演Joyce Byers时的帧排名和最佳选择范例。

由于次优的面部表情、姿势和动作模糊而排名较低的图像的示例

帧分类

创意和视觉分类是一个非常主观的学科，因为有很多不同的方式来感知和定义图像的多样性。在该解决方案中，图像分类更具体地指的是算法捕捉在单个电影或情节中自然发生的具有启发式变化的能力。在此过程中，我们希望为设计师和创意人员提供一个可扩展的机制，以便快速了解哪些视觉元素最能代表主题，以及哪些元素无法准确代表主题。我们在AVA中引入的一些视觉启发式变量为一个标题提供了不同的图像集，包括摄影机镜头类型（远景vs中景）、视觉相似性（三分法则，亮度，对比度）、颜色（最突出的颜色）和显著图（识别负面空间和复杂度）。通过结合这些启发式变量，我们可以基于定制矢量对图像帧进行有效聚类后再分类。此外，通过合并多个向量，我们能够构建一个多样性指数，针对某个特定情节或电影的所有候选图像进行评分。

AVA的镜头检测分集的例子; （左）中景，（中心）特写，（右）极端特写。

成人图像过滤器

考虑到内容敏感度和受众成熟度等原因，我们还需要确保排除了包含有害或令人反感元素的帧。编辑排除的标准示例，比如：性/裸露、文字、标志/未经授权的品牌，以及暴力/血腥。为了降低含有这些元素的帧的优先级，我们将这些变量中的每一个的概率作为向量，使我们能够量化并最终为这些帧赋予较低的分数。

我们还添加了标题流派，内容格式，成人度评分等元素作为次要元素或次要特征，并作为反馈，提供给排名预测模型。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

算法

算法

+关注

关注
23

文章
4454

浏览量
90747
甄别

甄别

+关注

关注
0

文章
2

浏览量
5356

原文标题：AVA：Netflix的剧照个性化甄选平台

文章出处：【微信号：livevideostack，微信公众号：LiveVideoStack】欢迎添加关注！文章转载请注明出处。

中科曙光获“国家级高新技术企业”认定

北京市认定机构2023年认定报备的第二批高新技术企业备案名单公布，曙光智算通过层层选拔，成功获得“国家级高新技术企业”认定，进一步彰显了在高端计算领域的硬核实力。国家级高新技术企业认定标准涉及到

发表于 01-18 18:51 •722次阅读

中科曙光获“国家级高<b class='flag-5'>新技术</b>企业”认定

智芯传感连续荣获国家“高新技术企业”称号

今日，北京市2023年度高新技术企业资格认定通过的第三批高新技术企业证书正式颁发，北京智芯传感科技有限公司凭借领先的技术实力、持续的创新能力和专业的人才团队，顺利通过各项评审，再次荣获国家“高

发表于 01-09 09:59 •312次阅读

天浩旭荣获“高新技术企业”认定

根据深圳市《高新技术企业认定管理办法》（国科发火〔2016〕32号）和《高新技术企业认定管理工作指引》（国科发火〔2016〕195号）有关规定，天浩旭科技获得2023年第三批高新技术企业资质认定

发表于 12-30 08:27 •104次阅读

新技术在生物样本冷冻中的应用案例分析

　　一、冷冻样本的新技术应用　　1. 低温离心　　低温离心是一种比较先进的生物样本冷冻处理技术，它可以在较低温度下将样本进行离心，从而有效地分离和保存其中的细胞和分子。相比传统的液氮冷冻方法

发表于 12-26 13:30

影响LED透明屏清晰度的因素有哪些？怎样提高LED透明屏的清晰度？

关键的方法和技术可以使用。首先，增加像素密度是提高LED透明屏清晰度的有效方法之一。像素密度是指每平方英寸中的像素数量，较高的像素密度可以提供更多的细节和更精确的图像。通过增加像素密度，LED屏幕能够呈现更清晰的图像和更细腻的

发表于 12-11 14:25 •495次阅读

好看的PCB也是产品的优势

的设计杰作。探讨好看的PCB设计，不仅涉及到创意设计、工艺技术、技术创新，还关乎品牌形象的打造，从而描绘出电子时代中PCB设计的全貌。好看的PCB设计的起源与电子产品与

发表于 12-11 08:00 •278次阅读

森源电气再次荣获“国家高新技术企业”称号

近日，我省2023年认定报备的第一批高新技术企业备案名单在国家高新技术企业认定管理工作网公示，河南森源电气股份有限公司榜上有名，再次荣获“国家高新技术企业”称号，这是森源电气自2000年以来

发表于 11-24 16:30 •442次阅读

那些应对APT攻击的最新技术

电子发烧友网站提供《那些应对APT攻击的最新技术.pdf》资料免费下载

发表于 11-10 10:42 •0次下载

燧原科技荣登“2023上海高新技术企业创新百强榜”

近日，2023浦江创新论坛·全球技术转移大会在上海张江科学会堂进行。会上，上海社会科学院应用经济研究所、上海市科技创业中心等联合发布了“2023上海高新技术企业创新百强榜”，燧原科技光荣上榜

发表于 09-19 10:45 •423次阅读

启英泰伦通话降噪方案，采用深度学习降噪算法，让通话更清晰

的使用体验。启英泰伦通话降噪方案具备以下特点： 1、采用深度学习降噪算法：利用深度神经网络进行模型训练，从而达到降噪效果，让目标声音更清晰。另一方面利用芯片NPU对神经网络算子进行运算加速，达到端侧

发表于 08-22 17:36

【8月3日|合肥】高速芯片设计新技术研讨会

会议信息时间： 2023年8月3日下午1330 地址：合肥皇冠假日酒店黄山路598号A座三楼红枫紫檀厅会议简介科技发展如浩瀚宇宙，是德科技一直为新技术的边际探索努力不止。数字时代

发表于 07-19 07:35 •295次阅读

安装个智能门锁，好看又实用!!!

智能门锁

学习电子知识
发布于 :2023年07月17日 00:24:48

LabVIEW工业设计好看控件合集

LabVIEW超级好看的控件合集，工业设计必备

发表于 06-29 15:02 •49次下载

【直播预告】今晚7点，来HarmonyOS极客松直播间与技术专家聊聊新技术！

HarmonyOS极客松直播间与技术专家聊聊新技术！

发表于 06-20 11:08

Flutter热更新技术探索

APP 发布到市场后，难免会遇到严重的 BUG 阻碍用户使用，因此有在不发布新版本 APP 的情况下使用热更新技术立即修复 BUG 需求。原生 APP（例如：Android & IOS

发表于 06-08 14:31 •530次阅读