0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AVA新技术让剧照清晰又好看

LiveVideoStack 来源:未知 作者:杨鑫 2018-03-06 15:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电影、剧集等视频的创作、生产、分销等环节已经可以通过算法优化提升效率。Netflix的AVA平台可以自动的甄选最有代表性的剧照,从而针对不同人群推送最能打动观众的剧照。

在Netflix公司,无论是内容平台工程师团队,还是全球产品创意团队都知道,观众在寻找新的节目和电影观看时,封面插图扮演着非常重要的角色。我们可以透过封面插图,揭示故事的独特元素,而这些元素将我们的观众与不同的角色和故事线索联系起来。我们为此感到很自豪。随着我们的原创内容不断增多,我们的技术专家的任务是寻找新的方式来处理不多扩展的资源,并使我们的创意可以摆脱不断增长的令人厌烦的数字宣传需求。其中的一个方法是直接从我们的源视频中采集静态图像帧,以提供更加灵活的原始插图来源。

商业案例

宣传剧照是直接从源视频内容中获取的静态视频帧,用于扩大Netflix服务的标题范围。在一个一小时的新剧集中,有近86,000个静态视频帧。

通常来说,这些宣传剧照是由影片的策划人或编辑人工选择的,他们需要对打算呈现的源内容有深入的了解。通过A / B测试我们了解到,通过尽可能多地变换各种不同的标题,我们可以有效地推动预期和意外受众群体进行更多地观看。说到标题艺术,我们喜欢测试一个标题的许多艺术表现形式,以便为正确的观众找到“正确的”作品插图。虽然这为创新和测试提供了一个令人兴奋的机会,但它同时也提出了一个非常严峻的挑战,即在我们不断增长的全球内容目录中的每个标题上实践这种体验。

AVA

AVA是一个工具和算法的集合,旨在从我们服务的视频中提取高质量的图像。平均一个电视节目(约10集)包含近900万个总帧数。要求创意编辑们从许多视频帧中有效筛选出来一个能够吸引观众注意力的视频帧是乏味并且缺乏效率的。我们着手构建了一个工具,能够快速有效地识别Netflix服务上哪些帧能够最佳地表达主题和标题。

为了实现这个目标,我们首先提出了客观信号,它可以促使我们使用帧注解来衡量视频的每一帧。因此,我们可以收集视频的每个帧的有效表示。随后,我们创建了排序算法,使我们能够对符合审美、创意和多样性目标的视频帧子集进行排序,以准确地为我们产品的各种画面呈现内容。

由AVA提供的备选图像

从源视频到编辑备选图像的高级阶段

帧注解

作为我们自动化流水线的一部分,我们在视频的每个帧中都处理和注释不同的变量,以便最好地得出帧的内容,并理解该帧对于故事是否重要。为了进行横向扩展,并为不断增长的内容目录提供可预测的SLA,我们利用Archer框架更有效地处理视频。Archer允许我们把视频分成更小的可以并行处理的视频块。这使我们能够通过提高视频处理流水线的效率来扩展规模,并允许我们将越来越多的内容智能算法集成到我们的工具集中。

通过一系列计算机视觉算法处理一段内容中的每一帧视频,以收集客观帧元数据、帧的潜在表示,以及这些帧所包含的一些上下文元数据。我们处理和应用到视频帧的注解属性大致可以分为三大类:

视觉元数据

通常这些属性是客观的、可测量的,并且主要包含在像素级。视觉属性包括亮度、颜色、对比度和运动模糊等等。

我们在帧级捕获到的一些视觉属性的例子。

上下文元数据

上下文元数据由多个元素的组合组成,这些元素被聚合以从帧的角色、对象和摄影机的动作或移动中获得含义。下面是一些例子:

人脸识别。使用面部特征跟踪、姿态估计和情感分析技术 —— 这使我们能够估计该帧中主体的姿势和情绪。

运动估计—— 这使我们能够估计特定镜头中包含的运动量(包括摄影机运动和主体运动)。这使我们能够控制诸如运动模糊之类的元素,以及识别产生高质量静止图像的摄影机移动。

摄影机拍摄识别—— (例如,近距离拍摄与移动摄影车拍摄)这提供了对电影摄影师意图的洞察,使我们能够快速识别并显现出摄影师选择的体裁风格,以提供对主题表达的情绪、基调和流派的更深入洞察。

对象检测—— 道具和动画对象的分割检测使我们能够找到该帧中重要的非人类主体。

面部特征和姿势估计的例子; 我们用一些因子来检测帧特征,发现有令人信服的面部表情出现。

用于预测摄影机运动的光流分析示例,以估计Black Mirror的拍摄手法(缩小和平移镜头)。

构图元数据

构图元数据是指我们根据摄影、电影拍摄和视觉美学设计中的一些核心原理确定和定义的一组特殊的启发式特征。有一些构图的基本原则:三分法原则、景深原则和对称原则。

对象检测和语义分割的例子,以识别三分法美学的前景对象。

图像排名

在给定视频中的每一帧都经过处理和注解后,下一步就是通过一个自动艺术品流水线从这些帧中选出最佳的候选图像。这样,当我们的创意团队准备好开始一段内容的工作时,他们会自动提供一个高质量的图像集供您选择。下面,我们概述一些我们用来为给定标题提供最佳图像的关键考虑元素。

演员

演员在艺术品中起着非常重要的作用。我们确定给定情节的关键角色的一种方法是利用脸部聚类和角色识别的组合来对主要角色,而不是次要角色或额外角色进行优先顺序。为了达到这个目的,我们训练了一个深度学习模型,从所有符合帧注解的候选帧中追踪面部相似性,以找到并排序该标题的主要演员,而不知道该剧演员的任何情况。

除了演员重要性之外,我们还会考虑演员的姿势,面部标志以及角色的整体位置。

Wynona Ryder出演Joyce Byers时的帧排名和最佳选择范例。

由于次优的面部表情、姿势和动作模糊而排名较低的图像的示例

帧分类

创意和视觉分类是一个非常主观的学科,因为有很多不同的方式来感知和定义图像的多样性。在该解决方案中,图像分类更具体地指的是算法捕捉在单个电影或情节中自然发生的具有启发式变化的能力。在此过程中,我们希望为设计师和创意人员提供一个可扩展的机制,以便快速了解哪些视觉元素最能代表主题,以及哪些元素无法准确代表主题。我们在AVA中引入的一些视觉启发式变量为一个标题提供了不同的图像集,包括摄影机镜头类型(远景vs中景)、视觉相似性(三分法则,亮度,对比度)、颜色(最突出的颜色)和显著图(识别负面空间和复杂度)。通过结合这些启发式变量,我们可以基于定制矢量对图像帧进行有效聚类后再分类。此外,通过合并多个向量,我们能够构建一个多样性指数,针对某个特定情节或电影的所有候选图像进行评分。

AVA的镜头检测分集的例子; (左)中景,(中心)特写,(右)极端特写。

成人图像过滤器

考虑到内容敏感度和受众成熟度等原因,我们还需要确保排除了包含有害或令人反感元素的帧。编辑排除的标准示例,比如: 性/裸露、文字、标志/未经授权的品牌,以及暴力/血腥。为了降低含有这些元素的帧的优先级,我们将这些变量中的每一个的概率作为向量,使我们能够量化并最终为这些帧赋予较低的分数。

我们还添加了标题流派,内容格式,成人度评分等元素作为次要元素或次要特征,并作为反馈,提供给排名预测模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4803

    浏览量

    98531
  • 甄别
    +关注

    关注

    0

    文章

    2

    浏览量

    5514

原文标题:AVA:Netflix的剧照个性化甄选平台

文章出处:【微信号:livevideostack,微信公众号:LiveVideoStack】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    内置氮化镓成主流?AHB技术了解多少?

    内置氮化镓成主流?AHB技术了解多少? 在快充充电器等应用中,非对称半桥(AHB)拓扑凭借高效率、低EMI等优势,正受到越来越多工程师的青睐。 AHB 本质上是在传统反激思路上进一步优化而来
    发表于 04-18 10:35

    MediaTek创新技术AI真正走进生活

    AI 在智能手机与物联网设备上的应用、车载通信技术,以及次世代数据中心技术 AI 落实到实际应用中,生活变得更美好。
    的头像 发表于 03-18 15:16 3377次阅读

    北极芯微荣获2025年深圳市高新技术企业认定

    深圳北极芯微电子有限公司(北极芯微)近日正式通过深圳市2025年国家高新技术企业认定,获颁"高新技术企业"资质。
    的头像 发表于 01-30 11:17 405次阅读

    德赛智储入选2025年广东省名优高新技术产品

    近日,广东省高新技术企业协会正式公布了《2025年第二批广东省名优高新技术产品名单》。德赛电池旗下德赛智储自主研发的“261kwh液冷工商业一体柜”拼接突出的技术创新实力与卓越产品性能,成功入选“广东省名优高
    的头像 发表于 01-29 17:17 793次阅读

    致真精密仪器杭州子公司通过国家高新技术企业认定

    近日,全国高新技术企业认定管理工作领导小组办公室发布了《对浙江省认定机构2025年认定报备高新技术企业进行备案的公告》,致真精密仪器(杭州)有限公司通过国家高新技术企业认定。这是致真精密仪器继
    的头像 发表于 01-12 15:37 504次阅读

    AI眼镜的下一站:稳定清晰的视觉,需要一颗稳定的“芯”

    AI 眼镜的未来,不在于炫技,而在于真实场景下的稳、轻、持久、清晰。每个品牌、方案公司和供应链伙伴,都在朝同一个方向努力:设备更贴近人,技术成为看不见却可靠的力量。
    的头像 发表于 11-21 15:49 747次阅读
    AI眼镜的下一站:稳定<b class='flag-5'>清晰</b>的视觉,需要一颗稳定的“芯”

    黑芝麻智能斩获AITX热点创新技术

    近日,在第三十二届中国汽车工程学会年会暨展览会(SAECCE 2025)与汽车创新技术展(AITX)举办期间,备受行业瞩目的AITX热点创新技术奖评选结果正式揭晓。黑芝麻智能自主研发的安全智能底座,凭借在智能汽车跨域融合领域的突破性技术
    的头像 发表于 10-28 17:07 1066次阅读

    2025是德科技创新技术峰会深圳站即将举办

    是德科技将于今年 10 月 23 日于深圳市南山区威尼斯英迪格酒店举办《2025是德科技创新技术峰会》。
    的头像 发表于 09-17 11:27 1390次阅读

    CMOS 2.0与Chiplet两种创新技术的区别

    摩尔定律正在减速。过去我们靠不断缩小晶体管尺寸提升芯片性能,但如今物理极限越来越近。在这样的背景下,两种创新技术站上舞台:CMOS 2.0 和 Chiplet(芯粒)。它们都在解决 “如何芯片更强” 的问题,但思路却大相径庭。
    的头像 发表于 09-09 15:42 1199次阅读

    村田中国亮相2025开放计算创新技术大会:以创新技术驱动智能化发展

    2025年8月7日,中国北京——今日,全球居先的综合电子元器件制造商村田中国(以下简称“村田”) 亮相2025开放计算创新技术大会(OCP China Day),围绕大会“开放变革:筑基、扩展、进化
    的头像 发表于 08-07 16:09 930次阅读
    村田中国亮相2025开放计算创<b class='flag-5'>新技术</b>大会:以创<b class='flag-5'>新技术</b>驱动智能化发展

    亚纳米级检测!潜望式棱镜的“检测密码”,决定手机远景清晰

    手机变薄了,远景拍摄却更清晰了?全靠这个 “躺平” 的零件在发力!优可测白光干涉仪如何手机清晰拍摄远景照片?
    的头像 发表于 07-21 17:33 1246次阅读
    亚纳米级检测!潜望式棱镜的“检测密码”,决定手机远景<b class='flag-5'>清晰</b>度

    欧菲光两项创新技术通过国家发明专利授权

    近日,欧菲光集团研发创新工作传来喜讯,旗下子公司江西欧菲光学有限公司和南昌欧菲光电技术有限公司自主研发的两项创新技术通过了国家知识产权局发明专利授权,标志着公司在光学光电领域的技术
    的头像 发表于 07-07 18:08 1409次阅读

    无刷直流电机电流检测新技术

    开关管通态压降的表现形式及电流波形重构原理,实验结果表明该技术具有实现简单、经济实用的特点,值得推广。 纯分享帖,点击下方附件免费获取完整资料~~~ *附件:无刷直流电机电流检测新技术.pdf 【免责
    发表于 06-26 13:47

    ADL400 导轨电表:重新定义智能电力管理,每一度电都清晰可控!

    管家”。这款集精准计量、谐波分析、复费率管理于一体的智能仪表,不仅每一度电的流向清晰可查,更以科技力量助力企业实现能效优化与成本锐减。
    的头像 发表于 05-16 15:18 1297次阅读
    ADL400 导轨电表:重新定义智能电力管理,<b class='flag-5'>让</b>每一度电都<b class='flag-5'>清晰</b>可控!

    芯朴科技荣获国家高新技术企业称号

    根据《高新技术企业认定管理办法》(国科发火〔2016〕32号)和《高新技术企业认定管理工作指引》(国科发火〔2016〕195号)有关规定,现将上海市认定机构2024年认定报备的第二批4686家高新技术企业(企业名单详见附件)进行
    的头像 发表于 04-25 17:10 1286次阅读