AVA:Netflix的剧照个性化甄选平台

简介: 电影、剧集等视频的创作、生产、分销等环节已经可以通过算法优化提升效率。

电影、剧集等视频的创作、生产、分销等环节已经可以通过算法优化提升效率。Netflix的AVA平台可以自动的甄选最有代表性的剧照,从而针对不同人群推送最能打动观众的剧照。LiveVideoStack对本文进行了摘译,点击『阅读原文』访问原文链接。


文 /  Madeline,Lauren,Boris,Tim,Parth,Eugene和Apurva

译 /鸿蒙

审校 / Ant


介绍


640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


在Netflix公司,无论是内容平台工程师团队,还是全球产品创意团队都知道,观众在寻找新的节目和电影观看时,封面插图扮演着非常重要的角色。我们可以透过封面插图,揭示故事的独特元素,而这些元素将我们的观众与不同的角色和故事线索联系起来。我们为此感到很自豪。随着我们的原创内容不断增多,我们的技术专家的任务是寻找新的方式来处理不多扩展的资源,并使我们的创意可以摆脱不断增长的令人厌烦的数字宣传需求。其中的一个方法是直接从我们的源视频中采集静态图像帧,以提供更加灵活的原始插图来源。


商业案例


宣传剧照是直接从源视频内容中获取的静态视频帧,用于扩大Netflix服务的标题范围。在一个一小时的新剧集中,有近86,000个静态视频帧。


通常来说,这些宣传剧照是由影片的策划人或编辑人工选择的,他们需要对打算呈现的源内容有深入的了解。通过A / B测试我们了解到,通过尽可能多地变换各种不同的标题,我们可以有效地推动预期和意外受众群体进行更多地观看。说到标题艺术,我们喜欢测试一个标题的许多艺术表现形式,以便为正确的观众找到“正确的”作品插图。虽然这为创新和测试提供了一个令人兴奋的机会,但它同时也提出了一个非常严峻的挑战,即在我们不断增长的全球内容目录中的每个标题上实践这种体验。


AVA


AVA是一个工具和算法的集合,旨在从我们服务的视频中提取高质量的图像。平均一个电视节目(约10集)包含近900万个总帧数。要求创意编辑们从许多视频帧中有效筛选出来一个能够吸引观众注意力的视频帧是乏味并且缺乏效率的。我们着手构建了一个工具,能够快速有效地识别Netflix服务上哪些帧能够最佳地表达主题和标题。


640?wx_fmt=png


为了实现这个目标,我们首先提出了客观信号,它可以促使我们使用帧注解来衡量视频的每一帧。因此,我们可以收集视频的每个帧的有效表示。随后,我们创建了排序算法,使我们能够对符合审美、创意和多样性目标的视频帧子集进行排序,以准确地为我们产品的各种画面呈现内容。


640?wx_fmt=png

由AVA提供的备选图像


640?wx_fmt=png

从源视频到编辑备选图像的高级阶段


帧注解


作为我们自动化流水线的一部分,我们在视频的每个帧中都处理和注释不同的变量,以便最好地得出帧的内容,并理解该帧对于故事是否重要。为了进行横向扩展,并为不断增长的内容目录提供可预测的SLA,我们利用Archer框架更有效地处理视频。Archer允许我们把视频分成更小的可以并行处理的视频块。这使我们能够通过提高视频处理流水线的效率来扩展规模,并允许我们将越来越多的内容智能算法集成到我们的工具集中。


640?wx_fmt=png


通过一系列计算机视觉算法处理一段内容中的每一帧视频,以收集客观帧元数据、帧的潜在表示,以及这些帧所包含的一些上下文元数据。我们处理和应用到视频帧的注解属性大致可以分为三大类:


视觉元数据


通常这些属性是客观的、可测量的,并且主要包含在像素级。视觉属性包括亮度、颜色、对比度和运动模糊等等。


640?wx_fmt=jpeg

我们在帧级捕获到的一些视觉属性的例子。


上下文元数据


上下文元数据由多个元素的组合组成,这些元素被聚合以从帧的角色、对象和摄影机的动作或移动中获得含义。下面是一些例子:


  • 人脸识别。使用面部特征跟踪、姿态估计和情感分析技术 —— 这使我们能够估计该帧中主体的姿势和情绪。

  • 运动估计  —— 这使我们能够估计特定镜头中包含的运动量(包括摄影机运动和主体运动)。这使我们能够控制诸如运动模糊之类的元素,以及识别产生高质量静止图像的摄影机移动。

  • 摄影机拍摄识别 —— (例如,近距离拍摄与移动摄影车拍摄)这提供了对电影摄影师意图的洞察,使我们能够快速识别并显现出摄影师选择的体裁风格,以提供对主题表达的情绪、基调和流派的更深入洞察。

  • 对象检测  —— 道具和动画对象的分割检测使我们能够找到该帧中重要的非人类主体。


640?wx_fmt=png

面部特征和姿势估计的例子; 我们用一些因子来检测帧特征,发现有令人信服的面部表情出现。


640?wx_fmt=gif

用于预测摄影机运动的光流分析示例,以估计Black Mirror的拍摄手法(缩小和平移镜头)。


构图元数据


构图元数据是指我们根据摄影、电影拍摄和视觉美学设计中的一些核心原理确定和定义的一组特殊的启发式特征。有一些构图的基本原则:三分法原则、景深原则和对称原则。


640?wx_fmt=jpeg

对象检测和语义分割的例子,以识别三分法美学的前景对象。


图像排名


在给定视频中的每一帧都经过处理和注解后,下一步就是通过一个自动艺术品流水线从这些帧中选出最佳的候选图像。这样,当我们的创意团队准备好开始一段内容的工作时,他们会自动提供一个高质量的图像集供您选择。下面,我们概述一些我们用来为给定标题提供最佳图像的关键考虑元素。


演员


演员在艺术品中起着非常重要的作用。我们确定给定情节的关键角色的一种方法是利用脸部聚类和角色识别的组合来对主要角色,而不是次要角色或额外角色进行优先顺序。为了达到这个目的,我们训练了一个深度学习模型,从所有符合帧注解的候选帧中追踪面部相似性,以找到并排序该标题的主要演员,而不知道该剧演员的任何情况。


除了演员重要性之外,我们还会考虑演员的姿势,面部标志以及角色的整体位置。


640?wx_fmt=png

Wynona Ryder出演Joyce Byers时的帧排名和最佳选择范例。


640?wx_fmt=png

由于次优的面部表情、姿势和动作模糊而排名较低的图像的示例


帧分类


创意和视觉分类是一个非常主观的学科,因为有很多不同的方式来感知和定义图像的多样性。在该解决方案中,图像分类更具体地指的是算法捕捉在单个电影或情节中自然发生的具有启发式变化的能力。在此过程中,我们希望为设计师和创意人员提供一个可扩展的机制,以便快速了解哪些视觉元素最能代表主题,以及哪些元素无法准确代表主题。我们在AVA中引入的一些视觉启发式变量为一个标题提供了不同的图像集,包括摄影机镜头类型(远景vs中景)、视觉相似性(三分法则,亮度,对比度)、颜色(最突出的颜色)和显著图(识别负面空间和复杂度)。通过结合这些启发式变量,我们可以基于定制矢量对图像帧进行有效聚类后再分类。此外,通过合并多个向量,我们能够构建一个多样性指数,针对某个特定情节或电影的所有候选图像进行评分。


640?wx_fmt=png

AVA的镜头检测分集的例子; (左)中景,(中心)特写,(右)极端特写。


成人图像过滤器


考虑到内容敏感度和受众成熟度等原因,我们还需要确保排除了包含有害或令人反感元素的帧。编辑排除的标准示例,比如: 性/裸露、文字、标志/未经授权的品牌,以及暴力/血腥。为了降低含有这些元素的帧的优先级,我们将这些变量中的每一个的概率作为向量,使我们能够量化并最终为这些帧赋予较低的分数。


我们还添加了标题流派,内容格式,成人度评分等元素作为次要元素或次要特征,并作为反馈,提供给排名预测模型。


结论


在这个技术博客中,我们概述了如何从视频中呈现有意义图像的独特方法,并使我们的创意团队每天都能设计令人惊叹的艺术插图。AVA是一个工具和算法的集合,它结合电影制作和照片编辑的核心原则,封装了计算机视觉的关键交叉点。


请继续关注后续博客,其中我们将深入到编程艺术构图中,这是一个令人兴奋的新解决方案,您今天在Netflix服务中看到的大部分艺术作品都已经在使用它!


谢谢。如果您有出色或有创意的想法,请加入我们的Content Platform工程团队!


WebRTCon 2018 8折报名


WebRTCon希望与行业专家一同分享、探讨当下技术热点、行业最佳应用实践。如果你拥有音视频领域独当一面的能力,欢迎申请成为讲师,分享你的实践和洞察,请联系 speaker@livevideostack.com。更多详情扫描下图二维码

640?wx_fmt=jpeg

相关文章
|
15天前
|
监控 安全 数据可视化
java基于微服务的智慧工地管理云平台SaaS源码 数据大屏端 APP移动端
围绕施工现场人、机、料、法、环、各个环节,“智慧工地”将传统建筑施工与大数据物联网无缝结合集成多个智慧应用子系统,施工数据云端整合分析,提供专业、先进、安全的智慧工地解决方案。
27 1
|
2月前
|
Web App开发 缓存 监控
Apollo插件:个性化你的开发流程
Apollo插件:个性化你的开发流程
|
9月前
|
缓存 Dubbo druid
SOFABoot 4.0 正式发布,多项新特性等你来体验!
SOFABoot 4.0 依赖 Java 17 作为最小支持的 JDK 版本。如果你的应用目前使用 Java 8 或 11,你需要先将自己的 JDK 版本升级到 17 才能基于 SOFABoot 4.0 进行开发。
|
2月前
|
缓存 前端开发 中间件
Apollo生态系统探索:更多工具与框架的介绍
Apollo生态系统探索:更多工具与框架的介绍
|
4月前
|
监控 安全 Java
【Java】Spring Cloud 智慧工地信息云平台源码(PC端+APP端)项目平台、监管平台、大数据平台
【Java】Spring Cloud 智慧工地信息云平台源码(PC端+APP端)项目平台、监管平台、大数据平台
80 0
|
Java 微服务 Spring
从0到1 手把手搭建spring cloud alibaba 微服务大型应用框架(八) saas平台篇-解决不同租户针定制化开发问题 -完整代码以及案例方案(1)
从0到1 手把手搭建spring cloud alibaba 微服务大型应用框架(八) saas平台篇-解决不同租户针定制化开发问题 -完整代码以及案例方案(1)
从0到1 手把手搭建spring cloud alibaba 微服务大型应用框架(八) saas平台篇-解决不同租户针定制化开发问题 -完整代码以及案例方案(1)
|
前端开发 Java 应用服务中间件
【Spring Cloud】新闻头条微服务项目:自媒体前后端搭建&素材管理(含优化)
主要介绍自媒体端的前后端搭建及素材管理中的上传图片素材、获取素材列表并展示、收藏素材、删除素材,最后对删除素材做了优化,优化了其逻辑的合理性。
306 0
【Spring Cloud】新闻头条微服务项目:自媒体前后端搭建&素材管理(含优化)
|
移动开发 小程序 前端开发
|
移动开发 小程序 前端开发
spring cloud电子商务涉及的平台、技术、商业模式
Spring Cloud、Spring Boot、Mybatis Plus、Redis
259 0
spring cloud电子商务涉及的平台、技术、商业模式
|
移动开发 前端开发 小程序

热门文章

最新文章