CVPR 2018:用GAN预测20年后你长什么样

简介: 20年后的你长什么样?北京航空航天大学和密歇根州立大学的研究人员设计了一个AI系统,采用生成对抗网络(GAN),可以根据原始照片生成一个人年龄增长后的样子,甚至连发际线逐渐后移也能逼真地模拟。论文发表在CVPR 2018。

警方要搜寻一个失踪多年的人或逃犯时,有时候线索只有一张旧照片。艺术家或计算机程序可以尝试根据旧照片推测这些人今天的样子,但这两种方法都有缺陷。现在,科学家们已经能够利用AI来渲染照片中的人年老后的样子,其结果比以往的方法更加逼真。

来自北京航空航天大学和密歇根州立大学的研究人员设计了这样一个系统。该系统采用一种由两个部分组成的算法,即生成对抗网络(GAN)。第一部分以一张脸的照片作为输入,并生成目标年龄的同一个人年龄增长后的脸。在训练过程中,第二部分将生成的图像与该年龄的人的真实图像和原始图像进行对比,并提供反馈,以令第一部分改进生成图像的效果。

f26f07549f859dcfd80df9397c039853c7a96ab8

图1:年龄增长(ageing)的模拟结果(第1列是输入的图像)。

其他这类系统也有使用GAN的, 但这个系统的不同之处在于它不仅关注年龄的正确性,还关注保持特定人的身份。与其他系统不同的是,它还能渲染前额和发际线逐渐升高的样子,如上图演示的结果。

29c378c4d816fa77604223baed95830dc10370b2

图2:提出的年龄增长方法的框架。

在这个框架中,一个基于CNN的生成器G学习年龄变化(age transformation)。训练中的critic在图像空间加入平方欧几里得损失,GAN loss鼓励生成的人脸与训练中相应年龄的老年人的脸无法区分,以及 identity preservation loss使高级特征表示的输入输出距离最小化。

这个研究的主要贡献如下:

d47e62d2b349aca45e42305ed6714efbe5ed61d9 提出了一种新的 基于GAN 的年龄发展方法,该方法结合了人脸验证和年龄估计技术,从而解决了衰老效果生成和身份线索保存的问题。
d47e62d2b349aca45e42305ed6714efbe5ed61d9 强调了 前额和头发的重要性 ,这与我们认知的年龄增长现象密切相关,但在其他研究中被忽略了;这确实提高了所生成的衰老照片的精度。

d47e62d2b349aca45e42305ed6714efbe5ed61d9除了现有的实验外,研究者还设置了新的验证实验,包括基于商业化的面部分析工具的评估以及对表情、姿势和化妆变化的不敏感性评估。该方法不仅被证明有效,而且对于年龄增长也具有稳健性。

d667cca886fd2c89e254624b8b95ccebea3e7187

24个不同的受试者在CACD数据库上获得的老化效果(Aging effects)。每个部分的第一个图像是原始的人脸图像,随后的3个图像是该受试者在[31- 40]、[41-50]和50+年龄组的变老图像。

0a4e005e156df72057accd3f1bc7ba6910b63475

:24个不不同的受试者在MORPH数据库获得的老化效果。

研究人员在来自两个数据库的10万张图像上训练了他们的AI,这些数据库中包括不同年龄的警方存档的面部照片和名人照片。然后,研究者用一个独立的计算机程序判断AI在一组新图像上的表现。举例来说,当AI将人的照片老化20年以上时,原本30岁以下的人看起来应该在50岁至60岁之间,计算机程序将他们(平均)视为60岁(面部照片)或52岁(名人照片)。

b238ed38dee5ace8fda31be0ed3cf1dbfd11305b

图:与先前工作的对比

在进一步的统计调查中,研究人员从已发表的论文中收集了54个人的138张配对的照片,并邀请10位人类观察者来评估哪张年龄增长的脸更好。在1380票中,69.78%投给了我们的工作,20.80%投给了以前的工作,9.42%表示两者不分上下。此外,该方法不需要像以前的工作那样进行繁琐的预处理,只需要两个标志点用于瞳孔对齐。总而言之,研究者称他们提出的方法优于以前的方法。


原文发布时间为:2018-06-14

本文作者:肖琴

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”。

原文链接:CVPR 2018:用GAN预测20年后你长什么样

目录
打赏
0
0
0
0
73533
分享
相关文章
CVPR2024 医学图像相关论文
CVPR2024医学图像相关论文汇总,涵盖图像重建、超分、配准、分割、生成、分类、联邦学习、预训练模型、视觉-语言模型及计算病理等多个领域。包括多项创新技术,如QN-Mixer、PrPSeg、MAPSeg等,涉及多个开源项目和代码。持续更新中,欢迎关注。原始GIT地址:https://github.com/MedAIerHHL/CVPR-MIA
668 0
【论文解读】单目3D目标检测 MonoCon(AAAI2022)
本文分享单目3D目标检测,MonoCon模型的论文解读,了解它的设计思路,论文核心观点,模型结构,以及效果和性能。
599 0
【论文解读】单目3D目标检测 LPCG(ECCV 2022)
本文分享单目3D目标检测,LPCG模型的论文解读,了解它的设计思路,论文核心观点,模型结构,以及效果和性能。
333 0
【论文解读】单目3D目标检测 MonoFlex(CVPR 2021)
本文分享单目3D目标检测,MonoFlex 模型的论文解读,了解它的设计思路,论文核心观点,模型结构,以及效果和性能。
859 0
ECCV2022 oral | DfM:单目3D检测任务SOTA!
多传感器设置价格昂贵,输入单目数据完成3D目标感知在领域内非常重要(特别是自动驾驶)。然而这非常困难,因为单目图像不能为预测绝对深度值提供任何线索。受双目三维目标检测方法的启发,论文利用camera ego-motion提供的强大几何结构,进行精确的物体深度估计和检测。
ECCV2022 oral | DfM:单目3D检测任务SOTA!
【OpenVI—论文解读系列】榜首模型人脸检测MogFace CVPR论文深入解读
人脸检测算法是在一幅图片或者视频序列中检测出来人脸的位置,给出人脸的具体坐标,一般是矩形坐标。
431 0

新智元

+ 订阅