当前位置:网站首页>深度学习系列48:DeepFaker
深度学习系列48:DeepFaker
2022-06-25 06:42:00 【IE06】
1. 效果展示
一般地,deepfake可划分为如下四类:重现(reenactment),替换(replace),编辑(editing)和合成(synthesis)。
针对人脸的4种类别展示如下:
重现和替换的区别是:
重现相当于安吉拉宝贝上阵,但是脸部表情按照替身去演绎;替换则相当于替身直接上阵,然后换成安吉拉宝贝的脸。
2. 基础技术
核心技术:第一种是使用自动编码器然后操纵中间的latent向量来达到目的;第二种是使用GAN进行迁移。
各项任务需要一些额外的模块。我们以First Order Motion Model for Image Animation为例,其希望完成的任务是image animation,输入一张源图像(source image)和一个驱动视频(driving video),输出是一段视频,其中主角是源图像,动作是驱动视频中的动作。如下所示,源图像通常包含一个主体,驱动视频包含一系列动作。
模型会观察从同一视频中提取的帧对,它会学习到将动作编码为特定于动作的关键点位移和局部仿射变换的组合。
整个模型分为运动估计模块和图像生成模块两个主要组成部分。在运动估计模块中,该模型通过自监督学习将目标物体的外观和运动信息进行分离,并进行特征表示。
在图像生成模块中,模型会对目标运动期间出现的遮挡进行建模,然后从给定的名人图片中提取外观信息,结合先前获得的特征表示,进行视频合成。
注意生成模块是一个AE,运动信息操纵隐空间d,然后生成新的图片序列。
3. DeepFaceLab教程
大多数换脸视频都是用这个项目做的。git地址为:https://github.com/iperov/DeepFaceLab
边栏推荐
猜你喜欢
【深度学习 轻量型backbone】2022 EdgeViTs CVPR
CAN总线工作状况和信号质量“体检”
Four software 2021-10-14 suitable for beginners to draw PCB
TCP的那点玩意儿
基于STM32MP157调试MIPI-DSI屏幕
Vscode is good, but I won't use it again
搞清信息化是什么,让企业转型升级走上正确的道路
将数据导入到MATLAB
How to use printf of 51 single chip microcomputer
使用报文和波形记录分析仪RoyalScope的帧统计功能排查CAN总线偶发性故障
随机推荐
[daily training] 207 Class Schedule Card
Importer des données dans MATLAB
Fairmot yolov5s to onnx
如何用svn新建属于自己的分支
Atlas conflict Remote Code Execution Vulnerability (cve-2022-26134 vulnerability analysis and protection
Bicubic difference
Getting started with OpenMP
How to use ad wiring for PCB design?
DNS协议及其DNS完整的查询过程
2265. 统计值等于子树平均值的节点数
Manufacturing process of PCB 2021-10-11
Atlassian confluence漏洞分析合集
Invalid Navicat scheduled task
AttributeError: ‘Upsample‘ object has no attribute ‘recompute_ scale_ factor‘
57. insert interval
php入门基础记录
Keil and Proteus joint commissioning
基于RBAC 的SAAS系统权限设计
Pit encountered by pytorch: why can't l1loss decrease during model training?
CAN总线工作状况和信号质量“体检”