当前位置:网站首页>cyclegan:unpaired image-to-image translation using cycle-consistent adversarial network
cyclegan:unpaired image-to-image translation using cycle-consistent adversarial network
2022-06-26 00:04:00 【Kun Li】
CycleGAN论文的阅读与翻译,无监督风格迁移 - 知乎2018-10-10 初版,论文不短,请自行选择重要的部分阅读 2018-11-02 与评论区的讨论 2018-11-25 语法错误小修改 2019-08-14 评论区回复,无监督风格迁移的其他进展 2019-08-26 按评论区的建议对论文的翻译进行修改 …
https://zhuanlan.zhihu.com/p/45394148cyclegan的核心在unpaired image,如果是pair数据的话,直接用pix2pix即可,但是非成对数据用cyclegan,cyclegan和biggan一样,文章比较好懂。cyclegan的核心在从X到Y,两个域之间的迁移的映射空间是很大的,作者对映射空间用cycle consistent loss做了约束,直观就是对X通过G生成的Y的分布再通过F转回来,用l1 loss进行监督,Y侧的损失也一样,通常cyclegan有四个损失,两个gan的,两个cycle loss。
1.abstract:
提出了一种在没有配对示例的情况下学习将图像从源域X到目标域Y的方法,学习一种映射G:X->Y,来自G(x)的图像分布与分布Y没有区别,因为映射是highly under-constrained,用一个拟映射F:Y->X,并且引入了cycle consistency loss强制F(G(X))==Y。
2.Introduction
我们寻求一种无需配对输入输出示例即可学习域之间进行转换的算法,我们假设域之间存在一些潜在的关系,例如它们是在同一场景下两种不同的渲染,我们试图学习这种关系。理论上,G(x)学到的y的分布是要匹配先验分布Y的,通常这要求G是随机的,然而,这样的转换并不能保证单个输入x和输出以有意义的方式配对,有无限多的映射G将在y上产生相同的分布,因此会产生模式崩溃。这里x从传统Gan的角度出发是相同的分布,从pix2pix的角度出发是成对数据的不同分布。
我们提出了cycle consistent,如果将一个句子从英语翻译成法语,应该也可以从法语返回英语,从数学上,G和F应该互逆,并且两个映射都应该是双射。同时训练G和F,并添加cycle consistency loss确保F(G(x))=x和G(F(y))=y。将这种损失和对框损失相结合,就可以实现未配对图像到图像转换的目标。

2.related work
Gans、image-to-image translation、unpaired image-to-image translation、cycle consistency、neural style transfer
3.formulation

上面这张图是文本的核心,图a是架构,G和F是双射,除了正常的GAN的生成器和判别器之外,此处X同城生成器变成Y的分布,再通过生成器F将Y映射回X,映射回X的分布和原始的输入x通过cycle consistency loss来保持一致,y域的图也是如此,这里注意输入是不成对的两个域的图,cycle consistency loss也是在原有基础上添加的两个损失,应该理论上讲gan有四个损失函数,判别器和生成器各一个,两个域的cycle loss,有些场景还会多两个id loss。这块还是比较精妙的,按照Gan的思路,从X到Y的迁移,X大多是高斯分布或者均匀分布,生成一个Y的分布,但是cyclegan中是一个潜在关系的学习,因此光从X到Y的学习会促使X直接转成Y而不保留X的性质,因此保留了cycle loss这种学习双射的能力。
3.1 Adversarial loss
3.2 cycle consistence loss
从X到Y的的映射空间要进行约束,通过前后向循环一致性来控制映射空间。
3.3 full objective

这块作者还做了个实验,理论上将其实有个前向循环损失应该就够了,但是仅在一个方向进行循环损失,不足以约束这个空间。
其中在application中还提及的idt loss,我看mm官方中把有id loss和不加id loss都计算上了,id loss,防止input和output之间的color composition过多,避免过多迁移。
4.Implementation
后面是作者的实现细节和实验部分,就不再赘述,主要还是要理解Gan的核心思想。
边栏推荐
- Obtain WiFi password through computer (only connected WiFi)
- Install tensorflow GPU miscellaneous
- Interpretation of script corresponding to postman assertion
- APP测试与WEB测试的区别
- 浅谈接口测试(一)
- Operation of simulated examination platform for electrical test questions in 2022
- JQ 自定义属性取值
- GNN (graph neural network) introduction vernacular
- Postman斷言對應脚本的解釋
- Reading notes on how to connect the network - hubs, routers and routers (III)
猜你喜欢

Log4j2 vulnerability
![[excel knowledge and skills] Excel data type](/img/f6/e1ebe033d1a2a266ebda00b10098ed.png)
[excel knowledge and skills] Excel data type

Obtain WiFi password through computer (only connected WiFi)

Reading notes on how to connect the network - hubs, routers and routers (III)

通过电脑获取WIFI密码(只能连接过的WiFi)

热血男孩滕文泽 受邀担任第六季完美童模全球总决赛形象大使

CityJSON

Can bus transceiver principle

Interpretation of script corresponding to postman assertion

STM32GPIO
随机推荐
Android system startup security
胰蛋白酶的化学性质及应用
APP测试与WEB测试的区别
Postman断言对应脚本的解释
清甜女孩李斯霞 受邀担任第六季完美童模全球总决赛小主持人
Install tensorflow GPU miscellaneous
Accumulation of some knowledge points in machine learning
recv & send
Some summary of model compression
2021-1-15 摸鱼做的笔记Ctrl+c /v来的
GUN make (2) 总述
Embedded C second learning notes
Laravel基础课 路由和MVC——路由
Shengxin weekly issue 33
[Excel知识技能] Excel数据类型
丨EGFR FISH 探针解决方案
阳光男孩陈颢天 受邀担任第六季完美童模全球总决赛代言人
集合集合!!快来复习--mysql增删改查,内、左右连接 复习笔记
Abnova丨抗GBA单克隆抗体解决方案
21. Hoff circle transformation