当前位置:网站首页>SFOD:无源域适配升级优化,让检测模型更容易适应新数据(附论文下载)
SFOD:无源域适配升级优化,让检测模型更容易适应新数据(附论文下载)
2022-06-23 14:22:00 【计算机视觉研究院】
关注并星标
从此不迷路
计算机视觉研究院



公众号ID|ComputerVisionGzq
学习群|扫码在主页获取加入方式

论文地址:https://openaccess.thecvf.com/content/CVPR2022/papers/Li_Source-Free_Object_Detection_by_Learning_To_Overlook_Domain_Style_CVPR_2022_paper.pdf
计算机视觉研究院专栏
作者:Edison_G
无源目标检测 (SFOD) 需要将在标记的源域上预训练的检测器调整到目标域,只有来自目标域的未标记训练数据。
01
技术简要
无源目标检测 (SFOD) 需要将在标记的源域上预训练的检测器调整到目标域,只有来自目标域的未标记训练数据。现有的SFOD方法通常采用伪标签范式,模型自适应在预测伪标签和微调模型之间交替进行。

由于域偏移的存在和目标域训练数据的使用有限,这种方法的伪标签准确性不令人满意。如上图所示。
在今天分享中,研究者提出了一种新颖的Learning to Overlook Domain Style(LODS) 方法,该方法以有原则的方式解决了这些限制。研究者的想法是通过强制模型忽略目标域样式来减少域转移效应,从而简化模型适应并变得更容易进行。

为此,增强了每个目标域图像的风格,并利用原始图像和增强图像之间的风格度差异作为模型适应的自监督信号。通过将增强图像视为辅助视图,利用学生教师架构来学习忽略与原始图像的风格程度差异,其特征还在于新颖的风格增强算法和图形对齐约束。大量实验表明LODS在四个基准测试中产生了新的最先进的性能。
02
背景概述
目前,关于SFOD问题的研究不多。社区更加关注无源域适配(SFDA)。SFDA的方法大致可以分为两类。
第一类是基于样本生成的思想:
由于源数据不可访问,传统的域适应技术不适用。生成具有源域样式或目标域样式的标记图像,或服从源分布的标记特征。成功的关键是满意的样本生成,这本身就具有足够的挑战性并且没有很好地解决。
另一类利用基于自我训练的伪标签:
获得可靠的标签并不容易,尤其是在领域差距很大的情况下,在自训练过程中总是只取高置信度的标签样本。

很明显,目标域风格(例如成像特征)对域相对于源域的迁移有很大贡献。因此,最小化目标域样式对模型行为的影响将立即有效地减少域转移。在上述基础上,如刚开始的图所示,提出了一种新的领域适应方法(LODS)。
它首先增强每个目标图像的目标域风格,同时保持目标图像的原始风格。这样就构建了基于风格增强图像的辅助视图。有了这个辅助视图,新方法让目标检测器学会忽略目标域样式。学生-教师框架被用来完成这项任务。
03
新框架分析
提出的LODS方法由两部分组成。如下图所示,一个是style enhancement module;另一个是overlooking style module。

style enhancement module(上图(a))首先提取每个图像的风格,即通道均值和方差。对于一幅图像,其增强的目标域风格被计算为它本身和任何目标图像的风格的非线性组合。然后,通过替换增强样式来增强样式。通过将风格增强图像视为另一个领域,可以使用Mean-Teacher框架来利用风格差异进行模型适应(图(b))。目标图像和风格增强版本分别输入教师和学生模型。这两个模型基于Faster-RCNN并初始化为预训练的源模型。基于图匹配的类实例级对齐和图像级对齐旨在帮助教师和学生相互学习。伪标签也用于增加学生模型的辨别力。

基于上述推断,研究者设计了一个风格增强模块,如上图所示。两个网络F1和F2分别设计为近似δ1和δ2。它们中的每一个都由两个全连接层和一个ReLU层组成,具有最小的参数是非线性的。特征编码器E源自预训练的VGG-16模型,并在训练和测试期间固定。解码器D是编码器的逆。由于风格一致性受限于底层特征,编码器E = E2 ◦E1进一步分为E1和E2部分,其中◦是函数嵌套算子。解码器D = D2 ◦ D1作为D1和D2也是如此。具体来说,第一次下采样后的第一个ReLU层是分割E的分割线。D被对称分割为E。
04
实验可视化



THE END
转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入!
ABOUT
计算机视觉研究院
计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!
VX:2311123606

往期推荐
边栏推荐
- [in depth understanding of tcapulusdb technology] tcapulusdb construction data
- Why is Xiaomi stuck in the chip quagmire?
- Introduction to helm basics helm introduction and installation
- [compréhension approfondie de la technologie tcaplusdb] données de construction tcaplusdb
- AXI_Round_Robin_Arbiter 设计 - AW、W通道部分
- ICML 2022 𞓜 context integrated transformer based auction design neural network
- SQL注入漏洞(原理篇)
- 期货怎么开户安全吗,期货手续费哪家期货公司比较低,适合散户开户?
- 系统设计与分析-技术报告-定时清理验证码的一种解决方案
- WPF (c) open source control library: newbeecoder Nbexpander control of UI
猜你喜欢

2021-05-08

idea查看.class文件 idea查看.class文件夹

腾讯云服务器发送邮件失败

信贷产品额度定价场景下的回归模型效果评估

小米为何深陷芯片泥潭?

基因检测,如何帮助患者对抗疾病?

ICML 2022 𞓜 context integrated transformer based auction design neural network
![[Level 2 warranty] which brand of Fortress machine is good for Level 2 warranty?](/img/84/4fa07c54786aaf423ca333ecde62f4.png)
[Level 2 warranty] which brand of Fortress machine is good for Level 2 warranty?

【深入理解TcaplusDB技術】TcaplusDB構造數據

Ie mode of selenium edge
随机推荐
What do you mean by waiting for insurance records? Where should I go for filing?
Un million de bonus vous attend, le premier concours d'innovation et d'application de la Chine Yuan cosmique Joint Venture Black Horse Hot Recruitment!
What is the charm of Guizhou? Why do Alibaba, Huawei and Tencent build data centers in Guizhou?
golang--文件的多个处理场景
ACM Player Illustration leetcode remove element
The team of China University of Mines developed an integrated multi-scale deep learning model for RNA methylation site prediction
2021-06-03
一款自动生成单元测试的 IDEA 插件
【opencv450】椒盐噪声demo
raspberry pi安装 wiringpi
The second Tencent light · public welfare innovation challenge was launched, and the three competition topics focused on the social value of sustainable development
Illustration of ONEFLOW's learning rate adjustment strategy
2021-04-15
AI intelligent robot saves us time and effort
[datahub] LinkedIn datahub learning notes
等保备案是什么意思?应该去哪里办理备案?
2021-05-22
Idea view View the class file idea Class folder
ts封装请求
2021-05-08