当前位置:网站首页>粗读Targeted Supervised Contrastive Learning for Long-Tailed Recognition
粗读Targeted Supervised Contrastive Learning for Long-Tailed Recognition
2022-06-21 18:28:00 【格里芬阀门工】
相比于直接对图像进行分类,本文更关注特征提取部分,通过令提取的不同类特征在超球面上尽可能远离,让属于同一类的特征尽可能靠近,来提高模型面对样本不平衡时的分类性能。

这是本文的方法和效果示意图。第一行的KCL是之前的方法,TSC为本文方法。之前的方法在面对极端的样本不平衡时,训练图像多的类会挤占训练图像少的类,让小样本的类之间的特征混在一起,导致分类准确率下降,而本文方法面对极端不平衡时依然可以保持不同类的中心尽可能远离。

上图是流程示意图,模型主要分为两步,第一步,根据类的数量,在超球体上确定多个锚点,锚点数量等于类别数,每个锚点要尽可能远离其他锚点。
作者原本想让每个锚点的分布达到最优,但发现这是个NP问题,于是退而求其次,通过最小化下面这个公式达到近似最优的结果

可以看到,公式基本就是计算每个类和其他类的相似度,log和再求和。之所以两个向量点积就能求相似度,个人理解是如果每一位数字相同时,就是多个数的平方和,即点积结果是a^2+b^2+...
如果数字不同,就可以看作是原来的数字加了个数减了个数相乘,即可以看作是(a+x)(a-x)+(b+y)(b-y),结果当然会变小。虽然在极端情况下,a^2小于(b+x)(b-x)是有可能的,如a=3而b=100,x=1。但本文锚点位于超球体上,且是多个点之间互相计算,所以不用担心最小化这个函数会导致某对点从相隔甚远变得十分靠近。
第二步,得到几个中心后,就要将不同的类分配给不同的中心,如果是简单的随机分配,语义特征相似的类可能会分得特别开,例如猫和狗语义特征相似,但分得的锚点却可能位于超球体两端,这样让模型更加迷茫,不知道如何提取特征。
于是作者在每一轮训练结束后,即每张训练集图片喂给模型完毕后,计算每个类的中心,通过匈牙利算法,将类与锚点进行配对。
分配完毕后,计算下面的损失函数,然后指导模型更新参数。

其中,N为一个batch的大小,V为该batch全部图像,vi为图像xi提取出来的特征,
是排除了vi后的其他所有图像,
是除了vi之外其余的与vi为同一类的图像集合,U是所有锚点t的集合,而ci则是vi分得的锚点。
按照前面的理论,两个向量点积越大,就可近乎地看作相似度越高。于是前半段是让同一类的特征尽可能靠近,而后一段则是让每个点尽可能靠近自己分得的锚点,远离其他锚点和其他类的特征。
边栏推荐
- 范畴(Category)
- Inno setup installation path box learning
- 剑指 Offer II 029. 排序的循环链表
- Comment MySQL additionne les colonnes
- Startup mode of Jupiter notebook and related problems
- 麻烦问下,数据集成中的独享资源,无法正常连接某些数据库,可能是什么原因,以下的原因好像都不是。公共资
- Resttemplate multiple authentication information authorization
- NetCore3.1 ping网络是否畅通及获取服务器Cpu、内存使用率
- RPA财务流程自动化 | 浦发集团携手云扩科技加速财务数字化运营
- Codeforces Round #394 (Div. 2) E. Dasha and Puzzle
猜你喜欢

DataGear 使用坐标映射表制作地理坐标数据可视化看板

谷歌浏览器80版本以后,如何处理出现的问题SameSite跨域问题

Shang Silicon Valley Shang Silicon Valley | what is Clickhouse table engine memory and merge

HMS core machine learning service ID card identification function to achieve efficient information entry

如何查询mysql中所有表

汇编语言贪吃蛇、俄罗斯方块双任务设计实现详解(三)——俄罗斯方块详细设计

MySQL-CentOS安装MySQL8

How MySQL sums columns

ENVI-Classic-Annotation-object添加的元素图例比例尺如何撤回修改删除

After the 80 version of Google browser, how to deal with the problem samesite cross domain problem
随机推荐
1157 Anniversary
Jupyter Notebook启动方式及相关问题
谷歌浏览器80版本以后,如何处理出现的问题SameSite跨域问题
Jupyter Notebook 将ipynb文件编译成latex再转为pdf
医疗费用清单秒速录入,OCR识别助力效率倍增
Inno setup installation path box learning
mysql中有没有关键字
Simple use of JS
一种简单的架构设计逻辑|得物技术
mysql如何對列求和
gorm数据库是否需要设置外键
Dynamic programming [1] (knapsack problem)
婴儿名字[连通分量之邻接矩阵与DFS]
机器学习之模型评估与选择
如何查询mysql中所有表
Linux MySQL command
How does the easycvr intelligent edge gateway hardware set power on self start?
麻烦问下,数据集成中的独享资源,无法正常连接某些数据库,可能是什么原因,以下的原因好像都不是。公共资
如何在Chrome浏览器中临时修改SameSite=None和Secure
RecycleView懒加载失效问题