当前位置:网站首页>CV-图像分类
CV-图像分类
2022-06-23 17:37:00 【巴川笑笑生】
什么是图像分类
核心任务
根据图像特征进行区分
给图像打标签
是更高级任务的基础
例如目标检测,图像分割
难点
语义鸿沟
- 视角
- 光照
- 尺度
- 遮挡
- 形变
- 背景杂波
- 类内形变
- 运动模糊
- 类别繁多
基于规则的方法
硬编码难以实现
数据驱动的方法

图像表示
- 全局特征
- 局部特征
如SIFT+word bag
- 像素
分类器
- SVM
- AdaBoost
- 随机森林
- 贝叶斯
- 线性分类器
- 神经网络
损失函数
- 0-1损失
- 交叉熵
- L1 L2
优化算法
- 一阶迭代
- 梯度下降
- 随机梯度下降
- 小批量随机梯度下降
- 二阶迭代
- 牛顿法
- BFGS L-BFGS
训练过程
- 数据集划分
- 数据预处理
- 数据增强
- 过拟合 欠拟合
- 超参数
- 模型集成
图像类别
- 二值图像
- 灰度图像
- 彩色图像
线性分类器
第i类线性分类器
f i ( w i , x ) = w i T x + b f_{i}(w_{i},x)=w_{i}^{T}x+b fi(wi,x)=wiTx+b
决策规则,哪个函数值最大就是哪个
权值w可以视为模板,匹配程度越高得分越高
权值也可视为超空间的分界面
损失函数
联系模型参数和模型性能指导模型优化参数
度量预测值和真实值的区别,输出通常是非负数(距离)
作为反馈信号,降低损失函数以提升模型性能
一般定义
L = 1 N ∑ i L i ( f i ( w , x i ) , y i ) L=\frac{1}{N}\sum_{i}L_{i}(f_{i}(w,x_{i}),y_{i}) L=N1i∑Li(fi(w,xi),yi)
正则项
同样一个损失函数值对应的权重不是唯一的
为了选择最优的权重w,我们需要正则项
L = 1 N ∑ i L i ( f i ( w , x i ) , y i ) + λ R ( w ) L=\frac{1}{N}\sum_{i}L_{i}(f_{i}(w,x_{i}),y_{i})+\lambda R(w) L=N1i∑Li(fi(w,xi),yi)+λR(w)
前向称为数据项,后项称为正则项
正则项防止过拟合
正则项与数据无关,只与模型有关
λ \lambda λ是超参数
超参数
学习过程前设置的参数,而不是学出来的
对模型性能影响巨大
可以使模型有偏好
L 2 L_{2} L2正则 ∑ w 2 \sum w^{2} ∑w2
惩罚大权值,鼓励权值分散
确保尽量把所有维度都用起来,而不是依赖少数特征
L 1 L_{1} L1正则 ∑ ∣ w ∣ \sum |w| ∑∣w∣
弹性正则 L 1 + β L 2 L_{1}+\beta L_{2} L1+βL2
参数优化
利用损失函数输出做反馈信号调制模型参数,提升模型性能
目标是找到使得L最优的w
梯度下降
- 方向 负梯度
- 长度 步长
算法
while True
w梯度=计算梯度(w,y,L)
w=w-w梯度*学习率
边栏推荐
- Self training multi sequence learning with transformer for weakly supervised video animation
- 2022 t elevator repair test question bank and simulation test
- Redis cluster
- esp8266-01s 不能连接华为路由器解决方法
- 3000帧动画图解MySQL为什么需要binlog、redo log和undo log
- 基于FPGA的电磁超声脉冲压缩检测系统 论文+源文件
- Wechat applet startlocationupdatebackground() simply realizes rider distribution location
- 《致敬百年巨匠 , 数藏袖珍书票》
- QML类型:Loader
- How far is the rise of cloud native industry applications from "available" to "easy to use"?
猜你喜欢

Wiley-中国科学院文献情报中心开放科学联合研讨会第二讲:开放获取期刊选择及论文投稿...
![[esp8266 - 01s] obtenir la météo, Ville, heure de Beijing](/img/8f/89e6f0d482f482ed462f1ebd53616d.png)
[esp8266 - 01s] obtenir la météo, Ville, heure de Beijing

Stepping mode of research control motor
![微信小程序报错[ app.json 文件内容错误] app.json: app.json 未找到](/img/ab/5c27e1bb80ad662d1a220d29c328e0.png)
微信小程序报错[ app.json 文件内容错误] app.json: app.json 未找到

Leetcode question brushing: hash table 01 (valid Letter ectopic words)

计算机学院改考后,网络空间安全学院也改考了!南京理工大学计算机考研

WIN11 系统所有快捷键说明

第十三届蓝桥杯单片机国赛真题

渗透测试基础,初识渗透测试

org. apache. ibatis. binding. BindingException: Invalid bound statement (not found):...
随机推荐
README
Regular expression use graph bed
Thesis reading (57):2-hydr_ Ensemble: lysine 2-hydroxyisobutyrylation identification with ensemble method (task)
Wiley- Open Science Joint Symposium of the documentation and information center of the Chinese Academy of Sciences, lecture 2: open access journal selection and paper submission
【ESP8266-01s】獲取天氣,城市,北京時間
Torch learning (I): environment configuration
Remote connection raspberry pie in VNC Viewer Mode
Paper reading (50):a novel matrix game with payoffs of maximal belt structure
Implementing Domain Driven Design - using ABP framework - repository
QML type: Loader
[Wwise] there is no sound problem after Wwise is embedded in unity and packaged
提高效率 Or 增加成本,开发人员应如何理解结对编程?
渗透测试基础,初识渗透测试
Improving efficiency or increasing costs, how should developers understand pair programming?
TT voice landing Zadig: open source co creates helm access scenario, and environmental governance can be done!
聊一聊数据库的行存与列存
Self taught programming introduction, what language to learn first?
leetcode刷题:哈希表02 (两个数组的交集)
一元二次方程到规范场
2021 excellent TDP members' output data summary is coming, come and watch!!!