当前位置:网站首页>经典模型——NiN&GoogLeNet
经典模型——NiN&GoogLeNet
2022-06-26 02:41:00 【右边是我女神】
NiN
全连接层的问题:包含大量的参数。很容易过拟合。
通常是 输 入 通 道 数 × 图 像 尺 寸 × 输 出 尺 度 输入通道数\times 图像尺寸\times 输出尺度 输入通道数×图像尺寸×输出尺度
NiN的思想是:完全不要全连接层;
一个NiN块:
卷积层之后跟两个1x1的卷积,步幅为1,无填充,输出形状和卷积层输出一样。起到了全连接层的作用(按照逐一像素)。
NiN的架构:
- 无全连接层;
- 交替使用NiN块和步幅为2的最大池化层(逐步减小高宽和增大通道数);
- 最后使用全局平均池化层得到输出(输入通道数是类别数);
如果我们要得到1000类的话,最后就有1000个通道,每个做全局平均池化得到这一通道对应类的置信度。
总结:
- NiN块使用卷积层+2个1x1卷积层,后者对每个像素增加了非线性;
- 全局平均池化代替VGG和AlexNet的全连接层,参数个数少,不容易过拟合。

参数用了Alex那一套,不过加了一些1x1的卷积。
GoogleNet
怎么选择最好的超参数?
卷积核、池化方式、通道数?
Inception块:每种卷积都要,最后concatenation(高宽不变,通道数连接)。

可以看到,白色块的作用都是通过改变通道数来降低模型复杂度(也就是参数量)。蓝色块的作用是抽取信息。
先降后增的设计思路是bottleneck的感觉。
Inception块相比单独的3x3或5x5卷积相比,其有更少的参数个数和计算复杂度。
同时Inception块还增加了其中学习得到的信息的多样性。

Stage1和Stage2和VGG一致。GoogleNet用了很多NiN的思想,大量地使用1x1卷积减少参数量。

相比于AlexNet,GoogleNet的卷积核是比较小的,这使得空间信息不会被很快压缩,支撑后续通道数增加时的信息学习。
同时,空间信息被压缩,我认为也是为了增加通道数的无奈之举,目的是为了减少参数量。

第三阶段,可以看到通道数还是在增加的,但是每一个Inception块的参数都不一样。值得一提的是,3x3卷积永远是被分配地最多的,这是因为它参数量不大,提取信息的效果也还行。
Inception块后续有很多变种,V2加入了BN、V3修改了卷积尺寸、V4加入了残差连接。
边栏推荐
- What can Arthas do for you?
- DF reports an error stale file handle
- [QT] custom control - switch
- Authorization of database
- 培育项目式Steam教育理念下的儿童创造力
- js array数组json去重
- 少儿编程对国内传统学科的推进作用
- 网络PXE启动WinPE,支持UEFI和LEGACY引导
- Utonmos adheres to the principle of "collection and copyright" to help the high-quality development of traditional culture
- 如何提词条
猜你喜欢
随机推荐
【QT】自定义控件-开关
[flask introduction series] flask processing request and response
A few simple ways for programmers to exercise their waist
Utonmos adheres to the principle of "collection and copyright" to help the high-quality development of traditional culture
I am in Zhongshan. Where can I open an account? Is it safe to open an account online?
数据库查询语句SQL中like、%、-的区别
The "more" option of Spreadtrum platform dearmcamera2 is removed
【flask入门系列】flask处理请求和处理响应
如何提词条
文献阅读---优化RNA-seq研究以研究除草剂耐药性(综述)
UTONMOS坚持“藏品、版权”双优原则助力传统文化高质量发展
应届毕业生谈毕业的故事
Simple use example of Aidl
ORB-SLAM3论文概述
ArrayList#subList这四个坑,一不小心就中招
Arduino string to hexadecimal number for large color serial port screen.
golang正則regexp包使用-06-其他用法(特殊字符轉換、查找正則共同前綴、切換貪婪模式、查詢正則分組個數、查詢正則分組名稱、用正則切割、查詢正則字串)
《你不可不知的人性》经典语录
Dreamcamera2 video recording, playing without sound, recording function is normal, using a third-party application for video recording, playing with sound
限制输入字符长度length英文1个字符中文2个字符









