当前位置:网站首页>深度学习汇报(4)
深度学习汇报(4)
2022-08-02 08:21:00 【弯道超车手】
目录
第八章 深度置信网络
深度置信网络是神经网络的一种,既可以用于非监督学习,类似于一个自编码机;也可以用于监督学习,作为分类器使用。从非监督学习来讲,其目的是尽可能地保留原始特征的特点,同时降低特征的维度。从监督学习来讲,其目的在于使得分类错误率尽可能地小。
玻尔兹曼机:
- 特点1:随机变量都是二值的({0,1})
- 特点2:所有节点是全连接的
- 特点3:两个节点之间的相互影响是对称的
受限玻尔兹曼机:
层内的神经元没有连接关系,神经网络只有两层(visible layer和hidden layer)
深度置信网络:
由多层受限玻尔兹曼机组成的神经网络
训练法则:逐层进行,每一层都用户数向量来推断隐层,再把这个隐层作为数据向量来推断下一个隐层。
第九章 卷积神经网络
网络层:卷积,池化和全连接
作用:
- 卷积层:特征提取
- 池化层:降低特征图参数量和解决图像不变性等
- 全连接层:将特征图映射为向量
核心思想:参数共享和局部感知
AlexNet:
闪光点:ReLU,重叠Pooling,数据增强,Dropout
- ReLU:使用ReLU代替Sigmoid激活函数,快速收敛
- 重叠Pooling:实现stride<kernel size,减轻过拟合
- 数据增强:实现原始图像(256*256)随机剪裁为224*224的图像;图像水平单转;随机增加光照。防止过拟合
- Dropout:每个隐藏层神经元的输入以0.5的概率输出为0,防止过拟合
VGGNet:
研究深度对卷积网络的影响。使用简单的3*3卷积核,不断重复卷积层,池化,最后经过全连接、softmax,得到输出类别概率。
第十章 循环神经网络
标准RNN结构解决了信息记忆的问题,但是对长时间记忆的信息会衰减;存在梯度爆炸和梯度消失问题,并不能真正地处理好长距离的依赖。
长短期记忆网络(LSTM):
一种特殊的RNN类型,可以学习长期依赖信息

门控循环单元(GRU):
简化版的LSTM。因为LSTM中,遗忘门与输入门的关系互补,所以GRU用一个门代替。
在LSTM中引入了三个门函数:输入门、遗忘门和输出门来控制输入值、记忆值和输出值。而在GRU模型中只有两个门:分别是更新门和重置门。

边栏推荐
- IO process thread -> process -> day4
- 不用Swagger,那我用啥?
- houdini 求出曲线的法向 切线以及副法线
- 如何做好项目管理
- mysqldump --set-gtid-purged=OFF
- LeetCode第三题(Longest Substring Without Repeating Characters)三部曲之一:解题思路
- 科技云报道:实现元宇宙,英伟达从打造基础建设平台开始
- BGP solves routing black hole through MPLS
- The custom table form
- Three types of [OC learning notes] Block
猜你喜欢
![[ansible] playbook explains the execution steps in combination with the project](/img/fe/82b8562075fef33490d5aae7e809f5.png)
[ansible] playbook explains the execution steps in combination with the project

第3周学习:ResNet+ResNeXt

商业智能平台BI 商业智能分析平台 如何选择合适的商业智能平台BI

Write a small game in C (three chess)

查看变量的数据格式

TiFlash 存储层概览

PyQt5 (a) PyQt5 installation and configuration, read from the folder and display images, simulation to generate the sketch image

工程师如何对待开源 --- 一个老工程师的肺腑之言

etcd implements large-scale service governance application combat

编程与哲学(2)——输出是为了更好的输入
随机推荐
JSP中page指令的import命令具有什么功能呢?
R语言plotly可视化:plotly可视化回归模型实际值和回归预测值的散点图分析回归模型的预测效能、一个好的模型大部分的散点在对角线附近(predicted vs actual)
二分类和多分类
Database triggers and transactions
文章解读 -- FlowNet3D:Learning Scene Flow in 3D Point Clouds
MySQL ODBC驱动简介
Seleniu截图代码以及给图片赋值名字
EPSANet: An Efficient Pyramid Split Attention Block on Convolutional Neural Network
The custom table form
Biotin-C6-amine|N-生物素基-1,6-己二胺|CAS:65953-56-2
HCIP笔记第十三天
Ansible learning summary (11) - detailed explanation of forks and serial parameters of task parallel execution
QT web development - Notes - 3
High imitation [Huawei consumer business official website] and wonderful animation analysis: practice embedding JS code in low-code platform
如何建立私域流量?私域流量对企业有什么好处?
Biotin - LC - Hydrazide | CAS: 109276-34-8 | Biotin - LC - Hydrazide
编程与哲学(2)——输出是为了更好的输入
[OC学习笔记]ARC与引用计数
自定义table表格
Technology Cloud Report: To realize the metaverse, NVIDIA starts from building an infrastructure platform