当前位置:网站首页>Pytorch学习笔记--常用函数总结3
Pytorch学习笔记--常用函数总结3
2022-07-25 15:28:00 【whut_L】
1--torch.optim.SGD()函数拓展
import torch
LEARNING_RATE = 0.01 # 梯度下降学习率
MOMENTUM = 0.9 # 冲量大小
WEIGHT_DECAY = 0.0005 # 权重衰减系数
optimizer = torch.optim.SGD(
net.parameters(),
lr = LEARNING_RATE,
momentum = MOMENTUM,
weight_decay = WEIGHT_DECAY,
nesterov = True
)参数解释:lr表示学习率;momentum表示冲量因子;weight_decay表示权重衰减系数(将使用L2正则项);nesterov表示使用Nesterov冲量;
常规梯度下降算法:

l表示学习率; J(θ)表示损失函数;▽表示求梯度;
带momentum的梯度下降算法:

m表示冲量因子,l表示学习率;
基于Nesterov冲量的梯度下降算法:

带weight_decay的梯度下降算法:
主要作用是对损失函数增加L2正则项,强烈建议通过参考链接1了解L2正则化的作用,即如何避免过拟合,权重衰减通过参考链接2理解。
2--torch.manual_seed()函数和torch.cuda.manual_seed()函数
torch.manual_seed()函数:为CPU设置种子,确保每次实验生成的随机数固定,即初始化相同;
torch.cuda.manual_seed()函数:为当前GPU设置种子,作用与torch.manual_seed()函数相同;
torch.cuda.manual_seed_all()函数:为所有GPU设置种子。
在神经网络中,参数默认是进行随机初始化的。不同的初始化参数往往会导致不同的结果,当获得较好结果时我们通常希望这个结果是可以复现的。在pytorch中,通过设置随机数种子确保每次代码运行时初始化操作都相同,从而在相同的算法或神经网络程序中,确保运行的结果也相同。参考链接1参考链接2
边栏推荐
- 记一次Yarn Required executor memeory is above the max threshold(8192MB) of this cluster!
- How to finally generate a file from saveastextfile in spark
- redis淘汰策列
- SVD奇异值分解推导及应用与信号恢复
- UIDocumentInteractionController UIDocumentPickerViewController
- 数据系统分区设计 - 分区与二级索引
- ML - 语音 - 高级语音模型
- CF888G-巧妙字典树+暴力分治(异或最小生成树)
- The number of query results of maxcompute SQL is limited to 1W
- Flink-1.13.6版本的 Flink sql以yarn session 模式运行,怎么禁用托管
猜你喜欢

MySQL transactions and mvcc

为什么PrepareStatement性能更好更安全?

《图书馆管理系统——“借书还书”模块》项目研发阶段性总结

Ml speech depth neural network model

p4552-差分

matlab 如何保存所有运行后的数据

Remember that spark foreachpartition once led to oom

ML - Speech - advanced speech model

Distributed principle - what is a distributed system

How to solve the login problem after the 30 day experience period of visual stuido2019
随机推荐
分布式原理 - 什么是分布式系统
Once spark reported an error: failed to allocate a page (67108864 bytes), try again
请问seata中mysql参数每个客户端连接最大的错误允许数量要怎么理解呢?
记一次redis超时
Flex 布局
Example of password strength verification
Args parameter parsing
PAT甲级题目目录
ML - 图像 - 深度学习和卷积神经网络
ML - 语音 - 深度神经网络模型
Singleton mode 3-- singleton mode
数据系统分区设计 - 分区再平衡(rebalancing)
Image cropper example
带你详细认识JS基础语法(建议收藏)
Take you to learn more about JS basic grammar (recommended Collection)
2021上海市赛-H-二分答案
CF685B-求有根树每颗子树的重心
Spark SQL UDF function
你准备好脱离“内卷化怪圈”了吗?
See a lot of blinking pictures on apps, especially the member page