当前位置:网站首页>深度學習19種損失函數
深度學習19種損失函數
2022-06-28 05:47:00 【TBYourHero】
本文匯總了19種損失函數,並對其進行了簡要介紹。本文作者@ mingo_敏,僅作學術分享,著作權歸作者所有,如有侵權,請聯系後臺作删文處理。
tensorflow和pytorch很多都是相似的,這裏以pytorch為例。
1. L1範數損失 L1Loss
計算 output 和 target 之差的絕對值。
torch.nn.L1Loss(reduction='mean')
參數:
reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。
2 均方誤差損失 MSELoss
計算 output 和 target 之差的均方差。
torch.nn.MSELoss(reduction='mean')
參數:
reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。
3 交叉熵損失 CrossEntropyLoss
當訓練有 C 個類別的分類問題時很有效. 可選參數 weight 必須是一個1維 Tensor, 權重將被分配給各個類別. 對於不平衡的訓練集非常有效。
在多分類任務中,經常采用 softmax 激活函數+交叉熵損失函數,因為交叉熵描述了兩個概率分布的差异,然而神經網絡輸出的是向量,並不是概率分布的形式。所以需要 softmax激活函數將一個向量進行“歸一化”成概率分布的形式,再采用交叉熵損失函數計算 loss。

torch.nn.CrossEntropyLoss(weight=None,ignore_index=-100, reduction='mean')
參數:
weight (Tensor, optional) – 自定義的每個類別的權重. 必須是一個長度為 C 的 Tensor
ignore_index (int, optional) – 設置一個目標值, 該目標值會被忽略, 從而不會影響到 輸入的梯度。
reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。
4 KL 散度損失 KLDivLoss
計算 input 和 target 之間的 KL 散度。KL 散度可用於衡量不同的連續分布之間的距離, 在連續的輸出分布的空間上(離散采樣)上進行直接回歸時 很有效.
torch.nn.KLDivLoss(reduction='mean')
參數:
reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。
5 二進制交叉熵損失 BCELoss
二分類任務時的交叉熵計算函數。用於測量重構的誤差, 例如自動編碼機. 注意目標的值 t[i] 的範圍為0到1之間.
torch.nn.BCELoss(weight=None, reduction='mean')
參數:
weight (Tensor, optional) – 自定義的每個 batch 元素的 loss 的權重. 必須是一個長度為 “nbatch” 的 的 Tensor
6 BCEWithLogitsLoss
BCEWithLogitsLoss損失函數把 Sigmoid 層集成到了 BCELoss 類中. 該版比用一個簡單的 Sigmoid 層和 BCELoss 在數值上更穩定, 因為把這兩個操作合並為一個層之後, 可以利用 log-sum-exp 的 技巧來實現數值穩定.
torch.nn.BCEWithLogitsLoss(weight=None, reduction='mean', pos_weight=None)
參數:
weight (Tensor, optional) – 自定義的每個 batch 元素的 loss 的權重. 必須是一個長度 為 “nbatch” 的 Tensor
7 MarginRankingLoss
torch.nn.MarginRankingLoss(margin=0.0, reduction='mean')
對於 mini-batch(小批量) 中每個實例的損失函數如下:

參數:
margin:默認值0
8 HingeEmbeddingLoss
torch.nn.HingeEmbeddingLoss(margin=1.0, reduction='mean')
對於 mini-batch(小批量) 中每個實例的損失函數如下:

參數:
margin:默認值1
9 多標簽分類損失 MultiLabelMarginLoss
torch.nn.MultiLabelMarginLoss(reduction='mean')
對於mini-batch(小批量) 中的每個樣本按如下公式計算損失:

10 平滑版L1損失 SmoothL1Loss
也被稱為 Huber 損失函數。
torch.nn.SmoothL1Loss(reduction='mean')

其中

11 2分類的logistic損失 SoftMarginLoss
torch.nn.SoftMarginLoss(reduction='mean')

12 多標簽 one-versus-all 損失 MultiLabelSoftMarginLoss
torch.nn.MultiLabelSoftMarginLoss(weight=None, reduction='mean')

13 cosine 損失 CosineEmbeddingLoss
torch.nn.CosineEmbeddingLoss(margin=0.0, reduction='mean')

參數:
margin:默認值0
14 多類別分類的hinge損失 MultiMarginLoss
torch.nn.MultiMarginLoss(p=1, margin=1.0, weight=None, reduction='mean')

參數:
p=1或者2 默認值:1
margin:默認值1
15 三元組損失 TripletMarginLoss
和孿生網絡相似,具體例子:給一個A,然後再給B、C,看看B、C誰和A更像。

torch.nn.TripletMarginLoss(margin=1.0, p=2.0, eps=1e-06, swap=False, reduction='mean')
其中:

16 連接時序分類損失 CTCLoss
CTC連接時序分類損失,可以對沒有對齊的數據進行自動對齊,主要用在沒有事先對齊的序列化數據訓練上。比如語音識別、ocr識別等等。
torch.nn.CTCLoss(blank=0, reduction='mean')
參數:
reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。
17 負對數似然損失 NLLLoss
負對數似然損失. 用於訓練 C 個類別的分類問題.
torch.nn.NLLLoss(weight=None, ignore_index=-100, reduction='mean')
參數:
weight (Tensor, optional) – 自定義的每個類別的權重. 必須是一個長度為 C 的 Tensor
ignore_index (int, optional) – 設置一個目標值, 該目標值會被忽略, 從而不會影響到 輸入的梯度.
18 NLLLoss2d
對於圖片輸入的負對數似然損失. 它計算每個像素的負對數似然損失.
torch.nn.NLLLoss2d(weight=None, ignore_index=-100, reduction='mean')
參數:
weight (Tensor, optional) – 自定義的每個類別的權重. 必須是一個長度為 C 的 Tensor
reduction-三個值,none: 不使用約簡;mean:返回loss和的平均值;sum:返回loss的和。默認:mean。
19 PoissonNLLLoss
目標值為泊松分布的負對數似然損失
torch.nn.PoissonNLLLoss(log_input=True, full=False, eps=1e-08, reduction='mean')
參數:
log_input (bool, optional) – 如果設置為 True , loss 將會按照公 式 exp(input) - target * input 來計算, 如果設置為 False , loss 將會按照 input - target * log(input+eps) 計算.
full (bool, optional) – 是否計算全部的 loss, i. e. 加上 Stirling 近似項 target * log(target) - target + 0.5 * log(2 * pi * target).
eps (float, optional) – 默認值: 1e-8
參考資料:
pytorch loss function 總結
边栏推荐
猜你喜欢
Sharing | intelligent environmental protection - ecological civilization informatization solution (PDF attached)
Shutter nestedscrollview sliding folding head pull-down refresh effect
6. graduation design temperature and humidity monitoring system (esp8266 + DHT11 +oled real-time upload temperature and humidity data to the public network server and display the real-time temperature
Data middle office: six questions data middle office
Windows环境Redis使用AOF持久化,无法生成AOF文件,生成后无法加载AOF文件内容
开发者的时代红利在哪里?
Interpretation of cloud native microservice technology trend
Yunda's cloud based business in Taiwan construction 𞓜 practical school
电子邮件营销的优势在哪里?为什么shopline独立站卖家如此重视?
[CAD drawing Video] AutoCAD 2014 master's way
随机推荐
【Linux】——使用xshell在Linux上安装MySQL及实现Webapp的部署
数据仓库:金融/银行业主题层划分方案
Cryptography notes
pytorch详解
Drop down box for implementation
Jenkins继续集成2
jq图片放大器
Important basis for ERP software company selection
PS effect understanding record 2 color_ dodge color_ burn
codeforces每日5题(均1700)
Application of Beidou No.3 short message terminal in dam safety monitoring scheme
Error: the following arguments are required:
Academic search related papers
[JVM] - Division de la mémoire en JVM
jsp连接oracle实现登录注册(简单)
【JVM】——JVM中内存划分
Flink 窗口机制 (两次等待, 最后兜底)
Where is the era bonus for developers?
电子邮件营销的优势在哪里?为什么shopline独立站卖家如此重视?
Typescript interface