当前位置:网站首页>BILSTM和CRF的那些事
BILSTM和CRF的那些事
2022-06-25 17:20:00 【青灯剑客】
最近看了黄老师的视频课,一下子觉得自己对这些内容又生疏了,于是找来看了看。现在记录一下
一、框架
框架的选择上,我看老黄选择的也是这张图,正好作者有点料,于是直接将链接添加链接描述附上。
这里有个点,这里的图很重要。注意,LSTM的输出中,每个字输出为label的概率。
二、LSTM的参数量
- 参数量计算
- LSTM的官方文档
- LSTM的结构图如下
lstm的计算公式为: - GRU的结构图为:
图中的zt和rt分别表示更新门和重置门。更新门用于控制前一时刻的状态信息被带入到当前状态中的程度,更新门的值越大说明前一时刻的状态信息带入越少。重置门控制前一状态有多少信息被写入到当前的候选集 h~t 上,重置门越小,前一状态的信息被写入的越少。
更新门是GRU的主要精髓。公式分析时,主要看更新门的写法
注意:rt和zt都是从h(t-1)和xt得来的,其实包含了他们之间的相关性。
三、CRF的详细介绍
此外,我记得依靠模板,crf本身就可以用机器学习的方式(添加模板,U和B模板)来进行BIO学习。我的笔记里有。
BILSTM算出来的是 每个字为每个标签(BIO)的发射概率,CRF算出来的是 字与字之间的转移概率。
loss函数 是:最有路径 和全路径的函数。
预测:维特比算法。
维特比算法为什么不存在 最大熵模型的标注偏置问题?
答:因为 维特比算法 的归一化 是 所有路径的全局归一化;最大熵模型的归一化 是从previous出发的局部归一化,局部归一化会造成局部问题,即 标注偏置问题,详情见https://www.bbsmax.com/A/D854D91p5E/。
边栏推荐
- 单例模式应用
- Can I open an account? Is it safe to open an account
- TCP聊天+传输文件服务器服务器套接字v2.8 - 修复已知程序4个问题
- Learn Tai Chi Maker - mqtt (III) connect to mqtt server
- FreeRTOS内核时钟不对的问题解决
- Kotlin入门(20)几种常见的对话框
- Sword finger offer II 025 Adding two numbers in a linked list
- ES6知识点
- 什么是公链开发?公链开发项目有哪些?
- Website arrangement of super all metal PBR multi-channel mapping materials
猜你喜欢
Old mobile phones turn waste into treasure and serve as servers
数学建模——整数规划
WPF开发随笔收录-心电图曲线绘制
记一次基于PHP学生管理系统的开发
STM32 hardware error hardfault_ Handler processing method
try with resource
社交电商如何运营推广?
Create a new ar fashion experience with cheese and sugar beans
What are the steps for launching the mobile ERP system? It's important to keep it tight
Precautions for the use of Jerry's wake-up mouth [chapter]
随机推荐
Involution? Foam? Change? Ten questions directly hit the core puzzle of "meta universe" – the essence of "ask ta- Wang Lei about the time of the universe"
STM32硬件错误HardFault_Handler的处理方法
[black apple] Lenovo Savior y70002019pg0
启牛涨乐财付通下载是可以开户吗?开户安全吗
学习太极创客 — MQTT(一)MQTT 是什么
Redis 的PSYNC命令
[UVM practice== > episode_2] ~ VIP, VIP development, VIP release
超全金屬PBR多通道貼圖素材網站整理
FreeRTOS内核时钟不对的问题解决
Design and arrangement of DDIA data intensive application system
杰理之增加加密文件播放功能【篇】
超全金属PBR多通道贴图素材网站整理
How Jerry used to output a clock source to the outside world [chapter]
Remote terminal control artifact - mobaxterm
中断操作:AbortController学习笔记
【UVM实战 ===> Episode_2 】~ VIP、VIP的开发、VIP的发布
Jerry's ADC_ get_ Incorrect voltage value obtained by voltage function [chapter]
Sword finger offer II 025 Adding two numbers in a linked list
Pytorch official document learning record
通过深度可分离卷积神经网络对七种表情进行区分