当前位置：网站首页>《Attentional Encoder Network for Targeted Sentiment Classification》论文阅读

《Attentional Encoder Network for Targeted Sentiment Classification》论文阅读

2022-07-13 19:34:00 【jst100】

文章地址：https://arxiv.org/pdf/1902.09314.pdf

文章目录

文章内容

之前处理基于特定方面实体的情感分类大多使用RNN和注意力机制进行建模，然而RNN河南并行化，而且句子过长时也给长期记忆带来困难。因此该问提出了一种注意力编码网络AEN（Attentional Encoder Network），来对上下文和目标实体进行建模。并且该文还提出了标签不可靠性问题，从而引入了标签平滑正则化。

文章方法

在这里插入图片描述

嵌入层

这里作者采用了两种方式来实现，一个是静态词嵌入Glove，也就是已经训练好的，另一个是BERT模型，作者的构建的方式有2种，对于上下文为“[CLS] + context + [SEP]”，对于目标实体为“[CLS] + target

[SEP]”。除此之外作者还做了一个只有BERT的对比模型叫BERT-SPC，其构造方式为“[CLS] + context + [SEP] + target + [SEP]”。

注意力层

作者这里是借鉴了多头注意里机制设计了2种方式：
Intra-MHA,这里注意力机制的k和v都为context也就是上下文，就是内部注意力机制，公式如下：
在这里插入图片描述 Inter-MHA即交互注意力机制，q为context而k为目标实体，也就是要学习目标实体和上下文的交互关系，公式如下：