一种利用目标知识增强模型的情感分类方法和装置制造方法及图纸

技术编号：29584585 阅读：28 留言：0更新日期：2021-08-06 19:43

本发明专利技术涉及一种利用目标知识增强模型的情感分类方法及装置。本发明专利技术所述的利用目标知识增强模型的情感分类方法包括：构建目标知识增强模型，目标知识增强模型包括输入层、嵌入层、多头自注意力层、知识注意力层、隐藏层和输出层；根据待预测的上下文中的目标词，获取每个目标词对应的知识句子；将上下文与每个知识句子输入至目标知识增强模型，得到上下文的情感分类结果。本发明专利技术所述的利用目标知识增强模型的情感分类方法，对中文评论文本中的目标词进行外部知识引入，并提出了知识注意力机制，对引入的外部知识动态分配权重，弥补了目标词本身信息量不足的缺陷，具有分类准确度高的优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种利用目标知识增强模型的情感分类方法和装置
本专利技术涉及情感分类
，特别是涉及一种利用目标知识增强模型的情感分类方法。
技术介绍
传统的方面级情感分类方法通常采用机器学习方法，如支持向量机(SVM)，需要人工特征，包括句法分析特征和词典特征。与传统的机器学习方法相比，神经网络可以从文本中自动获取重要的语义信息，避免了大量的人工操作。因此，它被广泛地应用于方面级的情感分类。神经网络能够从文本中自动捕捉重要的情感特征，因此在方面级情感分类中得到了广泛的应用。Tang等人使用两个长短时记忆网络(LSTM)来捕捉一个方面前后的情绪特征。Wang等人提出了一个具有注意机制的LSTM，用于捕捉上下文中的情绪特征。Ma等人提出了两个基于注意的LSTM网络，用于交互生成句子和体表示，并将这些表示连接起来进行预测。Chen等人使用门控递归单元(GRU)网络来整合LSTM的隐藏状态。Zeng等人利用局部语境注意机制来捕捉评论文本中的局部语境特征。Wagner等人从多个外部情感词典中训练支持向量机进行情绪分类任务。kirithenk本文档来自技高网...

【技术保护点】
1.一种利用目标知识增强模型的情感分类方法，其特征在于，包括以下步骤：/n构建目标知识增强模型，所述目标知识增强模型包括输入层、嵌入层、多头自注意力层、知识注意力层、隐藏层和输出层；/n根据待预测的上下文中的目标词，获取每个所述目标词对应的知识句子；/n将所述上下文与每个所述知识句子输入至所述输入层中，对所述上下文和所述知识句子进行拼接，得到输入层的输出序列；/n将所述输入层的输出序列输入至所述嵌入层中，将每个单词或标记映射到向量空间，得到上下文的输出向量表示和知识句子的输出向量表示；/n将所述上下文的输出向量表示和所述知识句子的输出向量表示输入至所述多头自注意力层中，计算所述上下文和所述知识...

【技术特征摘要】
1.一种利用目标知识增强模型的情感分类方法，其特征在于，包括以下步骤：
构建目标知识增强模型，所述目标知识增强模型包括输入层、嵌入层、多头自注意力层、知识注意力层、隐藏层和输出层；
根据待预测的上下文中的目标词，获取每个所述目标词对应的知识句子；
将所述上下文与每个所述知识句子输入至所述输入层中，对所述上下文和所述知识句子进行拼接，得到输入层的输出序列；
将所述输入层的输出序列输入至所述嵌入层中，将每个单词或标记映射到向量空间，得到上下文的输出向量表示和知识句子的输出向量表示；
将所述上下文的输出向量表示和所述知识句子的输出向量表示输入至所述多头自注意力层中，计算所述上下文和所述知识句子中每个单词的注意力分数，得到上下文的多头输出序列和知识句子的多头输出序列，以及，得到所述上下文中每个字的权重；
将所述上下文中每个字的权重以及所述知识句子的多头输出序列输入至所述知识注意力层中，得到加权后的所述知识句子的多头输出序列，并拼接所述上下文的多头输出序列和所述加权后的所述知识句子的多头输出序列，输出知识注意力层的输出序列；
将所述知识注意力层的输出序列输入至所述隐藏层中，提取所述知识注意力层的输出序列的隐藏状态向量，得到隐藏层的输出序列；
将所述隐藏层的输出序列输入至所述输出层中，得到所述上下文的分类结果。

2.根据权利要求1所述的一种利用目标知识增强模型的情感分类方法，其特征在于，所述隐藏层为隐藏注意力层，所述提取所述知识注意力层的输出序列的隐藏状态向量，包括：
基于隐藏注意机制计算所述知识注意力层的输出序列的每个字的隐藏状态向量的加权和。

3.根据权利要求1所述的一种利用目标知识增强模型的情感分类方法，其特征在于，得到所述上下文中每个字的权重，包括：
根据如下公式，计算每个自注意力头中字与字之间的权重：

其中，为每个自注意力头中字与字之间的权重，Q，K，V为上下文句子中每个字的三种不同向量化表示。

4.根据权利要求1所述的一种利用目标知识增强模型的情感分类方法，其特征在于，得到加权后的知识句子的多头输出序列，包括：
根据如下公式，计算加权后的知识句子的多头输出序列。

Wcharacter＝Sum(WC)

其中，WC表示字与字之间的权重，Wcharacter表示字相对于上下文句子的权重，LO表示目标词的第一个字的位置；当目标词为复合词时，Li表示第i个子目标词的最后...

【专利技术属性】
技术研发人员：曾碧卿，杨健豪，陈嘉涛，邓会敏，
申请(专利权)人：华南师范大学，广东农工商职业技术学院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人