当前位置: 首页 > 专利查询>中国人民解放军战略支援部队信息工程大学专利>正文

基于主题增强的情感共注意力BERT模型的中文评论分类方法技术

技术编号：36535306 阅读：21 留言：0更新日期：2023-02-01 16:20

本发明专利技术公开一种基于主题增强的情感共注意力BERT模型的中文评论分类方法，包括：构建基于主题增强的情感共注意力BERT模型，该模型包括一个上下文编码模块、一个基于GRU网络的主题分类模块及一个基于共注意力网络的情感注意模块；所述上下文编码模块用于使用BERT或类BERT模型生成每个单词和整个句子的上下文表示；所述主题分类模块用于生成每个主题的表示；所述情感注意模块用于将单词表示与主题表示进行共注意力计算，并将注意力值施加在每个单词上，得到情感的注意力表示；通过构建的基于主题增强的情感共注意力BERT模型对中文评论数据进行分类。本发明专利技术提升了中文评论的分类准确性，进而提升了情感分析的准确性。进而提升了情感分析的准确性。进而提升了情感分析的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于主题增强的情感共注意力BERT模型的中文评论分类方法

[0001]本专利技术涉及情感分类
，尤其涉及一种基于主题增强的情感共注意力 BERT模型的中文评论分类方法。

技术介绍

[0002]在利用外部知识辅助情感分析的研究中，已有的技术主要采用引入情感词典、嵌入外部知识，或者设计新的预训练策略等方法，将外部知识引入到情感分析中。
[0003]早期基于机器学习的情感分析技术，通过外部信息来辅助情感分析，这些外部信息大多通过增加新特征的方式引入。比如，对于Twitter数据，在构造特征时，加入hashtags信息进行情感分析；还有研究使用情感字典辅助情感分析，如 SentiWordNet。eSAP在对SentiWordNet进行加工处理之后，将基于无监督的词粒度情感与有监督学习进行结合，从词汇表中提取特征权重，输入SVM分类器进行学习。
[0004]人为引入新特征，并使用机器学习的方法进行情感预测，耗费人力而且不够灵活，一些深度模型通过增加嵌入的方法引入外部信息。ATAE
‑
LSTM将方面嵌入与词嵌入拼接，输入双向LSTM模型，将每个时刻输出的隐藏状态与方面嵌入再次拼接，计算注意力值。ASAP使用多任务联合训练的方法，模型在学习方面类别情感状态的同时，对评论执行评分预测，发现方面级情感的感知能够提升整体评分预测准确性。
[0005]随着预训练模型在NLP领域的广泛应用，针对情感分析任务的预训练模型被提出。SentiBERT将上下文表示与短语二叉树结合...

【技术保护点】

【技术特征摘要】
1.一种基于主题增强的情感共注意力BERT模型的中文评论分类方法，其特征在于，包括：步骤1：构建基于主题增强的情感共注意力BERT模型，该模型包括一个上下文编码模块、一个基于GRU网络的主题分类模块及一个基于共注意力网络的情感注意模块；所述上下文编码模块用于使用BERT或类BERT模型生成每个单词和整个句子的上下文表示；所述主题分类模块用于生成每个主题的表示；所述情感注意模块用于将单词表示与主题表示进行共注意力计算，并将注意力值施加在每个单词上，得到情感的注意力表示；步骤2：通过构建的基于主题增强的情感共注意力BERT模型对中文评论数据进行分类。2.根据权利要求1所述的基于主题增强的情感共注意力BERT模型的中文评论分类方法，其特征在于，所述主题分类模块中，采用双向GRU从上下文表示中提取主题信息，为了减小主题信息之间的相互影响，对每个主题设置一个独立的双向GRU，用于该主题信息的提取。3.根据权利要求1所述的基于主题增强的情感共注意力BERT模型的中文评论分类方法，其特征在于，所述主题分类模块中：从特殊字符[CLS]的编码中获取句子的主题信息h
cls
，将h
cls
输入m个双向GRU网络，得到m个隐藏状态t1,t2,
…
t
m
，其中，将t1,t2,...t
m
依次输入全连接层，经过sigmoid函数激活后，得到m个主题在句子中的概率分布，与对应主题标签计算损失，进行反向传播；并使用二元交叉熵计算分类的损失。4.根据权利要求3所述的基于主题增强的情感共注意力BERT模型的中文评论分类方法，其特征在于，所述情感注意模块中：将n个单词的表示向量进行堆叠，得到矩阵H＝[h1,h2,
…
h
n
]，矩阵H包含句子的局部上下文信息，与主题表示T＝[t1,t2,...t
m<...

【专利技术属性】
技术研发人员：王世宇，周刚，陈静，兰明敬，卢记仓，李珠峰，夏毅，
申请(专利权)人：中国人民解放军战略支援部队信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人