【技术实现步骤摘要】
一种基于双图注意力网络的方面类别情感分类方法
[0001]本专利技术涉及自然语言处理
,具体涉及一种基于双图注意力网络的方面类别情感分类方法。
技术介绍
[0002]近年来,由于人们对消费需求的转型升级,国内互联网服务业飞速发展,积累了海量的用户评论信息。这些信息蕴含着巨大的商业价值和社会价值,能够从一定程度上呈现出用户对商品、环境或体验的一种主观看法和情感表达。对这些用户评论进行情感分类,可以了解到用户的情绪是积极还是消极的,从而获取诸多及时有效的信息。运用这些信息,医疗平台可以帮助患者有针对性地做出决策,帮助医生改进服务质量;电商平台可以了解用户的需求,对商品的缺陷进行改进;政府机关可以对某一新闻事件进行舆情监测。
[0003]然而,在现实生活场景中,一个用户评论可能涉及多个方面,传统情感分类太过于笼统,无法对一篇文档中的多个方面进行单独分析,不能区分一条用户评论中多个方面的情绪极性。例如,给定评论句“这个餐馆虽然位置很偏,但饭菜很可口”,可见“地理位置”和“食物”方面表达的情绪正好相反,模型有必要正确预测 ...
【技术保护点】
【技术特征摘要】
1.一种基于双图注意力网络的方面类别情感分类方法,其特征在于,包括:步骤1:对评论文本进行预处理操作,从嵌入查找表中获得词嵌入矩阵,将预处理后的评论句和方面词进行词嵌入编码,使用BERT编码器提取出评论句和方面词的隐藏上下文表示;步骤2:将所述隐藏上下文表示作为图网络中节点的初始化表示,然后利用评论句的序列上下文信息和句法结构信息分别获取节点之间的边权值,根据相同节点表示和不同边权值分别构建序列图和句法图;步骤3:通过所述序列图和句法图进行消息传递,即在每个图内利用图注意力网络分别捕获单词节点与其邻近节点之间的关系,两图之间采用双仿射变换学习序列图和句法图蕴含的异构信息,并对节点矩阵进行维度变换,得到评论句特征表示;步骤4:对所述评论句特征表示进一步处理,即利用特定方面的Mask机制和注意力机制,来突出评论句中方面类别词的重要性,得到评论句中每个方面类别对应的情感极性。2.根据权利要求1所述一种基于双图注意力网络的方面类别情感分类方法,其特征在于,所述步骤2具体实现方式为:步骤21:将每个单词节点与步骤1获得的相应隐藏上下文表示关联,使用逐点互信息描述两个单词在固定大小的滑动窗口内的序列关系,从而实现序列图中边信息的添加,每对节点之间的边权值为:为:为:为:其中#N是评论句中滑动窗口的总数,#N(w
i
,w
j
)是单词对(w
i
,w
j
)在相同的滑动窗口内共现的次数,#N(w
i
)和#N(w
j
)分别是单词w
i
和单词w
j
在评论句的滑动窗口内出现的次数;步骤22:将每个单词节点与步骤1获得的相应隐藏上下文表示关联,利用依赖解析器标注注意力层对输入序列进行依赖解析,得到表示单词之间依赖关系的大小为n
×
n的概率矩阵A
syn
,并将单词之间的关系扩展为其所有子词之间的依赖关系;每对节点之间的边权值为:其中A
syn
(w
i
,w
j
)表示单词w
i
和单词w
j
之间的依赖解析矩阵,表示第n个原始单词与其k个子单词的连接关系。3.根据权利要求2所述一种基于双图注意力网络的方面类别情感分类方法,其特征在于,所述步骤3具体实现方式为:
步骤31:针对步骤2构建的序列图和句法图,利用图注意力网络进行图内信息传递,从而捕获单词节点与其邻近节点之间的关系;具体来说,图注意力网络使用多头注意力来获取两个节点之间的注意力权重:其中α
ij
是节点v
i
和节点v
j
之间的注意力系数,N
i
表示节点v
i
的所有邻居节点集合,v
t
是该集合中的一个邻居节点,h
i
,h
j
和h
t
分别表示节点v
i
,v<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。