【技术实现步骤摘要】
一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法
[0001]本专利技术属于人工智能
,涉及自然语言处理的情感分析,特别涉及一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法。
技术介绍
[0002]情感分析作为自然语言处理领域和计算机语言学的一项基础任务,旨在判断出文本所表达的情感倾向。情感分析技术主要对篇章级、句子级和方面级三种粒度的文本进行分析,将整篇文章作为研究对象的分析方法比较粗糙,只能判断出文章所表达的整体情感倾向是积极或消极。以句子为单位的情感分析方法能识别出句子所表达的整体情感,但无法对句子中包含的目标词进行情感极性判断。方面级情感分析是一种细粒度级的情感分析,旨在分析句子中特定实体或属性的情感倾向。在以往的研究中,整个段落或者句子中包含的文本信息较多,但它的情感极性比较单一,只能得到正面或负面的情感倾向,这并不能准确地分析出评论者对于某个实体的情感态度。文本情感极性的判别不仅取决于句子中的文本信息,还与文本中特定方面的表达密切相关。由此可见,一个句子中不同方面词会对文本情感极性判断产生不同的影响。对于大多数文本内容来说,只给出一个笼统的情感倾向是没有意义的,都需要得到更细致的分析结果,这样有利于全面了解评论信息,从而做出更正确的选择。
[0003]随着深度学习在自然语言处理领域展现的独特优势,许多研究人员提出了基于循环神经网络(RNN)的方面情感分析模型,但单循环神经网络无法捕捉句中方面词与关键信息间的关联性,于是许多研究人员致力于引入注意力机制来解决。Wang等在长 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,包括如下步骤:步骤1,对蒙古情感语料进行预处理,将预处理后的蒙古语情感语料进行多维特征表示,然后进行多维特征注意力融合得到融合特征矩阵F;步骤2,从所述融合特征矩阵F中抽取出主题词库,经过CNN模型训练得到主题特征向量;步骤3,将所述融合特征矩阵F与所述主题特征向量输入到TBGRU模型中获取文本语义信息;步骤4,将TBGRU模型的输出结果与所述主题特征向量的共同语义特征进行注意力融合;步骤5,根据融合结果,使用比较增强学习机制获取文本情感分类信息。2.根据权利要求1所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,所述步骤1,预处理包括:数据清洗和分词。3.根据权利要求1所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,所述多维特征表示,是将语料中情感词的词性、词与词的位置关系以及句法依存关系特征加入词向量中,以从多维度层面挖掘出文本语义隐含的更深层次的信息;设句子中第t个单词的词向量为e
t
,同时将第t个单词对应的词性特征向量、位置特征向量和句法依存特征向量分别设为s
t
、t
t
、q
t
,将句子中的单词拼接在一起,每个特征向量矩阵表示的具体方法如下公式所示:表示的具体方法如下公式所示:表示的具体方法如下公式所示:表示的具体方法如下公式所示:其中,a表示句子的长度,1≤t≤a,c、d、b和k分别表示词向量矩阵、词性特征向量矩阵、位置特征向量矩阵和句法依存特征向量矩阵的维度,P
c
、P
d
、P
b
和P
k
分别表示该句子的词、词性、位置和句法依存特征向量拼接矩阵,表示向量拼接操作,进行多维特征表示之后输出的矩阵为y,y=P
c
+P
d
+P
b
+P
k
;所述多维特征注意力融合,计算方法如下所示:M(y
i
)=tanh(Wy
i
+b)+b)其中,tanh表示激活函数,y
i
表示矩阵y中的第i个向量,M(y
i
)表示向量y
i
对应特征的权
重,W表示权重矩阵,b表示偏置矩阵,β
i
表示M(y
i
)经过SoftMax的输出,f
i
表示第i个单词的融合特征向量;n表示矩阵y中向量的个数;融合特征矩阵F表示为F=[f1,f2,...,f
i
,...,f
n
]。4.根据权利要求3所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,所述步骤2,在融合特征矩阵F中,选用SS
‑
LDA,将一个句子中出现的多个方面主题均提取出来,组成主题词库s=[s1、s2、...、s
i
、...、s
m
],其中,s
i
表示第i个主题词,m表示主题词的个数;将主题词库s输入到CNN模型中,通过卷积和池化操作提取主题特征u,公式如下所示:u=f
relu
(s*W
u
+b
u
)其中,f
relu
表示激活函数,W
u
是c*m的卷积核,b
u
是偏置值;采用最大池化方法对主题特征u进行采样,得到主题特征向量S=[S1、S2、...、S
i
、...、S
M
],其中,S
i
表示采样后得到的第i个主题特征,M表示经过采样后得到的主题特征的个数。5.根据权利要求4所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,所述步骤3,TBGRU模型是在GRU模型基础上嵌入了主题特征向量,将融合特征矩阵F输入到所述TBGRU模型中,同时将主题特征向量嵌入到TBGRU模型中进行模型训练,在模型训练过程中添加注意力进行权值分配,得到文本语义信息表示。6.根据权利要求5所述基于多维特征融合与比较增强学习机制的蒙古语情感分析方法,其特征在于,所述步骤3的流程如下:(1)将融合特征矩阵F输入到TBGRU模型中,使用双向GRU对融合特征矩阵F进行编码,输入的每个单词隐藏状态h
i
由前向隐藏状态和后向隐藏状态连接表示,获取以h
i
为中心的整个句子的上下文信息;(2)将主题特征向量S嵌入到TBGRU模型中,使用MLP计算h
i
技术研发人员:苏依拉,赵梦莹,仁庆道尔吉,吉亚图,乌尼尔,路敏,
申请(专利权)人:内蒙古工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。