【技术实现步骤摘要】
一种用于目标情感分类的深度记忆网络模型及其分类方法
本专利技术涉及计算机
,具体涉及一种用于目标情感分类的深度记忆网络模型及其分类方法。
技术介绍
线上评论的发展,提供了大量可用于挖掘的短文本数据。获取这些文本中的情感观点既蕴涵巨大的商业价值也带来了很多挑战性的学术研究问题。情感分析,也称观点挖掘,研究目标就是分析文本中人们对评论事物(如:产品,服务,时事话题等)的情感,观点或者具体态度。情感分析在成为自然语言处理中的一个研究主题后,迅速成为了热点研究领域。特定目标情感分类,是情感分析研究中的一项细粒度子任务,确定了具体的文本对其所评论目标的情感极性(即positive,negative和neutral)。例如,句子“AveragetogoodThaifood,butterribledelivery.”,分别对目标“Thaifood”和“delivery”表达了积极和消极情感。从这个例子中可以看出,一个评论句子对不同的目标可能表达相反的情感。同时,判断一个目标的情感极性只需要关注一部分的上下文,例如,通过“good”能够确定目标“Thaifood”的情感极性,但却不影响“delivery”的情感判断。本申请专利技术人在实施本专利技术的过程中,发现现有技术的方法,至少存在如下技术问题:受记忆网络(memorynetwork,MN)在问答系统中成功运用的启发,现有深度记忆网络中引入注意力机制。然而,只基于注意力机制的记忆网络不能处理上下文的情感依赖于具体目标的情况。例如,在句子“Thepriceishigh.”和“Thequalityishigh.”中, ...
【技术保护点】
1.一种用于目标情感分类的深度记忆网络模型,其特征在于,包括:输入模块,用于将句子划分为目标向量和对应的上下文向量,其中,上下文向量作为外部记忆被存储;注意力模块,用于基于输入的目标向量从外部存储的上下文向量中获取对应的情感信息,并获得目标上下文表示;交互分类模块,用于对目标上下文表示与目标向量表示进行交互计算,获得句子文本对指定目标的情感表示,然后将情感表示作为特征进行分类,获得模型预测的情感极性。
【技术特征摘要】
1.一种用于目标情感分类的深度记忆网络模型,其特征在于,包括:输入模块,用于将句子划分为目标向量和对应的上下文向量,其中,上下文向量作为外部记忆被存储;注意力模块,用于基于输入的目标向量从外部存储的上下文向量中获取对应的情感信息,并获得目标上下文表示;交互分类模块,用于对目标上下文表示与目标向量表示进行交互计算,获得句子文本对指定目标的情感表示,然后将情感表示作为特征进行分类,获得模型预测的情感极性。2.如权利要求1所述的模型,其特征在于,注意力模块包括第一计算层,其中,第一计算层包括一个注意力函数。3.如权利要求2所述的模型,其特征在于,注意力模块还包括至少一个第二计算层,其中,第二计算层包括一个注意力函数和一个线性函数,并将前一个第二计算层的输出作为下一个第二计算层的输入,通过循环计算,获取目标情感信息。4.一种基于如权利要求1至3任一项权利要求所述的深度记忆网络模型的分类方法,其特征在于,包括:步骤S1:将评论句子根据给定的预设目标划分成目标以及与目标对应的上下文,并根据单词的词向量,获得目标词向量表示和对应的上下文词向量表示;步骤S2:将目标向量表示和上下文向量表示输入注意力函数中,计算每个上下文单词对影响目标情感的权重,并对权重和上下文向量进行融合,获得最终的上下文表示;步骤S3:将上下文表示与目标向量表示进行交互计算,获得句子文本对指定目标的情感表示;步骤S4:将句子文本对指定目标的情感表示进行线性转换和归一化处理,获得深度记忆网络模型以及模型预测的情感极性;步骤S5:采用预设训练数据集训练深度记忆网络模型;步骤S6:基于训练后的模型对待处理的评论句子文本进行情感分类。5.如权利要求4所述的方法,其特征在于,在步骤S2之前,所述方法还包括:判断预设循环次数是否等于0,如果等于0,则执行步骤S2;如果大于0,则将目标向量表示和上下文向量表示输入注意力函数中,计算每个上下文单词对影响目标情感的权重大小,同时将目标向量进行线性转换,再将融合了权重信息的上下文表示与目标线性转换表示相加,作为接下来的运算输入,循环执行该步骤,直到完成预设循环次数,输出向量表示;将输出的向量表示作为步骤S2中的目标向量,执行步骤S2。6.如权利要求1所述的方法,其特征在于,步骤S1具体包括:步骤S1.1:获取外部用大型语料集训练好的词向量;步骤S1.2:给定句子其中wi表示目标,{w1,w2,...,wi-1,wi+1,...,wn-1,wn}表示目标的上下文,n表示句子的长度,将所有单词的词向量集合构成一个词向量矩阵其中d表示词向量的维度,|V|表示词汇表的大小;通过索引词向量矩阵,将每个单词wi转换成对应的词向量表示对应的上下文向量表示的形式为{v1,v2,...,vi-1,vi+1,...,vn-1,vn},将目标视为一个单词,即vt,如果目标为短语,即包含多个单词,则目标词向量由短语的组成词向量的平均值表示。7...
【专利技术属性】
技术研发人员:荆晓远,李晶,左梅,訾璐,
申请(专利权)人:武汉大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。