【技术实现步骤摘要】
一种多任务联合学习的面向评价对象的情感分析方法
本专利技术涉及多任务联合学习的面向评价对象的情感分析方法。
技术介绍
随着近几年互联网的发展,文本作为互联网中一种常用信息载体,呈现出爆发式增长的势态,如电商平台的用户评论、视频平台的弹幕、新闻、博客、聊天等,其中大量文本包含着用户对某种对象进行评价的信息,本文将带有这种信息的文本统称为评论。评论中包含用户的喜好、产品缺陷等非常有价值的信息,通过汇总大量评论中包含的信息,可以帮助平台更好地进行推送符合用户喜好的内容,可以帮助厂家对产品问题作出及时整改,也可以帮助用户总结其他人的经验。本专利技术采用深度学习的方法自动分析评论内容,进行评价对象、评价对象情感与评价词的联合抽取。评价对象抽取是指从评论中抽取文本所评价的对象,对象可以是某种事物,也可以是事物的某种属性;评价对象情感抽取,也称为评价对象情感判断,当给定文本中的评价对象,判断文本对该对象的情感取向,往往分为两种情况——褒或者贬(当文本对于文本中的某个对象无情感时,认为该文本不是该对象的评论);评价词抽取,从评论中抽 ...
【技术保护点】
1.一种多任务联合学习的面向评价对象的情感分析方法,其特征在于:所述方法具体过程为:/n步骤一、将文本进行词向量表示;/n步骤二、基于步骤一将文本的词向量表示
【技术特征摘要】
1.一种多任务联合学习的面向评价对象的情感分析方法,其特征在于:所述方法具体过程为:
步骤一、将文本进行词向量表示;
步骤二、基于步骤一将文本的词向量表示进行初步抽象,得到共享表示;
步骤三、基于步骤二进行评价对象和评价词抽取,得到评价对象和评价词抽取的标签概率分布;
步骤四、基于步骤二和步骤三进行评价对象情感判断,得到评价对象情感判断的标签概率分布;
步骤五、基于步骤三、步骤四进行信息传递,得到更新后的概率分布probAE、probAS;
步骤六、基于步骤一到步骤五确定的模型结构,使用人工标注语料确定模型参数,得到情感分析模型,采用情感分析模型完成对评价对象的情感分析。
2.根据权利要求1所述一种多任务联合学习的面向评价对象的情感分析方法,其特征在于:所述步骤一中将文本进行词向量表示;具体过程为:
将文本X={w0,w1,...,wn}用领域词向量Edomain和通用词向量Egeneral进行表示并拼接为
其中,领域词向量通过目标领域未标注语料进行训练;
通用词向量通过不定领域的未标注语料进行训练;
Edomain=Embeddingdomain(X)(1)
Egeneral=Embeddinggeneral(X)(2)
式中,X为输入文本的索引表示,Embeddingdomain为领域词向量层;Edomain为领域词向量表示,Embeddinggeneral为通用词向量层;Egeneral为通用词向量表示;concatenate为对张量的最后一个维度进行拼接操作;为领域词向量和通用词向量拼接后的词向量表示,t表示信息传递的轮次,t=0。
3.根据权利要求1或2所述一种多任务联合学习的面向评价对象的情感分析方法,其特征在于:所述步骤二中基于步骤一将文本的词向量表示进行初步抽象,得到共享表示;具体过程为:
使用单层CNN对文本的词向量表示进行初步抽象得到共享表示outputshared;
式中,outputshared为抽象得到的共享表示,CNNshared为用于初步抽象得到共享表示的CNN层。
4.根据权利要求3所述一种多任务联合学习的面向评价对象的情感分析方法,其特征在于:所述步骤三中基于步骤二进行评价对象和评价词抽取,得到评价对象和评价词抽取的标签概率分布;具体过程为:
使用双向GRU对步骤二的输出outputshared进行进一步抽象为outputrnn,使每个词素得到联系全文的表示;
全文指词素所在的整条评论;
词素表示文本进行分词后得到的每个词、符号以及分词错误得到的字符组合;
outputrnn=GRUAE(outputshared)(5)
式中,outputrnn为GRUAE抽象后的上下文相关表示,GRUAE为用于评价对象和评价词抽取的GRU层;
将outputrnn与outputshared拼接得到outputAE;
式中,outputAE为拼接操作后的结果;
将outputAE进行线性变换LinearAE为5d,在经过softmax得到每个词素的标签概率分布probAE;
5d表示张量最后一个维度...
【专利技术属性】
技术研发人员:赵妍妍,王帅,秦兵,
申请(专利权)人:哈尔滨工业大学,
类型:发明
国别省市:黑龙;23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。