基于知识互蒸馏的评论情感分析方法、装置及系统制造方法及图纸

技术编号:25270666 阅读:44 留言:0更新日期:2020-08-14 23:03
本发明专利技术提出一种基于知识互蒸馏的评论情感分析方法、装置及系统,所述方法包括:从训练数据集中确定一当前训练实例,基于第一分类器计算得到第一情感预测结果;基于第二分类器计算得到第二情感预测结果,基于第三分类器计算得到第三情感预测结果;根据第一、第二、第三情感预测结果以及真实类别标记,分别计算三个分类器各自对应的总体代价函数并对各总体代价函数进行最小化处理,以对各分类器进行参数迭代更新实现最终收敛。本发明专利技术中的三个分类器基于知识互蒸馏的方法互相学习、共同提高,同时利用用户和产品两种属性对评论文本情感的共同影响以及各自的单独影响,从实质上提高不同场合下评论情感分析的性能。

【技术实现步骤摘要】
基于知识互蒸馏的评论情感分析方法、装置及系统
本专利技术涉及计算机智能分析处理
,特别涉及一种基于知识互蒸馏的评论情感分析方法、装置及系统。
技术介绍
文档级的情感分类是情感分析和意见挖掘领域一项基本且重要的任务。如何从实质上提高情感分析的性能,成为了专家学者们研究的主要课题。例如:某购物网站用户“张三”针对其购买的产品“华为P30”手机发表了评论“这个手机拍的照片挺清晰”,其中“张三”是这条评论的用户属性,“华为P30”是这条评论的产品属性。不同用户的用词习惯可能不同,其对不同产品的喜好程度也可能不同,因此在评论文本情感分析模型中有必要考虑上述两种属性信息。大量的研究工作已经证实,在用户针对产品的评论中,用户属性和产品属性对评论文本的情感影响很大,考虑这两种属性信息的模型比仅考虑评论文本的模型的性能更好。目前,各种基于深度学习集成用户和产品属性信息的模型可以被粗略地分为两大类:(1)如图1(a)所示,此类模型通常基于一个神经网络把两种属性信息融合到一个评论文本特征表示中,其被用作特征预测分类概率。一般通过基于注意力机制的方法或者基于记忆网络的方法实现。从本质上来看,此类模型重点建模了两种属性对评论文本情感的共同影响。(2)如图1(b)所示,此类模型通常先通过两个单独的子网络分别学习一个融合了用户属性信息的文本特征表示和一个融合了产品属性信息的文本特征表示,然后融合和用于情感分类。此类模型可以认为是更有效地建模了单个属性对评论文本情感的影响,其出发点是:用户和产品属性信息对评论文本的影响本质上是不同的,应该分开集成。对现有的评论分析模型而言,存在以下两个方面的缺陷:(1)三种评论文本表示、和可以看成从三个不同的角度对评论文本的描述,包含的信息是互补的。然而,现有模型没有有效地整合这三种文本表示,从而未能同时利用两种属性对文本情感的共同影响以及每种属性的单独影响进行综合评价。(2)不能很好地用于现实中常见的某一属性缺失的评论文本。例如,当一个网站允许用户匿名评论的时候或者因为用户隐私的问题,用户属性信息就无法获得。
技术实现思路
鉴于上述状况,有必要解决现有的情感分析模型中,由于没有整合三种文本表示,从而未能同时利用两种属性对文本情感的共同影响以及每种属性的单独影响进行综合评价,导致影响评论情感分析质量的问题。本专利技术实施例提供了一种基于知识互蒸馏的评论情感分析方法,其中,所述方法包括如下步骤:步骤一:从训练数据集中确定一当前训练实例,基于第一分类器计算得到第一情感预测结果,其中所述第一分类器以带有用户属性以及产品属性的评论文本作为输入,其中所述用户属性表示发表评论文本所对应的不同用户,所述产品属性表示评论文本中的评论对象所指向的不同产品;步骤二:在忽略所述当前训练实例的产品属性的情况下,基于第二分类器计算得到第二情感预测结果,以及在忽略所述当前训练实例的用户属性的情况下,基于第三分类器计算得到第三情感预测结果,其中所述第二分类器以仅有用户属性的评论文本作为输入,所述第三分类器以仅有产品属性的评论文本作为输入;步骤三:根据所述第一情感预测结果、所述第二情感预测结果、所述第三情感预测结果以及真实类别标记,分别计算三个分类器各自对应的总体代价函数并对各所述总体代价函数进行最小化处理,以对各分类器进行参数迭代更新实现最终收敛,其中所述真实类别标记为训练数据集中人工标注的情感类别,以用作分类器的训练目标之一,所述第一分类器用于带有用户和产品两种属性的评论情感分析,所述第二分类器用于仅有用户属性的评论情感分析,所述第三分类器用于仅有产品属性的评论情感分析。所述基于知识互蒸馏的评论情感分析方法,其中,在所述步骤一中,所述当前训练实例表述为:表示当前训练实例,表示当前训练实例的评论文本,表示当前训练实例的用户属性,表示当前训练实例的产品属性。所述基于知识互蒸馏的评论情感分析方法,其中,基于第一分类器计算得到当前训练实例对应的第一情感预测结果表示为:其中,为融合了用户和产品属性的评论文本的特征表示,为第一分类器中分类层的参数,softmax为用于输出分类概率的归一化函数,为基于第一分类器计算得到的当前训练实例对应的第一情感预测结果;第二分类器的输入为仅带有用户属性的评论文本,对应的第二情感预测结果为;第三分类器的输入为仅带有产品属性的评论文本,对应的第三情感预测结果为;其中,和均为占位符,分别用于表示缺失的产品属性和用户属性。所述基于知识互蒸馏的评论情感分析方法,其中,在所述步骤三中,所述第一分类器对应的总体代价函数的计算方法包括如下步骤:根据所述第一情感预测结果计算得到第一基础代价函数,并根据所述第一基础代价函数以及第一额外代价函数计算得到与所述第一分类器对应的总体代价函数;所述第一基础代价函数表示为:其中,为所述第一基础代价函数,为第一分类器的参数集,表示真实类别标记的第个分量,表示第一情感预测结果的第个分量,指整个训练数据集,对应的真实类别标记为,为一个M维的one-hot编码向量,表示情感类别的数量;所述第一额外代价函数表示为:其中,为第一额外代价函数,以及均指KL距离,用于衡量第一分类器与第二分类器的情感预测结果之间的匹配程度,用于衡量第一分类器与第三分类器的情感预测结果之间的匹配程度,表示第二情感预测结果的第个分量,表示第三情感预测结果的第个分量;所述第一分类器对应的总体代价函数表示为:其中,为第一分类器对应的总体代价函数,表示第一额外代价函数占的比重,即第二分类器以及第三分类器提供的情感预测结果在第一分类器对应的总体代价函数中所占的比重。所述基于知识互蒸馏的评论情感分析方法,其中,在所述步骤三中,所述第二分类器对应的总体代价函数的计算方法包括如下步骤:根据第二情感预测结果计算得到第二基础代价函数,并根据所述第二基础代价函数以及第二额外代价函数计算得到与所述第二分类器对应的总体代价函数;所述第二基础代价函数表示为:其中,为所述第二基础代价函数,是第二分类器的参数集,表示真实类别标记的第个分量,表示第二情感预测结果的第个分量,指代整个训练数据集,对应的真实类别标记为,为一个M维的one-hot编码向量,M表示情感类别的数量;所述第二额外代价函数表示为:其中,为第二额外代价函数,以及均指KL距离,用于衡量第二分类器与第一分类器的情感预测结果之间的匹配程度,用于衡量第二分类器与第三分类器的情感预测结果之间的匹配程度。所述基于知识互蒸馏的评论情感分析方法,其中,在所述步骤三中,所述第二分类器对应的总体代价函数表示为:其中,为第二分类器对应的总体代价函数,为第二分类器的参数集,表示第二额外代价函数占的比重,即第一分类器以及第三分类器提供的情感预测结果在第二分类器对应的总体代价函数中所占的比重。...

【技术保护点】
1.一种基于知识互蒸馏的评论情感分析方法,其特征在于,所述方法包括如下步骤:/n步骤一:从训练数据集中确定一当前训练实例,基于第一分类器计算得到第一情感预测结果,其中所述第一分类器以带有用户属性以及产品属性的评论文本作为输入,其中所述用户属性表示发表评论文本所对应的不同用户,所述产品属性表示评论文本中的评论对象所指向的不同产品;/n步骤二:在忽略所述当前训练实例的产品属性的情况下,基于第二分类器计算得到第二情感预测结果,以及在忽略所述当前训练实例的用户属性的情况下,基于第三分类器计算得到第三情感预测结果,其中所述第二分类器以仅有用户属性的评论文本作为输入,所述第三分类器以仅有产品属性的评论文本作为输入;/n步骤三:根据所述第一情感预测结果、所述第二情感预测结果、所述第三情感预测结果以及真实类别标记,分别计算三个分类器各自对应的总体代价函数并对各所述总体代价函数进行最小化处理,以对各分类器进行参数迭代更新实现最终收敛,其中所述真实类别标记为训练数据集中人工标注的情感类别,以用作分类器的训练目标之一,所述第一分类器用于带有用户和产品两种属性的评论情感分析,所述第二分类器用于仅有用户属性的评论情感分析,所述第三分类器用于仅有产品属性的评论情感分析。/n...

【技术特征摘要】
1.一种基于知识互蒸馏的评论情感分析方法,其特征在于,所述方法包括如下步骤:
步骤一:从训练数据集中确定一当前训练实例,基于第一分类器计算得到第一情感预测结果,其中所述第一分类器以带有用户属性以及产品属性的评论文本作为输入,其中所述用户属性表示发表评论文本所对应的不同用户,所述产品属性表示评论文本中的评论对象所指向的不同产品;
步骤二:在忽略所述当前训练实例的产品属性的情况下,基于第二分类器计算得到第二情感预测结果,以及在忽略所述当前训练实例的用户属性的情况下,基于第三分类器计算得到第三情感预测结果,其中所述第二分类器以仅有用户属性的评论文本作为输入,所述第三分类器以仅有产品属性的评论文本作为输入;
步骤三:根据所述第一情感预测结果、所述第二情感预测结果、所述第三情感预测结果以及真实类别标记,分别计算三个分类器各自对应的总体代价函数并对各所述总体代价函数进行最小化处理,以对各分类器进行参数迭代更新实现最终收敛,其中所述真实类别标记为训练数据集中人工标注的情感类别,以用作分类器的训练目标之一,所述第一分类器用于带有用户和产品两种属性的评论情感分析,所述第二分类器用于仅有用户属性的评论情感分析,所述第三分类器用于仅有产品属性的评论情感分析。


2.根据权利要求1所述的基于知识互蒸馏的评论情感分析方法,其特征在于,在所述步骤一中,所述当前训练实例表述为:




表示当前训练实例,表示当前训练实例的评论文本,表示当前训练实例的用户属性,表示当前训练实例的产品属性。


3.根据权利要求2所述的基于知识互蒸馏的评论情感分析方法,其特征在于,基于第一分类器计算得到当前训练实例对应的第一情感预测结果表示为:



其中,为融合了用户和产品属性的评论文本的特征表示,为第一分类器中分类层的参数,softmax为用于输出分类概率的归一化函数,为基于第一分类器计算得到的当前训练实例对应的第一情感预测结果;
第二分类器的输入为仅带有用户属性的评论文本,对应的第二情感预测结果为;
第三分类器的输入为仅带有产品属性的评论文本,对应的第三情感预测结果为;
其中,和均为占位符,分别用于表示缺失的产品属性和用户属性。


4.根据权利要求3所述的基于知识互蒸馏的评论情感分析方法,其特征在于,在所述步骤三中,所述第一分类器对应的总体代价函数的计算方法包括如下步骤:
根据所述第一情感预测结果计算得到第一基础代价函数,并根据所述第一基础代价函数以及第一额外代价函数计算得到与所述第一分类器对应的总体代价函数;
所述第一基础代价函数表示为:



其中,为所述第一基础代价函数,为第一分类器的参数集,表示真实类别标记的第个分量,表示第一情感预测结果的第个分量,指整个训练数据集,对应的真实类别标记为,为一个M维的one-hot编码向量,表示情感类别的数量;
所述第一额外代价函数表示为:









其中,为第一额外代价函数,以及均指KL距离,用于衡量第一分类器与第二分类器的情感预测结果之间的匹配程度,用于衡量第一分类器与第三分类器的情感预测结果之间的匹配程度,表示第二情感预测结果的第个分量,表示第三情感预测结果的第个分量;
所述第一分类器对应的总体代价函数表示为:



其中,为第一分类器对应的总体代价函数,表示第一额外代价函数占的比重,即第二分类器以及第三分类器提供的情感预测结果在第一分类器对应的总体代价函数中所占的比重。


5.根据权利要求3所述的基于知识互蒸馏的评论情感分析方法,其特征在于,在所述步骤三中,所述第二分类器对应的总体代价函数的计算方法包括如下步骤:
根据第二情感预测结果计算得到第二基础代价函数,并根据所述第二基础代价函数以及第二额外代价函数计算得到与所述第二分类器对应的总体代价函数;
所述第二基础代价函数表示为:



其中,为所述第二基础代...

【专利技术属性】
技术研发人员:邬昌兴曹柳文
申请(专利权)人:华东交通大学
类型:发明
国别省市:江西;36

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1