【技术实现步骤摘要】
一种基于知识引导的方面级情感分析模型训练方法
本专利技术属于细粒度情感分析
,具体涉及一种基于知识引导的方面级情感分析模型训练方法。
技术介绍
随着深度学习的提出和快速发展,基于深度学习的方面级情感分析模型训练技术已经取得阶段性的进展。然而,由于方面级情感分析模型训练数据标注困难,目前的方面级情感分析数据集普遍存在样本数量不足的问题,因此方面级情感分析模型训练仍然面临巨大挑战。目前,业界主要使用知识迁移训练方法来解决此类问题,具体而言,此类训练方法首先在样本数量充足的句子级情感分析数据集(预训练数据集)上进行预训练,得到学习到丰富语义知识的预训练模型;然后在样本数量较少的方面级情感分析数据集(目标任务数据集)上对预训练模型进行微调,将预训练模型中的语义知识迁移到目标任务模型,得到最终的方面级情感分析模型。这类训练方法可以在一定程度上缓解训练样本不足的问题,但是难以取得理想的训练效果。因为预训练数据集和目标任务数据集之间往往存在着巨大的领域差异,直接在目标任务数据集上对预训练模型进行微调,会造成预训练得到的语义知识被灾难 ...
【技术保护点】
1.一种基于知识引导的方面级情感分析模型训练方法,其特征在于,包括如下步骤:/n(1)在样本数量充足的句子级情感分析数据集上对方面级情感分析模型进行预训练,得到方面级情感分析预训练模型M
【技术特征摘要】
1.一种基于知识引导的方面级情感分析模型训练方法,其特征在于,包括如下步骤:
(1)在样本数量充足的句子级情感分析数据集上对方面级情感分析模型进行预训练,得到方面级情感分析预训练模型M1,该模型在句子级情感分析数据集中学习得到丰富的语义知识;
(2)使用基于知识引导的训练策略,在方面级情感分析数据集上对步骤(1)中获得的预训练模型M1进行再次训练,得到方面级情感分析预训练模型M2;具体而言,知识引导策略中引入了一个导航者模型和一个学习者模型,其中导航者模型学习速率快,学习者模型学习速率慢,通过导航者模型引导学习者模型的训练更新,使学习者模型在学习到目标任务数据集领域知识的同时,能够保持先前学习到的预训练数据集领域知识,最终在知识引导损失函数的约束下,学习得到领域不变的知识,训练得到的学习者模型即为预训练模型M2;
(3)最后在方面级情感分析数据集上对步骤(2)中训练得到的模型M2进行微调,将学习得到的领域不变知识迁移至方面级情感分析模型中,从而得到最终的高性能方面级情感分析模型Mfinal。
2.如权利要求1所述的一种基于知识引导的方面级情感分析模型训练方法,其特征在于:所述步骤(1)中在句子级情感分析数据集上训练方面级情感分析预训练模型的具体实施方式如下,
11)使用基于语法规则的方面词提取方法,对句子级情感分析数据集中样本进行方面词提取,获得伪方面词,即将句子级情感分析数据集转换成伪方面级情感分析数据集;
12)选用任一方面级情感分析模型的网络作为预训练网络,并将预训练网络中位置信息处理模块去除,如果预训练网络本身没有这一模块,则不用去除;
13)将伪方面级情感分析数据集中的文本输入到预训练网络,训练得到方面级情感分析预训练模型M1。
3.如权利要求1所述的一种基于知识引导的方面级情感分析模型训练方法,其特征在于:所述步骤(2)中使用基于知识引导的训练策略对方面级情感分析预训练模型M1进行再次训练的具体实施方式如下,
21)分别构造一个导航者模型和一个学习者模型,二者具有相同的网络结构,对预训练模型M1网络中...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。