【技术实现步骤摘要】
情感原因对抽取模型的训练方法、装置、设备及介质
[0001]本专利技术涉及神经网络模型领域,尤其涉及一种情感原因对抽取模型的训练方法、装置、设备及介质。
技术介绍
[0002]情感分类任务则主要是对文本进行情感分类,但是随着自然语言处理技术的不断发展,仅仅是对情感进行分类的任务已经不能够满足现实生活中的需求,所以研究者们将目光转向到研究情感背后的原因。
[0003]因此,如何确定文本中的情感词/句和指向情感词/句的原因词/句,为当下的主要研究方向之一。
技术实现思路
[0004]有鉴于此,本专利技术提供一种情感原因对抽取模型的训练方法、装置、设备及介质,用以确定文本中的情感子句和指向情感子句的原因子句。
[0005]第一方面,本专利技术实施例提供一种情感原因对抽取模型的训练方法,包括:将文档样本输入至所述第一编码网络,得到文档样本中每个子句的情感子句表示和每个子句的原因子句表示;基于第二编码网络,根据每个所述子句的情感子句表示和原因子句表示,得到每个所述子句的第一情感子句预测结果和第一原因子句 ...
【技术保护点】
【技术特征摘要】
1.一种情感原因对抽取模型的训练方法,其特征在于,所述情感原因对抽取模型包括第一编码网络、第二编码网络、图注意力网络、配对网络及预测网络,所述方法包括:将文档样本输入至所述第一编码网络,得到文档样本中每个子句的情感子句表示和每个子句的原因子句表示;基于第二编码网络,根据每个所述子句的情感子句表示和原因子句表示,得到每个所述子句的第一情感子句预测结果和第一原因子句预测结果,并得到每个所述子句的情感输出和每个所述子句的原因输出,其中,所述每个所述子句的情感输出通过子句的第一原因子句预测结果和情感子句表示得到,所述每个所述子句的原因输出通过子句的第一情感子句预测结果和原因子句表示得到;将每个所述子句的情感输出和原因输出输入至图注意力网络,得到每个所述子句更新后的情感输出和更新后的原因输出,其中,所述图注意力网络用于根据每个所述子句的情感输出和原因输出,更新每个所述子句的情感输出和原因输出;基于所述配对网络,根据每个所述子句更新后的情感输出得到每个所述子句的情感表示,及根据每个所述子句更新后的原因输出得到每个所述子句的原因表示,并将所有所述子句的情感表示和原因表示两两配对,得到情感原因对;将所有所述情感原因对输入至预测网络,得到情感原因对预测结果;根据第一预设算式,得到所述情感原因对预测结果对应的情感原因对预测损失值,并利用所述情感原因对预测损失值更新所述情感原因对抽取模型。2.根据权利要求1所述的方法,其特征在于,所述图注意力网络包含依次相连的预设数量层图注意力层,第一层图注意力层用于更新每个所述子句的情感输出和原因输出,图注意力网络的其余每层所述图注意力层均用于更新上一个图注意力层的情感输出和原因输出。3.根据权利要求1所述的方法,其特征在于,所述基于所述配对网络,根据每个所述子句更新后的情感输出得到每个所述子句的情感表示,及根据每个所述子句更新后的原因输出得到每个所述子句的原因表示,包括:将每个所述子句更新后的情感输出输入至所述配对网络的第二预设算式,得到情感表示,及将每个所述子句更新后的原因输出输入至所述配对网络的第三预设算式,得到原因表示;所述第二预设算式包括:式中,表示第i个子句的情感表示,σ表示relu函数,表示第i个子句更新后的情感输出,W
e
表示情感表示对应的可训练权重,b
e
表示情感表示对应的可训练偏差;所述第三预设算式包括:式中,表示第i个子句的原因表示,σ表示relu函数,表示第i个子句更新后的原因输出,W
c
表示原因表示对应的可训练权重,b
c
表示原因表示对应的可训练偏差。4.根据权利要求3所述的方法,其特征在于,所述将所有所述子句的情感表示和原因表示两两配对,得到情感原因对,包括:
基于双仿射机制,将每个所述子句的情感表示作为中心项,将每个所述子句的原因表示作为从属项,并基于配对网络中的预设算式集,将所有所述中心项和所有所述从属项两两配对,得到对应的情感原因对。5.根据权利要求1所述的方法,其特征在于,所述第一预设算式包括:式中,L
pair
表示情感原因对预测损失值,表示通过第p个子句的情感表示和第q个子句的原因表示所得到的情感原因对;当预测正确时Y
p,q
取1,否则取0。6.根据权利要求1所述的方法...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。