【技术实现步骤摘要】
一种文本共情预测模型及方法
[0001]本专利技术涉及自然语言处理领域,尤其涉及一种文本共情预测模型及方法。
技术介绍
[0002]共情(同理心)作为情感的重要组成部分,反应了人们面对他人的遭遇或目睹他人的境况时所产生的对应的情感。共情可以反映人们对于他人遭遇所产生的情感及反馈,且共情分析这一领域也与人机交互,情感分析等领域息息相关。因而识别文本内所蕴含的共情因素是非常必要的,具有较强的研究价值。
[0003]但基于文本的共情数据集的样本量都过小。目前公认的开源文本共情数据集均只包含一千多条数据,并且现有主流共情预测方法均是单独在共情数据集上进行共情预测。显然,当数据量不足时,所训练出的模型的泛化能力就会比较差,且其预测精度也不会太高。与之形成鲜明对比的是,一些其他的情感分析任务拥有非常充足的训练数据。以情感极性分类这一任务为例,目前该任务对应非常多的开源数据集,这些数据集包含数万乃至数十万训练样本。因此,因开源文本共情数据集数据量小,导致文本处理中共情预测的准确性差是需要解决的问题。
[0004]有鉴于此, ...
【技术保护点】
【技术特征摘要】
1.一种文本共情预测模型,其特征在于,包括:共情私有特征编码器、极性私有特征编码器、公共特征编码器、共情公私有特征融合模块、极性公私有特征融合模块、共情预测器和极性分类器;其中,所述共情私有特征编码器的输入为共情数据集中的共情数据,能对输入的所述共情数据的私有特征进行编码,得到共情私有特征;所述极性私有特征编码器的输入为极性数据集中的极性数据,能对输入的所述极性数据的私有特征进行编码,得到极性私有特征;所述公共特征编码器分别接收所述共情数据集中的共情数据与所述极性数据集中的极性数据,能对所述共情数据的公有特征进行编码,得到共情公有特征,以及对所述极性数据的公有特征进行编码,得到极性公有特征;所述共情公私有特征融合模块,分别与所述共情私有特征编码器的输出端和公共特征编码器的输出端连接,能将所述共情私有特征编码器输出的共情私有特征和所述公共特征编码器输出的共情公有特征加权融合为最终的共情预测特征表达;所述极性公私有特征融合模块,分别与所述极性私有特征编码器的输出端和公共特征编码器的输出端连接,能将所述极性私有特征编码器输出的极性私有特征和所述公共特征编码器输出的极性公有特征加权融合为最终的极性分类特征表达;所述共情预测器,与所述共情公私有特征融合模块的输出端连接,能对最终的共情预测特征表达进行预测得出对应的共情标签;所述极性分类器,与所述极性公私有特征融合模块的输出端连接,能对最终的极性分类特征表达进行预测得出对应的极性标签。2.根据权利要求1所述的基于文本情感分类辅助的文本共情预测模型,其特征在于,所述共情私有特征编码器还输入极性数据集中的极性数据,能对输入的所述极性数据的私有特征进行编码,得到共情极性私有特征;所述极性私有特征编码器还输入共情数据集中的共情数据,能对输入的所述共情数据的私有特征进行编码,得到极性共情私有特征;还包括:领域二分类器,该领域二分类器的输入端分别与所述共情私有特征编码器、极性私有特征编码器和公共特征编码器的输出端连接,能以对抗分类损失方式对公共特征编码器输出的公共特征编码进行二分类处理;和/或,共情铰链损失模块与极性铰链损失模块;其中,所述共情铰链损失模块与所述共情预测器的输出端连接,能在正确拼接结果对应的共情预测结果L
em
与错误拼接结果对应的共情预测结果L
em
’
之间的差值小于预设差值时进行共情预测,所述正确拼接结果指共情私有特征与共情公有特征的拼接结果,所述错误拼接结果指极性私有特征与共情私有特征的拼接结果;所述极性铰链损失模块与所述极性分类器的输出端连接,能在正确拼接结果对应的极性预测结果L
em
与错误拼接结果对应的极性预测结果L
em
’
之间的差值小于预设差值时进行极性预测,所述正确拼接结果指极性私有特征与极性公有特征的拼接结果,所述错误拼接结果指共情私有特征与极性私有特征的拼接结果。3.根据权利要求2或3所述的基于文本情感分类辅助的文本共情预测模型,其特征在于,
所述极性私有特征编码器采用Bi
‑
LSTM类型或BERT类型的特征编码器;所述公共特征编码器采用Bi
‑
LSTM类型或BERT类型的特征编码器;所述共情公私有特征融合模块与极性公私有特征融合模块均采用注意力网络模块;所述共情预测器采用全连接网络;所述极性分类器采用全连接网络;所述领域二分类器采用全连接网络。4.根据权利要求1或2所述的基于文本情感分类辅助的文本共情预测模型,其特征在于,所述共情私有特征编码器采用Bi
‑
LSTM类型或BERT类型的特征编码器;所述极性私有特征编码器采用Bi
‑
LSTM类型或BERT类型的特征编码器;所述公共特征编码器采用Bi
‑
LSTM类型或BERT类型的特征编码器;所述共情公私有特征融合模块与极性公私有特征融合模块均采用注意力网络模块;所述共情预测器采用全连接网络;所述极性分类器采用全连接网络。5.一种文本共情预测方法,其特征在于,采用权利要求1至4任一项所述的基于文本情感分类辅助的文本共情预测模型,包括:步骤1,对输入的共情数据集中的共情数据的私有特征进行编码得到共情私有特征,以及对输入的极性数据集中的极性数据的私有特征进行编码得到极性私有特征;对输入的共情数据集中的共情数据的公有特征进行编码得到共情公有特征,以及对输入的极性数据集中的极性数据的公有特征进行编码得到极性公有特征;步骤2,对所述步骤1得到的共情私有特征和共情公有特征进行加权融合成最终的共情预测特征表达;以及对所述步骤1得到的极性私有特征和极性公有特征进行加权融合成最终的极性预测特征表达;步骤3,对所述步骤2得到的最终的共情预测特征表达进行共情预测得出作为预测结果的对应的共情标签;以及对最终的极性分类特征表达进行极性分类得出作为预测结果的对应的极性标签。6.根据权利要求5所述的基于文本情感分类辅助的文本共情预测方法,其特征在于,所述步骤2中,加权融合得到的最终的共情预测特征表达f
em
与最终的极性分类特征表达f
po
分别为:别为:上述式(1)、(2)中,q为q
k
*U(S
em
),其中q
k
为超参数向量,其维度为R
1*d
,q
k
为超参数向量,通过随机初始化得到初始值Q;T为转置矩阵,即U(s
em
)
T
为U(s
em
)的转置矩阵;d为特征向量的维度;U(s
em
)为共情私有特征e
em
(s
em
)与共情公共特征e
c
(s
em
)的拼接结果,U(s
em
)∈R
2*d
;s
e...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。