【技术实现步骤摘要】
文本分类模型的训练方法及相关设备
本公开涉及计算机
,具体而言,涉及一种文本分类模型的训练方法及装置、电子设备和计算机可读存储介质。
技术介绍
评论过滤是新闻、社区类等应用中的一项功能,用户生成的评论、发言中,可能包含负面消极、甚至违反法律的信息,筛选出这些负面评论或者不良评论并将其删除是很重要的。相关技术中,通常采用文本分类模型来过滤评论。文本分类是自然语言处理中的基础任务,指的是给定一句话,根据其语义判断它的类别标签。典型的文本分类任务包括语言情感分析、舆情监测等。在评论过滤的场景中,文本分类模型用来判断一个评论是否是负面评论或者不良评论。相关技术中,一般采用人工标注的数据集来训练文本分类模型,然后利用训练好的文本分类模型来预测用户提交的评论是否是负面评论或者不良评论。但是,研究发现人工标注的数据集中,常常带有对某些少数群体的偏见与歧视,换言之,在数据集中某些群体更倾向于是某种标签。这种数据集中的歧视可能是人类社会中固有的偏见导致的,也可能反应了数据标注者在标注过程中的歧视性偏差。相关技术中的文本分 ...
【技术保护点】
1.一种文本分类模型的训练方法,其特征在于,包括:/n获取训练文本及其类别标签信息和群体标签信息;/n通过第一神经网络模型对所述训练文本进行处理,并根据所述训练文本的类别标签信息获得所述第一神经网络模型的初始网络参数;/n通过第二神经网络模型和包括所述初始网络参数的所述第一神经网络模型对所述训练文本进行处理,获得所述训练文本的第一预测群体信息;/n根据所述训练文本的群体标签信息及其第一预测群体信息对抗训练所述第一神经网络模型和所述第二神经网络模型,以使得所述第二神经网络模型识别出所述训练文本中的目标群体信息,并利用所述第一神经网络模型去除所述目标群体信息,确定所述第一神经网 ...
【技术特征摘要】
1.一种文本分类模型的训练方法,其特征在于,包括:
获取训练文本及其类别标签信息和群体标签信息;
通过第一神经网络模型对所述训练文本进行处理,并根据所述训练文本的类别标签信息获得所述第一神经网络模型的初始网络参数;
通过第二神经网络模型和包括所述初始网络参数的所述第一神经网络模型对所述训练文本进行处理,获得所述训练文本的第一预测群体信息;
根据所述训练文本的群体标签信息及其第一预测群体信息对抗训练所述第一神经网络模型和所述第二神经网络模型,以使得所述第二神经网络模型识别出所述训练文本中的目标群体信息,并利用所述第一神经网络模型去除所述目标群体信息,确定所述第一神经网络模型的目标网络参数,将包括所述目标网络参数的第一神经网络模型确定为所述文本分类模型。
2.根据权利要求1所述的方法,其特征在于,通过第二神经网络模型和包括所述初始网络参数的所述第一神经网络模型对所述训练文本进行处理,获得所述训练文本的第一预测群体信息,包括:
通过包括所述初始网络参数的第一神经网络模型对所述训练文本进行处理,获得所述训练文本的第一特征编码向量;
通过第二神经网络模型对所述训练文本的第一特征编码向量进行处理,获得所述训练文本的第一预测群体信息。
3.根据权利要求2所述的方法,其特征在于,根据所述训练文本的群体标签信息及其第一预测群体信息训练所述第二神经网络模型,包括:
根据所述训练文本的群体标签信息及其第一预测群体信息获得第一损失函数;
根据所述第一损失函数训练所述第二神经网络模型,获得所述第二神经网络模型的目标网络参数。
4.根据权利要求3所述的方法,其特征在于,根据所述训练文本的群体标签信息训练所述第一神经网络模型,还包括:
利用所述第一神经网络模型对所述训练文本进行处理,获得所述训练文本的第二特征编码向量;
通过包括所述目标网络参数的第二神经网络模型对所述训练文本的第二特征编码向量进行处理,获得所述训练文本的第二预测群体信息;
根据所述训练文本的群体标签信息及其第二预测群体信息获得第二损失函数,所述第一损失函数和所述第二损失函数互逆;
根据所述第二损失函数训练所述第一神经网络模型,调整所述初始网络参数,获得所述第一神经网络模型的目标网络参数。
5.根据权利要求1所述的方法,其特征在于,通过第一神经网络模型对所述训练文本进行处理,并根据所述训练文本的类别标签信息获得所述第一神经网络模型的初始网络参数,包括:
通过所述第一神经网络模型对所述训练文本进行处理,获得所述训练文本的预测标签信息;
根据所述训练文本的类别标签信息及其预测标签信息获得第三损失...
【专利技术属性】
技术研发人员:张冠华,白冰,白琨,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。