一种训练语义识别模型、查找语句的方法、装置及介质制造方法及图纸

技术编号:34331396 阅读:77 留言:0更新日期:2022-07-31 02:08
本申请实施例提供一种训练语义识别模型、查找语句的方法、装置及介质,该方法包括:获取原始样本数据,其中,所述原始样本数据包括多条原始训练语句;根据所述原始样本数据得到目标样本数据,其中,所述目标样本数据包括多条目标训练语句集合,每个目标训练语句集合包括一条原始训练语句和与所述原始训练语句语义相同且构造不同第一构造训练语句;至少根据所述目标样本数据对待训练的语义识别模型进行训练,获得目标语义识别模型。通过本申请的一些实施例能够使得到的目标语义识别模型更准确的识别待匹配语句的语义。确的识别待匹配语句的语义。确的识别待匹配语句的语义。

A method, device and medium for training semantic recognition model and finding sentences

【技术实现步骤摘要】
一种训练语义识别模型、查找语句的方法、装置及介质


[0001]本申请实施例涉及语义识别领域,具体涉及一种训练语义识别模型、查找语句的方法、装置及介质。

技术介绍

[0002]语义识别是自然语言处理领域的一个重要分支,其应用范围广并且是很多下游任务的基石。相关技术中,为了增加语义识别的准确度,通常使用数据增强的方法增加训练语句,但是由于增加的语句与原始样本相似度较高,从而忽略了对增加的语句的实际语义识别,降低了语义识别的准确率。
[0003]因此,如何提高语义识别准确率成为需要解决的问题。

技术实现思路

[0004]本申请实施例提供一种训练语义识别模型、查找语句的方法、装置及介质,通过本申请的一些实施例提供的训练方法能够使得到的目标语义识别模型通过语义来识别与待匹配语句匹配的目标语句。
[0005]第一方面,本申请实施例提供了一种训练语义识别模型的方法,所述训练方法包括:获取原始样本数据,其中,所述原始样本数据包括多条原始训练语句;根据所述原始样本数据得到目标样本数据,其中,所述目标样本数据包括多条目标训练语句集合本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种训练语义识别模型的方法,其特征在于,所述方法包括:获取原始样本数据,其中,所述原始样本数据包括多条原始训练语句;根据所述原始样本数据得到目标样本数据,其中,所述目标样本数据包括多条目标训练语句集合,每个目标训练语句集合包括一条原始训练语句和与所述原始训练语句语义相同且构造不同第一构造训练语句;至少根据所述目标样本数据对待训练的语义识别模型进行训练,获得目标语义识别模型。2.根据权利要求1所述的方法,其特征在于,所述第一构造训练语句为双重否定训练语句,所述双重否定训练语句是通过在所述原始训练语句中加入双重否定词得到的。3.根据权利要求1

2任一项所述的方法,其特征在于,所述每个目标训练语句集合还包括与所述原始训练语句语义相反的第二构造训练语句,以及与所述第二构造训练语句语义相同且构造不同的第三构造语句,其中,所述第三构造语句是通过在所述第二构造训练语句中添加双重否定词后得到的。4.根据权利要求3所述的方法,其特征在于,所述至少根据所述目标样本数据对待训练的语义识别模型进行训练,获得目标语义识别模型,包括:将所述目标样本数据输入到待训练的语义识别模型中;通过所述语义识别模型获取与所述目标训练语句集合对应的语义预测结果;根据目标损失函数和所述语义预测结果,获得目标损失值;通过所述目标损失值,调整所述待训练的语义识别模型中的参数;重复上述步骤,直至所述目标损失值满足预设要求,终止训练并且获得所述目标语义识别模型。5.根据权利要求4所述的方法,其特征在于,所述目标损失函数至少与相似度损失子函数相关;其中,所述通过所述语义识别模型获取与所述目标训练语句集合对应的语义预测结果,包括:获取针对所述原始训练语句的原始语句语义预测结果、针对所述第一构造训练语句的第一构造语句语义预测结果、针对所述第二构造训练语句的第二构造语句语义预测结果和针对所述第三构造训练语句的第三构造语句语义预测结果;所述根据目标损失函数和所述语义预测结果,获得目标损失值,包括:通过所述相似度损失子函数计算所述原始语句语义预测结果与所述第一构造语句语义预测结果、所述第二构造语句语义预测结果和所述第三构造语句语义预测结果之间的总边际损失值;将所述总边际损失值作为所述目标损失值。6.根据权利要求5所...

【专利技术属性】
技术研发人员:韩佳杜新凯吕超谷姗姗张晗史辉孙垚锋
申请(专利权)人:阳光保险集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1