【技术实现步骤摘要】
文本匹配方法和装置、电子设备、存储介质
[0001]本申请涉及人工智能
,尤其涉及一种文本匹配方法和装置、电子设备、存储介质。
技术介绍
[0002]在文本匹配中,往往需要文本对是否匹配。例如在保险理赔中,需要识别多个疾病名称是否匹配,以便根据匹配结果确定是否为同一疾病的理赔。当前一般使用深度神经网络对文本进行向量表示,从而输出匹配结果,例如使用BERT之类的大规模预训练语言模型作为双塔式模型进行文本匹配。但双塔式模型在进行文本匹配过程中,常常存在匹配准确率较低的情况。因此,如何提供一种文本匹配方法,能够提高文本匹配的准确率,成为了亟待解决的技术问题。
技术实现思路
[0003]本申请实施例的主要目的在于提出文本匹配方法和装置、电子设备、存储介质,能够提高文本匹配的准确率。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种文本匹配方法,所述方法包括:
[0005]获取无标注的第一样本文本对;所述第一样本文本对包括第一样本文本和第二样本文本;
[0006]将所述第一样本 ...
【技术保护点】
【技术特征摘要】
1.一种文本匹配方法,其特征在于,所述方法包括:获取无标注的第一样本文本对;所述第一样本文本对包括第一样本文本和第二样本文本;将所述第一样本文本和所述第二样本文本输入至预设的原始双塔式模型进行第一文本标注,得到第一样本标签;其中,所述第一样本标签用于表征所述第一样本文本和所述第二样本文本之间相匹配或者不相匹配;将所述第一样本文本和所述第二样本文本输入至预设的原始交互式模型进行第一文本匹配预测,得到第一样本预测结果;其中,所述第一样本预测结果用于表征所述第一样本文本和所述第二样本文本之间相匹配或者不相匹配;根据所述第一样本标签和所述第一样本预测结果进行损失计算,得到第一损失数据,根据所述第一损失数据对所述原始交互式模型进行参数调整,得到目标交互式模型;获取无标注的第二样本文本对;所述第二样本文本对包括第三样本文本和第四样本文本;将所述第三样本文本和所述第四样本文本输入至所述目标交互式模型进行第二文本标注,得到第二样本标签;其中,所述第二样本标签用于表征所述第三样本文本和所述第四样本文本之间相匹配或者不相匹配;将所述第三样本文本和所述第四样本文本输入至所述原始双塔式模型进行第二文本匹配预测,得到第二样本预测结果;其中,所述第二样本预测结果用于表征所述第三样本文本和所述第四样本文本之间相匹配或者不相匹配;根据所述第二样本标签和所述第二样本预测结果进行损失计算,得到第二损失数据,根据所述第二损失数据对所述原始双塔式模型进行参数调整,得到目标双塔式模型;将无标注的目标文本对输入至所述目标双塔式模型进行文本匹配预测,得到匹配预测结果;其中,所述目标文本对包括第一文本和第二文本,所述匹配预测结果用于表征所述第一文本与所述第二文本之间相匹配或者不相匹配。2.根据权利要求1所述的方法,其特征在于,在将所述第一样本文本和所述第二样本文本输入至预设的原始双塔式模型进行第一文本标注,得到第一样本标签之前,所述方法还包括:对所述第一样本文本进行文本增强,得到增强样本文本;将所述第一样本文本和所述增强样本文本输入至预设的第一语言模型进行样本学习,得到第一学习标签;其中,所述第一学习标签用于表征所述第一样本文本和所述增强样本文本之间相同或者不相同;根据所述第一学习标签和预设正标签进行损失计算,得到第三损失数据,根据所述第三损失数据对所述第一语言模型进行参数调整,得到第二语言模型;其中,所述正标签用于表征所述第一样本文本和所述增强样本文本之间相同;将所述第一样本文本和所述第二样本文本输入至所述第二语言模型进行样本学习,得到第二学习标签;其中,所述第二学习标签用于表征所述第一样本文本和所述第二样本文本之间相同或者不相同;根据所述第二学习标签和预设负标签进行损失计算,得到第四损失数据,根据所述第四损失数据对所述第二语言模型进行参数调整,得到所述原始双塔式模型;其中,所述预设
负标签用于表征所述第一样本文本和所述第二样本文本之间不相同。3.根据权利要求1所述的方法,其特征在于,所述目标双塔式模型包括第一语义模型、第二语义模型和分类器,所述将无标注的目标文本对输入至所述目标双塔式模型进行文本匹配预测,得到匹配预测结果,包括:通过所述第一语义模型对所述第一文本进行在线向量转换,得到第一语义向量;通过所述第二语义模型对所述第二文本进行离线向量转换,得到第二语义向量;通过所述分类器对所述第一语义向量与所述第二语义向量进行相似度计算,得到语义相似度;根据所述语义相似度得到所述匹配预测结果。4.根据权利要求3所述的方法,其特征在于,所述通过所述第一语义模型对所述第一文本进行在线向量转换,得到第一语义向量,包括:对所述第一文本进行词向量提取,得到词向量序...
【专利技术属性】
技术研发人员:黄海龙,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。