一种文本匹配的方法、装置、设备和可读存储介质制造方法及图纸

技术编号:32284648 阅读:20 留言:0更新日期:2022-02-12 19:52
本申请提供一种文本匹配的方法、装置、设备和可读存储介质,该方法通过获取待匹配文本和候选文本集合;将待匹配文本输入匹配模型,获得处理结果;根据处理结果从候选本文集合中确定与待匹配文本匹配的目标文本,其中,匹配模型是根据训练样本两次输入基础模型后得到的输出结果对基础模型训练后得到的,其中,一个样本一次输入基础模型对应的输出结果包括所述一个样本对应的打孔向量和一个样本中的两个文本的相似度。通过该方法可以提高文本匹配的准确性。配的准确性。配的准确性。

【技术实现步骤摘要】
一种文本匹配的方法、装置、设备和可读存储介质


[0001]本申请涉及文本关系匹配的领域,具体而言,涉及一种文本匹配的方法、装置、设备和可读存储介质。

技术介绍

[0002]目前大多数文本匹配主要常用的判别有语义逻辑度、语义关系推理、问答对等,比如搜索推荐的语义相关性、智能问答中的问题

问题、问题

答案匹配、知识图谱中的实体链接等。在文本匹配中用到的算法主要解决的都是基于词汇层面的匹配问题。
[0003]上述基于词汇重合度的匹配用到的算法有很大的局限性,在文本相似度匹配的过程中匹配到的结果不准确。
[0004]因此,如何提高文本匹配的准确性,成为亟需解决的技术问题。

技术实现思路

[0005]本申请实施例的目的在于提供一种文本匹配的方法,通过本申请的实施例的技术方案可以提高文本匹配的准确性。
[0006]第一方面,本申请实施例提供了一种文本匹配的方法,包括:获取待匹配文本和候选文本集合;将待匹配文本输入匹配模型,获得处理结果;根据处理结果从候选本文集合中确定与待匹配文本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本匹配的方法,其特征在于,包括:获取待匹配文本和候选文本集合;将所述待匹配文本输入匹配模型,获得处理结果;根据所述处理结果从所述候选本文集合中确定与所述待匹配文本匹配的目标文本,其中,所述匹配模型是根据训练样本两次输入基础模型后得到的输出结果对所述基础模型训练后得到的,其中,一个样本一次输入所述基础模型对应的输出结果包括所述一个样本对应的打孔向量和所述一个样本中的两个文本的相似度。2.根据权利要求1所述的方法,其特征在于,所述处理结果为所述待匹配文本和所述候选集合中的每一个候选文本的相似度,所述将所述待匹配文本输入匹配模型,包括:将所述待匹配文本和所述候选集合中的每一个候选文本输入所述匹配模型;所述根据所述处理结果从所述候选本文集合中确定与所述待匹配文本匹配的目标文本,包括:将所述待匹配文本和所述候选集合中的每一个候选文本的相似度的值进行排序;将相似度最大的值对应的候选文本确定为所述目标文本。3.根据权利要求1所述的方法,其特征在于,所述处理结果为所述待匹配文本的向量,所述根据所述处理结果从所述候选本文集合中确定与所述待匹配文本匹配的目标文本,包括:将所述待匹配文本的向量和所述候选集合中的每一个候选文本的向量进行余弦相似度的计算,得到M个余弦相似度,M为大于等于2的正整数;将所述M个余弦相似度中最大的余弦相似度的值对应的候选文本确定为所述目标文本。4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述获取待匹配文本和候选文本集合之前,所述方法还包括:获取系统日志里的文本;将所述文本进行人工标注相似文本;将所述人工标注相似文本中每两个所述相似文本利用提前准备好的模板进行拼接,构成训练样本;将所述训练样本两次输入基础模型后得到输出结果,并根据所述输出结果对所述基础模型训练后得到所述匹配模型,其中,一个样本一次输入所述基础模型对应的输出结果包括所述一个样本对应的打孔向量和所述一个样...

【专利技术属性】
技术研发人员:张晗杜新凯吕超谷姗姗韩佳孙垚锋
申请(专利权)人:阳光保险集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1