一种问句匹配的方法、装置、设备和存储介质制造方法及图纸

技术编号:31921904 阅读:16 留言:0更新日期:2022-01-15 13:05
本申请实施例提供了一种问句匹配的方法、装置、设备和存储介质,该方法包括:按照预设格式的模板文本将待匹配问句与候选问句集合中的每一个候选问句进行组合,得到候选问句集合中N个候选问句对应的N个组合文本,N为大于或等于2的正整数;将N个组合文本输入到预先训练好的文本匹配模型中,得到N个组合文本中每个组合文本对应的待匹配问句和候选问句的相似度,其中,文本匹配模型是通过预设格式样本训练得到的;根据N个组合文本对应的N个相似度,从N个候选问句中确定与待匹配问句匹配的目标问句。该方法在匹配的过程当中不需要引入大量的参数,所以在问句匹配的过程当中大大的提高了匹配效率。了匹配效率。了匹配效率。

【技术实现步骤摘要】
一种问句匹配的方法、装置、设备和存储介质


[0001]本申请涉及文本匹配领域,具体而言,涉及一种问句匹配的方法、装置、设备和存储介质。

技术介绍

[0002]预训练语言模型是自然语言处理的基础研究工作,其在文本分类、语义相似性、实体识别等各种任务场景得到广泛应用。目前应用于各种自然语言任务的模型是通过预训练和微调的方法形成的,即先在大量无标注语料上预训练一个语言模型,然后将模型增加一些模块如全连接层,放到任务上的标注数据进行微调。
[0003]可以看到,这种方式导致预训练阶段模型和下游任务微调阶段模型存在差距,对于下游任务模型,通常会引入额外的参数,在模型训练的过程中会带来很大麻烦。因此,在利用这类模型进行相似问句匹配的过程中会浪费大量的时间,导致我们在相似问句匹配过程中效率更低。
[0004]因此,问句匹配的效率低的问题亟待需要改进。

技术实现思路

[0005]本申请实施例的目的在于提供一种问句匹配的方法、装置、设备和存储介质,实现在问句匹配的过程中提升问句匹配的效率。
[0006]第一方面,本申请实施本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种问句匹配方法,其特征在于,包括:按照预设格式的模板文本将待匹配问句与候选问句集合中的每一个候选问句进行组合,得到所述候选问句集合中N个候选问句对应的N个组合文本,N为大于或等于2的正整数;将所述N个组合文本输入到预先训练好的文本匹配模型中,得到所述N个组合文本中每个组合文本对应的待匹配问句和候选问句的相似度,其中,所述文本匹配模型是通过预设格式的样本训练得到的;根据所述N个组合文本对应的N个相似度,从所述N个候选问句中确定与所述待匹配问句匹配的目标问句。2.根据权利要求1所述的问句匹配方法,其特征在于,在所述按照预设格式的模板文本将待匹配问句与候选问句集合中的每一个候选问句进行组合之前,所述方法还包括:将知识库中与所述待匹配问句的相似问句利用服务器中的文本相似度算法进行筛选得到所述候选问句集合。3.根据权利要求2所述的问句匹配方法,其特征在于,所述将知识库中与所述待匹配问句的相似问句利用服务器中的文本相似度算法进行筛选得到所述候选问句集合,包括:所述将知识库中与所述待匹配问句的相似问句利用服务器中的文本相似度算法进行筛选得到初始候选问句集合;对所述初始候选问句集合中的问句进行预处理,得到所述候选问句集合。4.根据权利要求3所述的问句匹配方法,其特征在于,所述对所述初始候选问句集合中的问句进行预处理,得到所述候选问句集合,包括:对所述初始候选问句集合中的问句进行以下处理中的至少一种,得到所述候选问句集合:除噪、清洗和截断。5.根据权利要求1至4中任一项所述的问句匹配方法,其特征在于,所述根据所述N个组合文本对应的N个相似度,从所述N个候选问句中确定与所述待匹配问句匹配的目标问句,包括:根据所述N个组合文本中每对问句相似的概率确定所述N个组合文本中所述每对问句的相似度;将所述N个组合文本中所述每对问句的相似度最大的文...

【专利技术属性】
技术研发人员:张晗杜新凯吕超谷姗姗李文灏
申请(专利权)人:阳光保险集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1