【技术实现步骤摘要】
文本匹配方法、装置、电子设备及计算机可读存储介质
[0001]本申请实施例涉及计算机
,具体涉及一种文本匹配方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]随着信息量的提升,文本匹配的任务越来越多,通过文本的快速匹配可实现对信息的快速定位或者查找,例如,通过与输入的查询文本的匹配,可快速定位出查询文本所针对的查询内容。
[0003]目前,主要通过基于规则与字符串匹配的方法,或者基于文本编码结果的相似度来实现文本的匹配,但是,文本匹配的效率和合理性有点提升。
技术实现思路
[0004]本申请实施例提供一种文本匹配方法、装置、电子设备及计算机可读存储介质,可以提升文本匹配的效率和合理性。
[0005]第一方面,本申请实施例提供了一种文本匹配方法,包括:
[0006]将待匹配文本输入离散编码模型进行二值化离散编码,得到二值化离散编码结果;
[0007]确定匹配对象文本对应的二值化离散预编码结果,所述二值化离散预编码结果是根据所述离散编码模型对所述匹配对象文本进行编码后得到;
[0008]获取所述二值化离散编码结果与所述二值化离散预编码结果的维度离散对比结果,其中,所述维度离散对比结果描述所述二值化离散编码结果与所述二值化离散预编码结果在对应维度编码表示的差异;
[0009]根据所述维度离散对比结果,从所述匹配对象文本中确定与所述待匹配文本匹配的目标匹配对象文本;
[0010]其中,所述离散编码模型是根据样本文本的样本二值化离散编 ...
【技术保护点】
【技术特征摘要】
1.一种文本匹配方法,其特征在于,包括:将待匹配文本输入离散编码模型进行二值化离散编码,得到二值化离散编码结果;确定匹配对象文本对应的二值化离散预编码结果,所述二值化离散预编码结果是根据所述离散编码模型对所述匹配对象文本进行编码后得到;获取所述二值化离散编码结果与所述二值化离散预编码结果的维度离散对比结果,其中,所述维度离散对比结果描述所述二值化离散编码结果与所述二值化离散预编码结果在对应维度编码表示的差异;根据所述维度离散对比结果,从所述匹配对象文本中确定与所述待匹配文本匹配的目标匹配对象文本;其中,所述离散编码模型是根据样本文本的样本二值化离散编码结果以及不同所述样本文本之间的偏序关系进行训练后得到,所述样本二值化离散编码结果根据对所述样本文本的文本编码结果进行二值化离散后得到,所述文本编码结果根据对所述样本文本进行文本编码得到。2.根据权利要求1所述的方法,其特征在于,所述离散编码模型包括文本编码模块和哈希编码模块,所述将待匹配文本输入离散编码模型进行二值化离散编码,得到二值化离散编码结果,包括:将所述待匹配文本输入所述文本编码模块进行文本编码,得到文本编码结果;将所述文本编码结果输入所述哈希编码模块进行哈希编码,得到二值化离散编码结果。3.根据权利要求2所述的方法,其特征在于,所述哈希编码模块包括二值化层和编码逻辑层,所述将所述文本编码结果输入所述哈希编码模块进行哈希编码,得到二值化离散编码结果,包括:将所述文本编码结果输入所述二值化层进行二值化离散处理,得到二值化离散参考编码结果;将所述二值化离散参考编码结果输入所述编码逻辑层进行逻辑组合,得到二值化离散编码结果。4.根据权利要求2所述的方法,其特征在于,所述哈希编码模块包括全连接层和哈希映射层,所述将所述文本编码结果输入所述哈希编码模块进行哈希编码,得到二值化离散编码结果,包括:将所述文本编码结果输入所述全连接层进行隐式特征重组,得到重组编码结果;将所述重组编码结果输入所述哈希映射层进行二值化编码映射,得到二值化离散编码结果。5.根据权利要求2所述的方法,其特征在于,所述将所述待匹配文本输入所述文本编码模块进行文本编码,得到文本编码结果,包括:将所述待匹配文本输入所述文本编码模块进行文本编码,得到文本原始编码结果;确定所述待匹配文本所包含的实体以及所述实体的实体类型;获取所述实体类型所对应的实体类型编码结果;将所述实体类型编码结果融入到所述文本原始编码结果,得到文本编码结果。6.根据权利要求1所述的方法,其特征在于,所述获取所述二值化离散编码结果与所述
二值化离散预编码结果的维度离散对比结果,包括:计算所述二值化离散编码结果和所述二值化离散预编码结果在各个维度的二值化离散值的差值,得到维度离散差值;根据各个维度的维度离散差值,确定所述二值化离散编码结果和所述二值化离散预编码结果的维度离散对比结果。7.根据权利要求6所述的方法,其特征在于,所述根据所述维度离散对比结果,从所述匹配对象文本中确定与所述待匹配文本匹配的目标匹配对象文本,包括:将所述维度离散差值均大于或者等于零的维度离散对比结果作为目标维度离散对比结果;将所述目标维度离散对比结果对应的二值化离散预编码结果作为目标二值化离散预编码结果;将所述目标二值化离散预编码结果对应的匹配对象文本作为目标匹配对象文本。8.根据权利要求1所述的方法,其特征在于,所述将待匹配文本输入离散编码模型进行二值化离散编码,得到二值化离散编码结果之前,所述方法还包括:获取原始离散编码模型和样本节点集合,所述样本节点集合包括至少两个存在上下位关系的样本节点,每个样本节点对应至少两个同义的样本文本;从所述样本节点集合对应的样本文本中选取样本待匹配文本、所述样本待匹...
【专利技术属性】
技术研发人员:黄予,赵瑞辉,刘锦泰,刘亚飞,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。