【技术实现步骤摘要】
文本匹配方法和装置、存储介质及电子设备
[0001]本专利技术涉及计算机领域,具体而言,涉及一种文本匹配方法和装置、存储介质及电子设备。
技术介绍
[0002]随着网络技术的发展,越来越多的网络平台提供文本检索功能,通过在搜索框中输入检索文本,从而在平台数据库中查找到与检索文本相似的检索结果。例如,在新闻系统中通过关键字进行检索,从而检索到与关键字的匹配的新闻内容,以呈现与关键字相关的新闻内容。还有,在电商购物平台中,通过检索商品关键文本,从而搜索到与商品关键文本相关的商品。
[0003]而当前在文本检索匹配的过程中,往往是将平台中内容,无论是与文章类似的长文本,还是与商品标题类似的短文本,均是将文本压缩至几个关键词,从而利用关键词的编码的权重得到用于代表文本的短编码。由于编码位数少且是利用关键词编码代替文本,使得短编码中既不包含文本的语义特征,编码的准确性还低,由此导致基于编码实现的文本匹配的准确性较低。
[0004]针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
[0005]本 ...
【技术保护点】
【技术特征摘要】
1.一种文本匹配方法,其特征在于,包括:在获取到检索文本的情况下,将所述检索文本输入预训练语言模型,得到检索文本向量,其中,所述预训练语言模型用于提取输入文本的语义特征以得到与所述输入文本对应的文本向量;计算所述检索文本向量与列式数据库中存储的多个候选文本向量之间的相似度,根据所述相似度从所述多个候选文本向量中确定目标文本向量,其中,所述列式数据库中存储有多个候选文本以及所述多个候选文本各自对应的候选文本向量,所述候选文本向量为将所述候选文本输入所述预训练语言模型得到的文本向量,所述目标文本向量为与所述检索文本向量的相似度大于预设相似阈值的所述候选文本向量;将所述目标文本向量对应的目标文本确定为与所述检索文本匹配的文本。2.根据权利要求1所述的方法,其特征在于,在获取检索文本之前,还包括:在接收到所述候选文本的情况下,将所述候选文本输入所述预训练语言模型,得到所述预训练语言模型输出的所述候选文本向量;获取所述候选文本的文本索引,其中,所述文本索引用于标识所述候选文本;将所述候选文本的文本索引和所述候选文本向量对应存入所述列式数据库中。3.根据权利要求2所述的方法,其特征在于,所述将所述候选文本的文本索引和所述候选文本向量对应存入所述列式数据库中,包括:以所述候选文本的文本索引作为存储标识、所述候选文本向量作为存储内容,将所述候选文本的文本索引和所述候选文本向量存入所述列式数据库。4.根据权利要求1
‑
3任一项所述的方法,其特征在于,所述将所述目标文本向量对应的目标文本确定为与所述检索文本匹配的文本,包括:在文本数据库中,查找与所述目标文本向量对应的目标文本索引对应的文本,其中,所述文本数据库中存储存在关联关系的所述文本索引和所述候选文本;将与所述目标文本索引对应的候选文本确定为所述目标文本。5.根据权利要求1
‑
3任一项所述的方法,其特征在于,所述计算所述检索文本向量与列式数据库中存储的多个候选文本向量之间的相似度,根据所述相似度从所述多个候选文本向量中确定目标文本向量,还包括:获取所述列式数据库的存储类型,其中,所述存储类型用于指示所述列式数据库所在存储介质的类型;按照与所述列式数据库的存储类型匹配的向量索引方式,在所述列式数据库中查找与所述检索文本向量在相似度上匹配的目标候选文本向量;计算所述检索文本向量与所述目标候选文本向量之间的候选...
【专利技术属性】
技术研发人员:刘建国,王迪,李昱涧,
申请(专利权)人:海尔智家股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。