召回确定方法、装置、设备及存储介质制造方法及图纸

技术编号:26689853 阅读:37 留言:0更新日期:2020-12-12 02:39
本发明专利技术公开了一种召回确定方法、装置、设备及存储介质,该方法包括:根据目标搜索词包括的目标字符以及预设的字符与字符编码的映射关系,确定目标搜索词对应的目标三维数组的下标集合,根据目标三维数组的下标集合以及预设的三维数组,确定目标三维数组的下标集合在三维数组中对应的各元素值,当目标三维数组的下标集合在预设的三维数组所对应的各元素值中,只要存在一个元素值,表示目标搜索词中对应的两个目标字符,在预设的词集合中的任意词中间隔对应的字符数均不会共同出现时,确定目标搜索词无法被召回。该召回确定方法效率较高,并且,内存开销较小。

【技术实现步骤摘要】
召回确定方法、装置、设备及存储介质
本专利技术实施例涉及搜索
,尤其涉及一种召回确定方法、装置、设备及存储介质。
技术介绍
在搜索场景中,需要确定用户输入的搜索请求中的搜索词是否可以被召回。目前,常见的召回确定方法是调索引信息,具体过程为:在接收到搜索请求后,调取索引信息,确定索引信息中是否存在搜索请求中的搜索词对应的索引条目。但是,由于调索引信息比较耗时,并且,索引信息本身也需要巨大的内存开销,因此,目前的召回确定方法效率较低,并且内存开销较大。
技术实现思路
本专利技术提供一种召回确定方法、装置、设备及存储介质,以解决目前的召回确定方法效率较低并且内存开销较大的技术问题。第一方面,本专利技术实施例提供一种召回确定方法,包括:根据目标搜索词包括的目标字符以及预设的字符与字符编码的映射关系,确定所述目标搜索词对应的目标三维数组的下标集合;其中,所述目标三维数组的下标用于表示所述目标搜索词中的第i个目标字符的编码、位于所述第i个目标字符之后的第j个目标字符的编码以及所述第i个目标字符与所述本文档来自技高网...

【技术保护点】
1.一种召回确定方法,其特征在于,包括:/n根据目标搜索词包括的目标字符以及预设的字符与字符编码的映射关系,确定所述目标搜索词对应的目标三维数组的下标集合;其中,所述目标三维数组的下标用于表示所述目标搜索词中的第i个目标字符的编码、位于所述第i个目标字符之后的第j个目标字符的编码以及所述第i个目标字符与所述第j个目标字符在所述目标搜索词中间隔的字符数q,0<i≤length-1、1<j≤length且i与j不相等,length表示所述目标搜索词包括的目标字符的数量,0<q≤length-1;/n根据所述目标三维数组的下标集合以及预设的三维数组,确定所述目标三维数组的下标集合在所述三维数组中对应...

【技术特征摘要】
1.一种召回确定方法,其特征在于,包括:
根据目标搜索词包括的目标字符以及预设的字符与字符编码的映射关系,确定所述目标搜索词对应的目标三维数组的下标集合;其中,所述目标三维数组的下标用于表示所述目标搜索词中的第i个目标字符的编码、位于所述第i个目标字符之后的第j个目标字符的编码以及所述第i个目标字符与所述第j个目标字符在所述目标搜索词中间隔的字符数q,0<i≤length-1、1<j≤length且i与j不相等,length表示所述目标搜索词包括的目标字符的数量,0<q≤length-1;
根据所述目标三维数组的下标集合以及预设的三维数组,确定所述目标三维数组的下标集合在所述三维数组中对应的各元素值;其中,所述预设的三维数组的元素用于表示所述预设的字符集合中的任意两个字符,是否会在预设的词集合中的任意词中共同出现;
当所述目标三维数组的下标集合在所述预设的三维数组所对应的各元素值中,只要存在一个元素值,表示所述目标搜索词中对应的两个目标字符,在所述预设的词集合中的任意词中间隔对应的字符数均不会共同出现时,确定所述目标搜索词无法被召回。


2.根据权利要求1所述的召回确定方法,其特征在于,所述三维数组为三维布尔数组;
所述根据目标搜索词包括的字符以及预设的字符与字符编码的映射关系,确定所述目标搜索词对应的目标三维数组的下标集合之前,所述方法还包括:
根据预设的字符集合以及所述字符与字符编码的映射关系,构建初始的三维布尔数组;其中,所述初始的三维布尔数组的下标包括:m、n以及p,n表示第一字符的编码,p表示所述第一字符之后的第二字符的编码,m+1表示所述第一字符与所述第二字符之间间隔的字符数,所述初始的三维布尔数组的元素表示所述第一字符与所述第二字符在任何词中间隔m个字符均不会共同出现;
根据预设的词集合,针对每个词中字符的共现关系,更新所述初始的三维布尔数组,形成更新后的三维布尔数组;
将所述更新后的三维布尔数组,作为所述预设的三维数组。


3.根据权利要求2所述的方法,其特征在于,所述针对每个词中字符的共现关系,更新所述初始的三维布尔数组,包括:
针对每个词中字符的编码以及字符的间隔,确定所述词在所述初始的三维布尔数组中的下标集合;
将所述初始的三维布尔数组中,所述词在所述初始的三维布尔数组中的下标集合对应的各元素更新为表示对应的两个字符间隔对应的字符数可以共同出现。


4.根据权利要求3所述的方法,其特征在于,所述针对每个词中字符的编码以及字符的间隔,确定所述词在所述初始的三维布尔数组中的下标集合,包括:
将所述词中第r个字符的编码、位于第r个字符之后的第s个字符的编码以及所述第r个字符与所述第s个字符之间间隔的字符数t减1后的值,作为所述词在所述初始的三维布尔数组中的下标集合;其中,0<r≤length`-1、1<s≤length`且r与s不相等,length`表示所述词包括的字符的数量,0<t≤length`-1。

【专利技术属性】
技术研发人员:王哲乔柯岩张炫李波曾少斌胡俊颜杰刘鸿未波波杨鹏伟钟剑哲覃志奎冯子剑郭琳琳赵向洋李朋张红玉苏盈盈
申请(专利权)人:喜大上海网络科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1