【技术实现步骤摘要】
基于多种检索方式融合检索的方法和装置
本说明书一个或多个实施例涉及计算机领域,尤其涉及基于多种检索方式融合检索的方法和装置。
技术介绍
当前存在着大量的检索场景,如电子支付平台的线下刷脸支付时对人脸图像的检索、电子商务平台的商品图片检索等。为了达到最佳的检索性能,常常需要基于多种检索方式融合检索。现有技术中基于多种检索方式融合检索时,通常先进行向量检索,然后基于其他条件对向量检索的结果进行过滤,这样会带来向量检索的结果大量被过滤,导致不满足返回结果数量,甚至返回为空的结果。因此,希望能有改进的方案,能够基于多种检索方式融合检索时兼顾检索性能和返回结果数量。
技术实现思路
本说明书一个或多个实施例描述了一种基于多种检索方式融合检索的方法和装置,能够基于多种检索方式融合检索时兼顾检索性能和返回结果数量。第一方面,提供了一种基于多种检索方式融合检索的方法,方法包括:获取目标检索对象对应的目标检索向量和过滤条件;根据所述目标检索向量,从数据库的备选检索对象集中召回距离所述目标检索向量最近的第一数目个第一候选对象,所述第一数目为预先设定的;根据所述过滤条件,按照条件过滤方式从所述第一数目个第一候选对象中筛选出第二数目个第一候选对象,并将所述第二数目添加到累积数目;若所述累积数目小于预设阈值,则将所述第一数目个第一候选对象从所述备选检索对象集中排除,以更新所述备选检索对象集,并再次从更新的所述备选检索对象集中召回排序在前的第一数目个第二候选对象, ...
【技术保护点】
1.一种基于多种检索方式融合检索的方法,所述方法包括:/n获取目标检索对象对应的目标检索向量和过滤条件;/n根据所述目标检索向量,从数据库的备选检索对象集中召回距离所述目标检索向量最近的第一数目个第一候选对象,所述第一数目为预先设定的;/n根据所述过滤条件,按照条件过滤方式从所述第一数目个第一候选对象中筛选出第二数目个第一候选对象,并将所述第二数目添加到累积数目;/n若所述累积数目小于预设阈值,则将所述第一数目个第一候选对象从所述备选检索对象集中排除,以更新所述备选检索对象集,并再次从更新的所述备选检索对象集中召回排序在前的第一数目个第二候选对象,直到筛选出的候选对象的累积数目大于或等于所述预设阈值。/n
【技术特征摘要】
1.一种基于多种检索方式融合检索的方法,所述方法包括:
获取目标检索对象对应的目标检索向量和过滤条件;
根据所述目标检索向量,从数据库的备选检索对象集中召回距离所述目标检索向量最近的第一数目个第一候选对象,所述第一数目为预先设定的;
根据所述过滤条件,按照条件过滤方式从所述第一数目个第一候选对象中筛选出第二数目个第一候选对象,并将所述第二数目添加到累积数目;
若所述累积数目小于预设阈值,则将所述第一数目个第一候选对象从所述备选检索对象集中排除,以更新所述备选检索对象集,并再次从更新的所述备选检索对象集中召回排序在前的第一数目个第二候选对象,直到筛选出的候选对象的累积数目大于或等于所述预设阈值。
2.如权利要求1所述的方法,其中,所述方法还包括:
若所述累积数目大于或等于所述预设阈值,则输出筛选出的所述累积数目的候选对象作为所述目标检索对象对应的检索结果。
3.如权利要求1所述的方法,其中,所述从数据库的备选检索对象集中召回距离所述目标检索向量最近的第一数目个第一候选对象,包括:
通过近似最近邻ANN向量检索方式,从数据库的备选检索对象集中召回距离所述目标检索向量最近的第一数目个第一候选对象。
4.如权利要求1所述的方法,其中,所述从数据库的备选检索对象集中召回距离所述目标检索向量最近的第一数目个第一候选对象,包括:
根据所述目标检索向量,从数据库的备选检索对象集中选择第一数目个初始候选对象放入优先队列中;所述优先队列中与所述目标检索向量距离最远的初始候选对象为第一初始候选对象;所述第一初始候选对象与所述目标检索向量之间的距离为第一距离;
在所述第一初始候选对象的各邻居中,寻找与所述目标检索向量之间的距离小于所述第一距离的替换候选对象,用所述替换候选对象替换所述优先队列中的所述第一初始候选对象,再基于替换后的优先队列寻找替换候选对象,直到无法寻找到所述替换候选对象,将所述优先队列中的各候选对象作为距离所述目标检索向量最近的第一数目个第一候选对象。
5.如权利要求1所述的方法,其中,所述目标检索对象包括:图片或文本。
6.如权利要求1所述的方法,其中,所述目标检索对象为人脸图片;
所述过滤条件包括:
人脸图片对应用户的地域条件。
7.如权利要求1所述的方法,其中,所述目标检索对象为商品图片;
所述过滤条件包括:
商品图片对应商品的商品类型条件。
8.如权利要求1所述的方法,其中,所述目标检索对象为文本;
所述过滤条件包括:
文本包含的关键词条件。
9.一种基于多种检索方式融合检索的装置,所述装置包括:
获取单元,用于获取目标检索对象对应的目标检索向量和过滤条件;
第一检索单元,用于根据所述获取单元获取的目标检索...
【专利技术属性】
技术研发人员:李涛,杨文,魏宏,方概,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。