【技术实现步骤摘要】
基于增强学习生成向量最近邻搜索策略
技术介绍
随着网络技术的发展,搜索引擎的功能越来越强大,搜索的内容也越来越丰富。搜索引擎也为许多应用程序提供信息,是许多应用程序所必须的服务。在信息高速发展的时代,存在海量的网页文档、图片等信息,并且网页文档、图片的数量也在高速地增加。与此同时,用户对于信息的需求在不断的增加。如何能够实现更加快速、高效、准确地把握用户意图的检索服务是当前搜索引擎技术始终面临的挑战。
技术实现思路
提供本专利技术实施例内容是为了以精简的形式介绍将在以下详细描述中进一步描述的一些概念。本
技术实现思路
并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。公开的基于增强学习生成向量最近邻搜索策略的技术方案,将向量近似匹配搜索技术应用到搜索引擎中,通过增强学习技术对搜索引擎进行训练,以得到计算状态与行为动作的映射关系。搜索引擎可利用该映射关系为查询内容自动生成检索策略。上述说明仅是本公开技术方案的概述,为了能够更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为了让 ...
【技术保护点】
1.一种方法,包括:/n根据查询内容生成查询向量;/n在预设的向量数据库中执行向量近似匹配搜索,获取与所述查询向量最接近的候选向量;/n获取与所述最接近的候选向量相对应的搜索结果,/n其中在执行向量近似匹配搜索时,循环执行以下步骤,直至满足预设的截止条件:/n确认当前计算状态;/n根据预设的状态动作映射关系,基于所述当前计算状态,从预设的动作集中确认待执行的动作,其中所述状态动作映射关系反映不同的计算状态与动作之间的对应关系;/n执行所述待执行的动作,并收集基于所执行的动作搜索到的候选向量。/n
【技术特征摘要】
1.一种方法,包括:
根据查询内容生成查询向量;
在预设的向量数据库中执行向量近似匹配搜索,获取与所述查询向量最接近的候选向量;
获取与所述最接近的候选向量相对应的搜索结果,
其中在执行向量近似匹配搜索时,循环执行以下步骤,直至满足预设的截止条件:
确认当前计算状态;
根据预设的状态动作映射关系,基于所述当前计算状态,从预设的动作集中确认待执行的动作,其中所述状态动作映射关系反映不同的计算状态与动作之间的对应关系;
执行所述待执行的动作,并收集基于所执行的动作搜索到的候选向量。
2.根据权利要求1所述的方法,其中所述预设的状态动作映射关系包括状态动作映射表格或神经网络。
3.根据权利要求1所述的方法,其中在预设的向量数据库中执行的向量近似匹配搜索为近似最近邻搜索。
4.根据权利要求1所述的方法,其中所述预设的动作集包括:在决策树中搜索、在近邻图中搜索以及结束搜索。
5.根据权利要求1所述的方法,其中所述预设的动作集包括:在决策树中搜索、在存储于计算机内存中的近邻图中搜索、在存储于计算机硬盘中的近邻图中搜索以及结束搜索。
6.根据权利要求1所述的方法,其中所述当前计算状态包括:向量间距的计算次数、在决策树中搜索的次数、所有当前候选向量与查询向量的平均间距和上次搜索是否对所述候选向量具有更新中的至少一个。
7.一种方法,包括:
将预设的训练集输入待训练的信息检索模型中,其中所述信息检索模型包括初始的状态动作映射关系,所述状态动作映射关系反映不同的计算状态与动作之间的对应关系,并且所述训练集包括多个查询向量和分别与所述查询向量相对应的检索结果候选向量;
计算所述训练集中每个查询向量在所述信息检索模型中执行向量近似匹配搜索后的分值;
对于所述信息检索模型中每种潜在状态,利用所述分值更新所述状态动作映射关系。
8.根据权利要求7所述的方法,其中对于所述信息检索模型中每种潜在状态,利用所述分值更新所述状态动作映射关系包括:
从预设的动作集中确认所述训练集在执行向量近似匹配搜索时平均分值最高的动作;
根据与所述每种潜在状态对应的平均分值最高的动作,更新所述状态动作映射关系。
9.根据权利要求7所述的方法,其中所述状态动作映射关系包括状态动作映射表格或神经网络。
10.根据权利要求7所述的方法,其中在所述信息检索模型中执行的向量近似匹配搜索为近似最近邻搜索。
11.根据权利要求8所述的方法,其中所述预设的动作集包括:在决策树中搜索、在近邻图中搜索以及结束搜索。
12.根据权利要求8所述的方法,其中所述预设的动作集包括:在决策树中搜索、在存储于计算机内存中的近邻图中搜索、在存储于...
【专利技术属性】
技术研发人员:李伟,李明琴,陈琪,罗威,任刚,王井东,张霖涛,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。