一种数据搜索方法、装置及电子设备制造方法及图纸

技术编号:34411429 阅读:26 留言:0更新日期:2022-08-03 22:03
本发明专利技术公开了一种数据搜索方法、装置及电子设备,包括:在目标数据集对应的全部数据点中,随机选取目标数据集对应的多个柱点;根据每个柱点周围预设范围内存在的数据点,生成每个柱点分别对应的记录点;根据各所述柱点,以及各所述柱点分别对应的记录点,构建与所述目标数据集对应的索引图,以根据所述索引图进行数据搜索。本发明专利技术实施例的技术方案可以减少索引图的构建时间,提高索引图的构建效率。提高索引图的构建效率。提高索引图的构建效率。

【技术实现步骤摘要】
一种数据搜索方法、装置及电子设备


[0001]本专利技术实施例涉及数据处理
,尤其涉及一种数据搜索方法、装置及电子设备。

技术介绍

[0002]现有的数据搜索方法主要分两类,倒排索引(Inverted File,IVF)算法和基于索引图的搜索算法。
[0003]其中,IVF算法中通常采用k

means聚类方法,即通过多次数据迭代寻找聚类中心点,最后将所有数据点划分至对应的聚类中心。基于索引图的搜索算法中包括KGraph算法,以及基于图形的高维向量检索算法(Navigating Spreading

out Graph,NSG)。
[0004]但是,IVF算法中通过聚类结果确定的搜索结果准确性较差,KGraph算法中主要通过多次数据迭代过程,更新数据点对应的邻居点,导致索引图构建时间较久。

技术实现思路

[0005]本专利技术实施例提供一种数据搜索方法、装置及电子设备,可以提高索引图的构建速度。
[0006]第一方面,本专利技术实施例提供了一种数据搜索方法,该方法本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据搜索方法,其特征在于,所述方法包括:在目标数据集对应的全部数据点中,随机选取目标数据集对应的多个柱点;根据每个柱点周围预设范围内存在的数据点,生成每个柱点分别对应的记录点;根据各所述柱点,以及各所述柱点分别对应的记录点,构建与所述目标数据集对应的索引图,以根据所述索引图进行数据搜索。2.根据权利要求1所述方法,其特征在于,在目标数据集对应的全部数据点中,随机选取目标数据集对应的多个柱点,包括:在目标数据集对应的全部数据点中,随机选取多个数据点作为原始柱点;如果所述原始柱点的数量大于预设阈值,则根据各原始柱点的数据特征,在多个原始柱点中筛选目标数据集对应的最终柱点。3.根据权利要求2所述的方法,其特征在于,在目标数据集对应的全部数据点中,随机选取多个数据点作为原始柱点,包括:如果所述目标数据集中全部数据点的数量大于预设数量,则按照预设的多个柱点等级,随机选取每个柱点等级分别对应的多个数据点,作为每个柱点等级对应的原始柱点。4.根据权利要求3所述的方法,其特征在于,根据每个柱点周围预设范围内存在的数据点,生成每个柱点分别对应的记录点,包括:对每个柱点周围预设范围内存在的数据点进行记录;根据每个数据点对应的记录次数,以及各所述数据点与柱点之间的距离,生成每个柱点分别对应的记录点。5.根据权利要求4所述方法,其特征在于,根据每个数据点对应的记录次数,以及各所述数据点与柱点之间的距离,生成每个柱点分别对应的记录点,包括:判断当前柱点等级是否为第一等级;若否,则根据预设的多个柱点等级,获取当前柱点等级对应的上一等级,以及上一等级对应的目标柱点;获取目标柱点对应的各目标记录点,根据当前柱点与各目标记录点之间的距离,生成与当前柱点对应的记录点。6.根据权利要求1所述的方法,...

【专利技术属性】
技术研发人员:何文松
申请(专利权)人:北京文景松科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1