【技术实现步骤摘要】
一种数据查询方法、装置和计算设备
本专利技术涉及计算机和科学
,尤其涉及一种数据查询方法、装置和计算设备。
技术介绍
随着计算机和互联网技术的发展,中小学教育,乃至大学教育中的练习和考试题目均实现了电子化存储,并可上传到网络上供学生使用。而且,用户还可以将不懂的题目上传到平台上,以搜索与该题目最相近的题目进行学习。但目前的题目搜索引擎,仍无法为用户自动匹配出最准确最相近的题目,从而影响用户体验。因此,需要一种能够更精确的相近题目确定方法。
技术实现思路
鉴于上述问题,本专利技术提出了一种数据查询方法、装置和计算设备,以力图解决或者至少解决上面存在的问题。根据本专利技术的一个方面,提供了一种数据查询方法,适于在计算设备中执行,该计算设备中存储有多个字符串集的数据索引,该数据索引包括一级目录和其下的至少一个二级目录,且每个二级目录都标记有所属的字符串集,该方法包括步骤:将待查询的目标字符串集划分为多个字符串片段,并将每个字符串片段划分为前缀片段和后缀片段;生成前缀片段的第一索引和所述后缀片段的第 ...
【技术保护点】
1.一种数据查询方法,适于在计算设备中执行,所述计算设备中存储有多个字符串集的数据索引,所述数据索引包括一级目录和其下的至少一个二级目录,且每个二级目录都标记有所属的字符串集,该方法包括步骤:/n将待查询的目标字符串集划分为多个字符串片段,并将每个字符串片段划分为前缀片段和后缀片段;/n生成所述前缀片段的第一索引和所述后缀片段的第二索引,并在所述数据索引中查找以该第一索引为一级目录、以该第二索引为二级目录的多个候选字符串集;以及/n计算每个候选字符串集与目标字符串集具有相同目录表示的字符串片段个数,并将相同个数最多的候选字符串集作为所述目标字符串集的最相近字符串集。/n
【技术特征摘要】
1.一种数据查询方法,适于在计算设备中执行,所述计算设备中存储有多个字符串集的数据索引,所述数据索引包括一级目录和其下的至少一个二级目录,且每个二级目录都标记有所属的字符串集,该方法包括步骤:
将待查询的目标字符串集划分为多个字符串片段,并将每个字符串片段划分为前缀片段和后缀片段;
生成所述前缀片段的第一索引和所述后缀片段的第二索引,并在所述数据索引中查找以该第一索引为一级目录、以该第二索引为二级目录的多个候选字符串集;以及
计算每个候选字符串集与目标字符串集具有相同目录表示的字符串片段个数,并将相同个数最多的候选字符串集作为所述目标字符串集的最相近字符串集。
2.如权利要求1所述的方法,其中,所述字符串集为试题,所述候选字符串集为候选试题。
3.如权利要求1所述的方法,其中,所述数据索引表示为索引树。
4.如权利要求1-3中任一项所述的方法,其中,
所述二级目录表示为键值对,其以二级目录的索引值为键、以包含该第一索引和第二索引组成的字符串的字符串集为值,其中该字符串集还标记有在该字符串集中出现该目录表示的次数,作为该字符串集的元素个数。
5.如权利要求4所述的方法,还包括步骤:
统计每个一级目录下的所有二级目录的总元素个数,作为该一级目录的计数;
当某个一级目录的计数达到第一阈值时,删除该一级目录下的所有二级目录,并将该一级目录标记为已删除。
6.如权利要求4或5所述的方法,还包括步骤:
统...
【专利技术属性】
技术研发人员:郭小雷,
申请(专利权)人:作业不凡北京教育科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。