一种数据存储方法、查找方法、计算设备及存储介质技术

技术编号:38329853 阅读:12 留言:0更新日期:2023-07-29 09:12
本发明专利技术公开了一种数据存储方法、查找方法、计算设备及存储介质,数据存储方法在计算设备中执行,计算设备中驻留有数据库,该方法包括:从存储对象中提取至少一个特征值;分别以各特征值为键,存储对象为值,构建各特征值与存储对象的关联关系,并作为一条存储数据;将存储数据存储至数据库,并统计各特征值对应存储数据的数量。该数据存储方法,通过统计每个特征值对应存储数据的数量,使得在数据查找时,无需遍历整个数据库即可快速获取包含某个键的键值对个数,从而高效获得与某个键关联的所有值,并且可以更有效的使用数据库的存储空间。间。间。

【技术实现步骤摘要】
一种数据存储方法、查找方法、计算设备及存储介质


[0001]本专利技术涉及计算机
,具体涉及一种数据存储方法、查找方法、计算设备及存储介质。

技术介绍

[0002]Multimap是一种储存键值对的抽象数据结构,其允许有多个包含相同键的键值对同时存在(即一个键对应多个值)。基于此,Multimap可被用来存储相似数据。例如,在题库存储中,作为相似题目的存储结构。
[0003]但是,在键相同的键值对过多时,保存相同的键会浪费大量空间,并且在读取时也会浪费大量时间。例如,当需要获取包含某个键的键值对个数且不需要具体内容时,如果目标键值对数量过多,遍历过程需要浪费大量时间。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据存储方法、查找方法、计算设备以及存储介质。
[0005]根据本专利技术的一个方面,提供一种数据存储方法,在计算设备中执行,计算设备中驻留有数据库,该方法包括:从存储对象中提取至少一个特征值;分别以各特征值为键,存储对象为值,构建各特征值与存储对象的关联关系,并作为一条存储数据;将存储数据存储至数据库,并统计各特征值对应存储数据的数量。
[0006]可选地,在根据本专利技术的数据存储方法中,其中,统计各特征值对应存储数据的数量,包括:针对每一特征值,若数据库中存在至少一个目标键与该特征值相同,则将该目标值对应存储数据的数量加1;若数据库中不存在目标键与该特征值相同,则将该特征值作为新的键添加至数据库中,并记录该新的键对应存储数据的数量为1。
[0007]可选地,在根据本专利技术的数据存储方法中,其中,将存储数据存储至数据库,包括:将存储对象作为各目标键的一个从属节点添加至数据库中;或将存储对象作为新的键的一个从属节点添加至数据库中。
[0008]可选地,在根据本专利技术的数据存储方法中,其中,将该特征值作为新的键添加至数据库中,包括:确定该新的键在数据库中的存储位置;基于存储位置,将新的键添加至数据库中。
[0009]可选地,在根据本专利技术的数据存储方法中,其中,还包括:当检测到键值对对应的键值数量大于阈值时,删除键值对。
[0010]可选地,在根据本专利技术的数据存储方法中,其中,还包括:当检测到数据库的存储空间不足时,删除其存储的键值对中,键为单一字所构建的键值对。
[0011]可选地,在根据本专利技术的数据存储方法中,其中,从存储对象中提取至少一个特征值,包括:依次对存储对象进行分词处理,得到各特征值。
[0012]根据本专利技术的又一个方面,提供一种数据查找方法,适于对上述数据存储方法实
现的存储数据进行查找,在计算设备中执行,该方法包括:接收数据查找请求,查找请求至少包括用户输入的参考数据;解析参考数据,得到至少一个特征数据;针对每一特征数据,从数据库中获取与特征数据相同的键对应的存储数据数量,并确定存储数据数量不大于第一预设阈值的键对应的特征数据为匹配数据;将匹配数据作为索引,基于暴力匹配技术,从数据库中匹配出查找结果。
[0013]可选地,在根据本专利技术的数据查找方法中,其中,将匹配数据作为索引,基于暴力匹配技术,从数据库中匹配出查找结果,包括:针对每一匹配数据,获取包含该匹配数据的各候选数据,并将各候选数据中包含其他特征数据量大于第二预设阈值的候选数据,作为查找结果。
[0014]根据本专利技术的又一个方面,提供一种计算设备,包括:至少一个处理器;和存储有程序指令的存储器,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行上述方法的指令。
[0015]根据本专利技术的又一个方面,提供一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行上述的方法。
[0016]根据本专利技术的数据存储方法,通过统计每个特征值对应存储数据的数量,使得在数据查找时,无需遍历整个数据库即可快速获取包含某个键的键值对个数,从而高效获得与某个键关联的所有值,并且可以更有效的使用数据库的存储空间。
[0017]根据本专利技术的数据查找方法,通过判断数据量中各特征数据的数量,从而对特征进行筛除,达到了减少匹配时间,提高查找效率的目的。
[0018]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0019]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0020]图1示出了根据本专利技术一个实施例的计算设备100的示意图;
[0021]图2示出了根据本专利技术一个实施例的数据存储方法200的流程图;
[0022]图3示出了根据本专利技术一个实施例的数据查找方法300的流程图。
具体实施方式
[0023]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0024]题目数据是教育资源中重要的组成部分,在学习和教学过程中,学生日常使用的练习题目及用于测试的考试题目均属于题目数据。
[0025]随着计算机和互联网技术的发展,中小学教育中的题目数据基本实现了电子化存
储。题目数据在学习过程中不仅可以帮助学生加深对知识的学习与理解,还可以帮助老师及时掌握学生对知识的掌握情况,了解学生的学习进度,帮助学生查缺补漏,提高学习效率。而且,用户还可以将不懂的题目上传到平台上,以搜索与该题目最相近的题目进行学习。
[0026]容易理解的是,相近题目中通常包含有相同的特征值,例如“小明吃苹果”和“小张吃苹果”,二者存在相同的特征值“吃苹果”,这使得在将题目存储至题库中时,需要数据库允许存在相同特征对应多个题目(即一个键对应多个值)。因此,常常使用Multimap结构作为题库的数据结构。
[0027]对于Multimap结构而言,随着相同键的键值对不断增加,会浪费大量的存储空间,且无法对数据库中相同键的键值对的数量进行统计。
[0028]为解决上述现有技术中存在的问题,提出本专利技术的方案。本专利技术的一个实施例提供了一种数据存储方法和数据查找方法,两种方法可以在计算设备中执行。图1示出了根据本专利技术一个实施例的计算设备100的结构图。如图1所示,在基本配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
[0029]取决于期望的配置,处理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据存储方法,在计算设备中执行,所述计算设备中驻留有数据库,该方法包括:从存储对象中提取至少一个特征值;分别以各所述特征值为键,所述存储对象为值,构建各特征值与所述存储对象的关联关系,并作为一条存储数据;将所述存储数据存储至所述数据库,并统计各特征值对应存储数据的数量。2.如权利要求1所述的方法,其中,统计各特征值对应存储数据的数量,包括:针对每一特征值,若所述数据库中存在至少一个目标键与该特征值相同,则将各目标值对应存储数据的数量加1;若所述数据库中不存在目标键与该特征值相同,则将该特征值作为新的键添加至所述数据库中,并记录该新的键对应存储数据的数量为1。3.如权利要求2所述的方法,其中,将所述存储数据存储至所述数据库,包括:将所述存储对象作为各所述目标键的一个从属节点添加至所述数据库中;或将所述存储对象作为所述新的键的一个从属节点添加至所述数据库中。4.如权利要求2所述的方法,其中,将该特征值作为新的键添加至所述数据库中,包括:确定该新的键在所述数据库中的存储位置;基于所述存储位置,将所述新的键添加至所述数据库中。5.如权利要求1所述的方法,其中,还包括:当检测到键值对对应的键数量大于阈值时,删除该键对应的各键值对。6.如权利要求1所述的方法...

【专利技术属性】
技术研发人员:郭小雷王庆苑殷浒李鹏飞
申请(专利权)人:湖北小熊图书文化传媒有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1