数据存储方法、装置、电子设备和存储介质制造方法及图纸

技术编号:33121375 阅读:11 留言:0更新日期:2022-04-17 00:20
本发明专利技术提供一种数据存储方法、装置、电子设备和存储介质,所述方法包括:基于待存储数据的元数据与指标元数据库中各指标数据的元数据,确定待存储数据与各指标数据之间的相似度指数;在待存储数据与各指标数据之间的相似度指数均小于相似度阈值时,将待存储数据的基础信息存储至指标元数据库。本发明专利技术能够避免将与各指标数据重复或相似的待存储数据的基础信息存储至指标元数据库,导致占用指标元数据库存储空间的问题。此外,由于待存储数据与指标元数据库中的其它指标数据不同,从而用户在指标元数据库中可以唯一查询到待存储数据,避免出现多个相似指标数据使得用户需要筛选导致查询效率较低的问题。致查询效率较低的问题。致查询效率较低的问题。

【技术实现步骤摘要】
数据存储方法、装置、电子设备和存储介质


[0001]本专利技术涉及数据处理
,尤其涉及一种数据存储方法、装置、电子设备和存储介质。

技术介绍

[0002]目前,为了方便快捷查询数据,多是基于元数据与数据的基础信息之间的映射关系在指标数据库中进行查询。
[0003]在构建数据库的过程中,需要将大量数据的基础信息存储至数据库中,以便后续查询数据的基础信息。现有技术中多是直接将大量数据的基础信息存储至数据库中,但这些基础信息中可能存在大量相同或相似的信息,进而导致数据库中存在大量冗余数据,浪费数据库的存储空间。

技术实现思路

[0004]本专利技术提供一种数据存储方法、装置、电子设备和存储介质,用以解决现有技术中数据库中存在冗余数据导致浪费数据库存储空间的缺陷。
[0005]本专利技术提供一种数据存储方法,包括:
[0006]基于待存储数据的元数据与指标元数据库中各指标数据的元数据,确定所述待存储数据与各指标数据之间的相似度指数;
[0007]在所述相似度指数均小于相似度阈值时,将所述待存储数据的基础信息存储至所述指标元数据库。
[0008]根据本专利技术提供的一种数据存储方法,所述基于待存储数据的元数据与指标元数据库中各指标数据的元数据,确定所述待存储数据与各指标数据之间的相似度指数,包括:
[0009]基于所述待存储数据的元数据与各指标数据的元数据,确定所述待存储数据与各指标数据之间的交集信息和并集信息;
[0010]基于所述交集信息和所述并集信息,确定所述相似度指数。
[0011]根据本专利技术提供的一种数据存储方法,所述基于所述交集信息和所述并集信息,确定所述相似度指数,包括:
[0012]统计所述交集信息的数量和所述并集信息的数量;
[0013]以所述交集信息的数量与所述并集信息的数量的比值作为所述相似度指数。
[0014]根据本专利技术提供的一种数据存储方法,在将所述待存储数据的基础信息存储至所述指标元数据库之后,还包括:
[0015]建立所述待存储数据的元数据与所述待存储数据的基础信息之间的映射关系,以及建立所述待存储数据的元数据与授权用户信息之间的映射关系;所述授权用户信息指具备访问所述待存储数据的用户信息。
[0016]根据本专利技术提供的一种数据存储方法,在建立所述待存储数据的元数据与授权用户信息之间的映射关系之后,还包括:
[0017]在检测到待访问用户的查询指令时,获取所述查询指令中的待访问用户信息;
[0018]在所述待访问用户信息与所述待存储数据的元数据之间存在映射关系时,将所述待存储数据的基础信息发送至所述待访问用户。
[0019]根据本专利技术提供的一种数据存储方法,还包括:
[0020]在所述待存储数据与任一指标数据之间的相似度指数大于等于所述相似度阈值时,进行信息提示。
[0021]根据本专利技术提供的一种数据存储方法,在确定所述待存储数据与各指标数据之间的相似度指数之后,还包括:
[0022]以所述待存储数据和各指标数据作为节点,以所述相似度指数作为边,将所述待存储数据、各指标数据和所述相似度指数添加至指标关系图谱。
[0023]本专利技术还提供一种数据存储装置,包括:
[0024]确定单元,用于基于待存储数据的元数据与指标元数据库中各指标数据的元数据,确定所述待存储数据与各指标数据之间的相似度指数;
[0025]存储单元,用于在所述相似度指数均小于相似度阈值时,将所述待存储数据的基础信息存储至所述指标元数据库。
[0026]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述数据存储方法的步骤。
[0027]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述数据存储方法的步骤。
[0028]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述数据存储方法的步骤。
[0029]本专利技术提供的数据存储方法、装置、电子设备和存储介质,基于待存储数据的元数据与指标元数据库中各指标数据的元数据,确定待存储数据与各指标数据之间的相似度指数,并在待存储数据与各指标数据之间的相似度指数均小于相似度阈值时,将待存储数据的基础信息存储至指标元数据库,从而避免将与各指标数据重复或相似的待存储数据的基础信息存储至指标元数据库,导致占用指标元数据库存储空间的问题。此外,由于待存储数据与指标元数据库中的其它指标数据不同,从而用户在指标元数据库中可以唯一查询到待存储数据,避免出现多个相似指标数据使得用户需要筛选导致查询效率较低的问题。
附图说明
[0030]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0031]图1是本专利技术提供的数据存储方法的流程示意图之一;
[0032]图2是本专利技术提供的唯一性校验方法的流程示意图;
[0033]图3是本专利技术提供的数据存储方法的流程示意图之二;
[0034]图4是本专利技术提供的指标权限分配的流程示意图;
[0035]图5是本专利技术提供的数据存储装置的结构示意图;
[0036]图6是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0037]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0038]在构建数据库的过程中,需要将大量数据的基础信息存储至数据库中,以便后续查询数据的基础信息。现有技术中多是直接将大量数据的基础信息存储至数据库中,但这些基础信息中可能存在大量相同或相似的信息,进而导致数据库中存在大量冗余数据,浪费数据库的存储空间,而且在用户输入元数据进行查询时,可能会同时出现多个相同或相似的基础信息供用户筛选,进而降低了用户查询信息的效率。
[0039]对此,本专利技术提供一种数据存储方法。图1是本专利技术提供的数据存储方法的流程示意图,如图1所示,该方法包括:
[0040]步骤110、基于待存储数据的元数据与指标元数据库中各指标数据的元数据,确定待存储数据与各指标数据之间的相似度指数。
[0041]此处,待存储数据的元数据指用于描述待存储数据的属性信息,例如待存储数据为用户身高,则待存储数据的元数据可以是用户的姓名、身份证号等。同理,各指标数据的元数据用于描述各指标数据的属性信息,如各指标数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据存储方法,其特征在于,包括:基于待存储数据的元数据与指标元数据库中各指标数据的元数据,确定所述待存储数据与各指标数据之间的相似度指数;在所述相似度指数均小于相似度阈值时,将所述待存储数据的基础信息存储至所述指标元数据库。2.根据权利要求1所述的数据存储方法,其特征在于,所述基于待存储数据的元数据与指标元数据库中各指标数据的元数据,确定所述待存储数据与各指标数据之间的相似度指数,包括:基于所述待存储数据的元数据与各指标数据的元数据,确定所述待存储数据与各指标数据之间的交集信息和并集信息;基于所述交集信息和所述并集信息,确定所述相似度指数。3.根据权利要求2所述的数据存储方法,其特征在于,所述基于所述交集信息和所述并集信息,确定所述相似度指数,包括:统计所述交集信息的数量和所述并集信息的数量;以所述交集信息的数量与所述并集信息的数量的比值作为所述相似度指数。4.根据权利要求1所述的数据存储方法,其特征在于,在将所述待存储数据的基础信息存储至所述指标元数据库之后,还包括:建立所述待存储数据的元数据与所述待存储数据的基础信息之间的映射关系,以及建立所述待存储数据的元数据与授权用户信息之间的映射关系;所述授权用户信息指具备访问所述待存储数据的用户信息。5.根据权利要求4所述的数据存储方法,其特征在于,在建立所述待存储数据的元数据与授权用户信息之间的映射关系之后,还包括...

【专利技术属性】
技术研发人员:金贺
申请(专利权)人:海尔智家股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1