一种模糊数据生成方法、装置、设备及存储介质制造方法及图纸

技术编号:39183971 阅读:9 留言:0更新日期:2023-10-27 08:31
本申请公开了一种模糊数据生成方法、装置、设备及存储介质,通过解析原数据库中的数据表结构以及数据,随机模糊生成与目标数据库匹配的数据表结构及相等数据量的模拟数据,将对应的模糊表结构信息和模拟数据输出,可以直接导入到对应类型的目标数据库中,进行前期的表结构和数据全模拟割接测试,减少模拟割接生成环境次数,快速完成数据库前期割接测试任务,解决了新旧数据库进行数据迁移时,需要采集客户的实际使用数据,但许多客户数据库内包含的数据是保密的,不能直接提取使用,容易造成数据泄露的技术问题。成数据泄露的技术问题。成数据泄露的技术问题。

【技术实现步骤摘要】
一种模糊数据生成方法、装置、设备及存储介质


[0001]本申请涉及数据库
,尤其涉及一种模糊数据生成方法、装置、设备及存储介质。

技术介绍

[0002]随着分布式国产化数据库的发展,许多企业开始丢掉集中式数据库,开始青睐使用分布式数据库。
[0003]在进行从旧的集中式数据库到新的分布式数据库之间的数据迁移时,需要采集客户的实际使用数据,但许多客户数据库内包含的数据是保密的,不能直接提取使用。
[0004]当前为了更快的进行国产化数据库替换,对数据库模拟割接的时间要求越来越高,减少前期投入,减少数据泄露途径,为了更加方便异构数据库进行快速割接测试,可以快速的模拟客户数据库的真实数据库信息,将其数据库的表结构信息通过不可逆的方式模拟生成对应的表结构以及模糊信息,将每个表的数据特征信息都提取出来,不需要知道用户的具体表名称以及对应数据,进行模拟割接测试,因此需要一种提取客户数据特征并生成模糊数据的方法。

技术实现思路

[0005]本申请提供了一种模糊数据生成方法、装置、设备及存储介质,解决了新旧数据库进行数据迁移时,需要采集客户的实际使用数据,但许多客户数据库内包含的数据是保密的,不能直接提取使用,容易造成数据泄露的技术问题。
[0006]有鉴于此,本申请第一方面提供了一种模糊数据生成方法,所述方法包括:
[0007]S1、解析原数据库中的数据表结构以及数据,对应得到包含数据表结构以及数据量的二进制数据文件;
[0008]S2、根据所述二进制数据文件,随机构造匹配所述数据表结构以及数据量的模拟数据;
[0009]S3、将所述模拟数据进行打包并导入应用于目标数据库中。
[0010]可选地,所述步骤S1之前还包括:
[0011]构建与原数据库的加密连接通道,通过所述加密连接通过获取基于加密算法加密的所述原数据库中的数据表结构以及数据。
[0012]可选地,所述步骤S1具体包括:
[0013]将加密后的所述原数据库中的数据表结构以及数据,进行表结构相似归类模糊解析,并根据数据量的级别进行表模糊分类,生成包含数据表结构以及数据量的二进制数据文件。
[0014]可选地,所述步骤S2具体包括:
[0015]根据所述二进制数据文件,调用算法存储库中的预设数据模型推演算法,随机构造与目标数据库结构相同,目标数据库数据类型一致,且匹配所述数据表结构以及数据量
的模拟数据。
[0016]可选地,所述步骤S3之后还包括:
[0017]导入成功后,断开与所述原数据库的加密连接通道。
[0018]本申请第二方面提供一种模糊数据生成装置,所述装置包括:
[0019]解析单元,用于解析原数据库中的数据表结构以及数据,对应得到包含数据表结构以及数据量的二进制数据文件;
[0020]模拟单元,用于根据所述二进制数据文件,随机构造匹配所述数据表结构以及数据量的模拟数据;
[0021]导入单元,用于将所述模拟数据进行打包并导入应用于目标数据库中。
[0022]可选地,还包括:
[0023]连接单元,用于构建与原数据库的加密连接通道,通过所述加密连接通过获取基于加密算法加密的所述原数据库中的数据表结构以及数据。
[0024]可选地,还包括:
[0025]断连单元,用于导入成功后,断开与所述原数据库的加密连接通道。
[0026]本申请第三方面提供一种模糊数据生成设备,所述设备包括处理器以及存储器:
[0027]所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
[0028]所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的模糊数据生成的方法的步骤。
[0029]本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述第一方面所述的模糊数据生成的方法的步骤。
[0030]从以上技术方案可以看出,本申请实施例具有以下优点:
[0031]本申请中,提供了一种模糊数据生成方法、装置、设备及存储介质,通过解析原数据库中的数据表结构以及数据,随机模糊生成与目标数据库匹配的数据表结构及相等数据量的模拟数据,将对应的模糊表结构信息和模拟数据输出,可以直接导入到对应类型的目标数据库中,进行前期的表结构和数据全模拟割接测试,减少模拟割接生成环境次数,快速完成数据库前期割接测试任务,解决了新旧数据库进行数据迁移时,需要采集客户的实际使用数据,但许多客户数据库内包含的数据是保密的,不能直接提取使用,容易造成数据泄露的技术问题。
附图说明
[0032]图1为本申请实施例中模糊数据生成方法的方法流程图;
[0033]图2为本申请实施例中模糊数据生成装置的结构示意图;
[0034]图3为本申请实施例中模糊数据生成设备的结构示意图。
具体实施方式
[0035]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0036]本申请设计了一种模糊数据生成方法、装置、设备及存储介质,解决了新旧数据库进行数据迁移时,需要采集客户的实际使用数据,但许多客户数据库内包含的数据是保密的,不能直接提取使用,容易造成数据泄露的技术问题。
[0037]为了便于理解,请参阅图1,图1为本申请实施例中模糊数据生成方法的方法流程图,如图1所示,具体为:
[0038]S1、解析原数据库中的数据表结构以及数据,对应得到包含数据表结构以及数据量的二进制数据文件;
[0039]具体地:
[0040]将加密后的原数据库中的数据表结构以及数据,进行表结构相似归类模糊解析,并根据数据量的级别进行表模糊分类,生成包含数据表结构以及数据量的二进制数据文件。
[0041]需要说明的是,针对于原数据库,需要解析获得原数据库中的数据表结构以及数据,解析时使用内部自有的矩阵解析匹配,通过二进制文件的方式解析完成对应的数据表结构以及对应的数据量。
[0042]S2、根据二进制数据文件,随机构造匹配数据表结构以及数据量的模拟数据;
[0043]具体地:
[0044]根据二进制数据文件,调用算法存储库中的预设数据模型推演算法,随机构造与目标数据库结构相同,目标数据库数据类型一致,且匹配数据表结构以及数据量的模拟数据。
[0045]需要说明的是,获取到对应的二进制数据文件,通过分析解析文件,使用内部的数据模型推演机制,调用本身的算法存储库,按照模糊获取表结构和数据量,快速随机构造匹配模糊表结构的模拟数据。
[0046]S3、将模拟数据进行打包并导入应用于目标数据库中。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模糊数据生成方法,其特征在于,包括:S1、解析原数据库中的数据表结构以及数据,对应得到包含数据表结构以及数据量的二进制数据文件;S2、根据所述二进制数据文件,随机构造匹配所述数据表结构以及数据量的模拟数据;S3、将所述模拟数据进行打包并导入应用于目标数据库中。2.根据权利要求1所述的模糊数据生成方法,其特征在于,所述步骤S1之前还包括:构建与原数据库的加密连接通道,通过所述加密连接通过获取基于加密算法加密的所述原数据库中的数据表结构以及数据。3.根据权利要求2所述的模糊数据生成方法,其特征在于,所述步骤S1具体包括:将加密后的所述原数据库中的数据表结构以及数据,进行表结构相似归类模糊解析,并根据数据量的级别进行表模糊分类,生成包含数据表结构以及数据量的二进制数据文件。4.根据权利要求3所述的模糊数据生成方法,其特征在于,所述步骤S2具体包括:根据所述二进制数据文件,调用算法存储库中的预设数据模型推演算法,随机构造与目标数据库结构相同,目标数据库数据类型一致,且匹配所述数据表结构以及数据量的模拟数据。5.根据权利要求4所述的模糊数据生成方法,其特征在于,所述步骤S3之后还包括:导入成功后,断开与所述原数据库的加密连...

【专利技术属性】
技术研发人员:王国生刘骏张玲东沈旭婷管天云吕伟初
申请(专利权)人:金篆信科有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1