数据生成方法、装置、设备及存储介质制造方法及图纸

技术编号:39033209 阅读:14 留言:0更新日期:2023-10-10 11:46
本申请提供一种数据生成方法、装置、设备及存储介质,涉及大数据领域。该方法包括:获取第一数据表的标识信息;以标识信息为关键字,从多个数据表分别对应的字段关系清单中,查找第一数据表对应的字段关系清单,该字段关系清单中包括第一数据表中的字段和第一数据表中字段对应的关联字段,字段关系清单是通过对多个数据表进行字段相似性和关联性分析得到的;基于第一数据表对应的字段关系清单,构建第一数据表与第二数据表之间的数据表关联关系图,第二数据表为关联字段所属的数据表;基于数据表关联关系图,为第一数据表中的字段和第二数据表中的字段赋值。从而,基于数据表字段之间的关联关系,提高了为数据表赋值的效率和准确性。性。性。

【技术实现步骤摘要】
数据生成方法、装置、设备及存储介质


[0001]本申请涉及大数据领域,尤其涉及一种数据生成方法、装置、设备及存储介质。

技术介绍

[0002]随着数据量的增加,需要进行大数据批量验证,以提高海量数据的准确性。
[0003]在大数据批量验证的过程中,测试人员对数据表之间的数据关联情况没有途径进行检查和分析,需要依赖于开发设计人员提供的逻辑文档进行数据准备。其中,逻辑文档中记载着数据表之间的数据关联情况。
[0004]然而,逻辑文档可能存在数据表缺失、数据关联的缺失,导致数据测试中测试人员准备数据的工作量大、效率低。

技术实现思路

[0005]本申请提供一种数据生成方法、装置、设备及存储介质,用以解决数据准备的工作量大、效率低的问题。
[0006]第一方面,本申请提供一种数据生成方法,包括:
[0007]获取待造数的第一数据表的标识信息;
[0008]以所述标识信息为关键字,从多个数据表分别对应的字段关系清单中,查找所述第一数据表对应的字段关系清单,所述第一数据表对应的字段关系清单中包括所述第一数据表中的字段对应的关联关系,所述关联关系中包括所述第一数据表中的字段和所述第一数据表中字段对应的关联字段,所述多个数据表分别对应的字段关系清单是通过对所述多个数据表进行字段相似性和关联性分析得到的;
[0009]基于所述第一数据表对应的字段关系清单,构建所述第一数据表与第二数据表之间的数据表关联关系图,所述第二数据表为所述关联字段所属的数据表;基于所述数据表关联关系图,为所述第一数据表中的字段和所述第二数据表中的字段赋值,所述第一数据表中字段的值与所述第一数据表中字段对应的关联字段的值一致。
[0010]第二方面,本申请提供一种数据生成装置,包括:
[0011]获取模块,用于获取待造数的第一数据表的标识信息;
[0012]查找模块,用于以所述标识信息为关键字,从多个数据表分别对应的字段关系清单中,查找所述第一数据表对应的字段关系清单,所述第一数据表对应的字段关系清单中包括所述第一数据表中的字段对应的关联关系,所述关联关系中包括所述第一数据表中的字段和所述第一数据表中字段对应的关联字段,所述多个数据表分别对应的字段关系清单是通过对所述多个数据表进行字段相似性和关联性分析得到的;
[0013]构建模块,用于基于所述第一数据表对应的字段关系清单,构建所述第一数据表与第二数据表之间的数据表关联关系图,所述第二数据表为所述关联字段所属的数据表;
[0014]赋值模块,用于基于所述数据表关联关系图,为所述第一数据表中的字段和所述第二数据表中的字段赋值,所述第一数据表中字段的值与所述第一数据表中字段对应的关
联字段的值一致。
[0015]第三方面,本申请提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面所述的数据生成方法。
[0016]第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现第一方面所述的数据生成方法。
[0017]第五方面,本申请提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如第一方面提供的数据生成方法。
[0018]本申请提供的数据生成方法、装置、设备及存储介质,预先通过对多个数据表进行字段相似性和关联性分析,得到多个数据表分别对应的字段关系清单,其中包括第一数据表对应的字段关系清单。在准备对第一数据表进行造数时,可从多个数据表分别对应的字段关系清单中,查询第一数据表对应的字段关系清单,该字段关系清单中记录着第一数据表中的字段和第一数据表中的字段对应的关联字段,因此,可以基于该字段关系清单建立第一数据表与第二数据表之间的数据表关联关系图,第二数据表是关联字段所属的数据表;基于该数据表关联关系图,为第一数据表中的字段和第二数据表中的字段进行赋值,确保第一数据表中字段的值与对应的关联字段的值一致。如此,无需用户人工查找与第一数据表有关联的其他数据表,也无需用户一一手动修改各个数据表中字段的值,有效减少了数据准备的工作量,提高了数据准备的效率。
附图说明
[0019]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0020]图1为本申请实施例适用的应用场景的示例图;
[0021]图2为本申请实施例提供的一种数据生成方法的流程示意图;
[0022]图3为本申请实施例提供的一种数据生成方法中多个数据表分别对应的字段关系清单的生成过程的流程示意图;
[0023]图4为本申请实施例提供的数据处理流程示例图;
[0024]图5为本申请实施例提供的数据生成装置的结构示意图;
[0025]图6为本申请实施例提供的一种电子设备的结构示意图。
[0026]通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
[0027]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0028]需要说明的是,本申请提供的数据生成方法、装置、设备及存储介质可用于大数据领域,也可用于除大数据领域之外的任意领域,本申请提供的数据生成方法、装置、设备及存储介质的应用领域不作限定。
[0029]测试人员对于后台的数据表之间的数据关联情况没有途径进行检查及分析,主要依赖于开发人员提供的逻辑文档进行数据准备。然而,逻辑文档可能存在数据表确实、关联性缺失的问题,导致在实际测试过程中测试人员如果要进行数据返工则需要一一检查和修改各个数据表,工作量大且效率低;如果测试人员仅对单个表进行逐一造数,无法实现不同表之间的联动造数,导致表之间相关联的字段的值不同。
[0030]为解决上述问题,本申请提供的数据生成方法、装置、设备及存储介质,通过对多个数据表进行字段相似性和关联性分析,得到多个数据表分别对应的字段关系清单,字段关系清单中包括数据表中的字段和字段对应的关联字段;在数据准备时,可以基于待造数的数据表对应的字段关系清单,建立待造数的数据表与相关的数据表之间的数据表关联关系图;基于数据表关联关系图,进行待造数的数据表与相关的数据表之间的联动造数。从而,无需手动对各个表逐一造数,减少了数据准备中的人工介入,通过自动分析数据表字段之间的关联关系和自动联动造数,减少了数据准备的工作量,提高了数据准备的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据生成方法,其特征在于,包括:获取待造数的第一数据表的标识信息;以所述标识信息为关键字,从多个数据表分别对应的字段关系清单中,查找所述第一数据表对应的字段关系清单,所述第一数据表对应的字段关系清单中包括所述第一数据表中的字段对应的关联关系,所述关联关系中包括所述第一数据表中的字段和所述第一数据表中字段对应的关联字段,所述多个数据表分别对应的字段关系清单是通过对所述多个数据表进行字段相似性和关联性分析得到的;基于所述第一数据表对应的字段关系清单,构建所述第一数据表与第二数据表之间的数据表关联关系图,所述第二数据表为所述关联字段所属的数据表;基于所述数据表关联关系图,为所述第一数据表中的字段和所述第二数据表中的字段赋值,所述第一数据表中字段的值与所述第一数据表中字段对应的关联字段的值一致。2.根据权利要求1所述的数据生成方法,其特征在于,所述多个数据表分别对应的字段关系清单是通过如下方式生成的:获取所述多个数据表的数据表信息,所述数据表信息包括表结构和表内数据;对所述多个数据表的表结构进行特征提取,得到所述多个数据表分别对应的表特征;对所述多个数据表分别对应的表特征进行相似度分析,得到所述多个数据表分别对应的初始关系清单,其中,对于所述多个数据表中的各个数据表,初始关系清单中包括数据表中字段对应的相似关系,相似关系中包括数据表中的字段、数据表中字段对应的相似字段以及数据表中的字段与对应的相似字段之间的相似度;基于所述多个数据表的表内数据,对所述多个数据表分别对应的初始关系清单中字段对应的相似关系进行验证和筛选,得到所述多个数据表分别对应的字段关系清单。3.根据权利要求2所述的数据生成方法,其特征在于,所述对所述多个数据表的表结构进行特征提取,得到所述多个数据表分别对应的表特征,包括:针对所述多个数据表中的各个数据表,按照配置的特征类型,对数据表的表结构进行特征提取,得到数据表在所述特征类型下的表特征,其中,所述特征类型包括如下至少一种:数据表表名、数据表所属业务类型、数据表字段名、数据表字段类型。4.根据权利要求3所述的数据生成方法,其特征在于,所述对所述多个数据表分别对应的表特征进行相似度分析,得到所述多个数据表分别对应的初始关系清单,包括:针对所述多个数据表中的各个数据表,按照特征组合方式,将数据表对应的多个表特征进行组合,得到数据表对应的组合特征;基于所述多个数据表分别对应的多个表特征和所述多个数据表分别对应的组合特征进行字段的相似度识别,得到所述多个数据表之间的字段相似度;根据所述多个数据表之间的字段相似度,得到所述初始关系清单。5.根据权利要求4所述的数据生成方法,其特征在于,所述特征组合方式为多个,不同的特征组合方式对应不同的组合特征,所述不同的组合特征中均包括特征类型为数据表表名的表特征和特征类型为数据表字段名的表特征;所述针对所述多个数据表中的各个数据表,按照特征组合方式,将数据表对应的多个表特征进行组合,得到数据表对应的组合特征,包括:针对所述多个数据表中的各个数据表,按照所述特征组合方式,将数据表对应的多个
表特征中属于不同的特征类型的表特征进行组合,得到数据表对应的多个组合特征。6.根据权利要求4所述的数据生成方法,其特征在于,所述基于所述多个数据表分别对应的多个表...

【专利技术属性】
技术研发人员:盛燕芬徐彩霞
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1