【技术实现步骤摘要】
数据生成方法、装置、设备及存储介质
[0001]本申请涉及大数据领域,尤其涉及一种数据生成方法、装置、设备及存储介质。
技术介绍
[0002]随着数据量的增加,需要进行大数据批量验证,以提高海量数据的准确性。
[0003]在大数据批量验证的过程中,测试人员对数据表之间的数据关联情况没有途径进行检查和分析,需要依赖于开发设计人员提供的逻辑文档进行数据准备。其中,逻辑文档中记载着数据表之间的数据关联情况。
[0004]然而,逻辑文档可能存在数据表缺失、数据关联的缺失,导致数据测试中测试人员准备数据的工作量大、效率低。
技术实现思路
[0005]本申请提供一种数据生成方法、装置、设备及存储介质,用以解决数据准备的工作量大、效率低的问题。
[0006]第一方面,本申请提供一种数据生成方法,包括:
[0007]获取待造数的第一数据表的标识信息;
[0008]以所述标识信息为关键字,从多个数据表分别对应的字段关系清单中,查找所述第一数据表对应的字段关系清单,所述第一数据表对应的字段关系清单中包括所述第一数据表中的字段对应的关联关系,所述关联关系中包括所述第一数据表中的字段和所述第一数据表中字段对应的关联字段,所述多个数据表分别对应的字段关系清单是通过对所述多个数据表进行字段相似性和关联性分析得到的;
[0009]基于所述第一数据表对应的字段关系清单,构建所述第一数据表与第二数据表之间的数据表关联关系图,所述第二数据表为所述关联字段所属的数据表;基于所述数据表关联关系 ...
【技术保护点】
【技术特征摘要】
1.一种数据生成方法,其特征在于,包括:获取待造数的第一数据表的标识信息;以所述标识信息为关键字,从多个数据表分别对应的字段关系清单中,查找所述第一数据表对应的字段关系清单,所述第一数据表对应的字段关系清单中包括所述第一数据表中的字段对应的关联关系,所述关联关系中包括所述第一数据表中的字段和所述第一数据表中字段对应的关联字段,所述多个数据表分别对应的字段关系清单是通过对所述多个数据表进行字段相似性和关联性分析得到的;基于所述第一数据表对应的字段关系清单,构建所述第一数据表与第二数据表之间的数据表关联关系图,所述第二数据表为所述关联字段所属的数据表;基于所述数据表关联关系图,为所述第一数据表中的字段和所述第二数据表中的字段赋值,所述第一数据表中字段的值与所述第一数据表中字段对应的关联字段的值一致。2.根据权利要求1所述的数据生成方法,其特征在于,所述多个数据表分别对应的字段关系清单是通过如下方式生成的:获取所述多个数据表的数据表信息,所述数据表信息包括表结构和表内数据;对所述多个数据表的表结构进行特征提取,得到所述多个数据表分别对应的表特征;对所述多个数据表分别对应的表特征进行相似度分析,得到所述多个数据表分别对应的初始关系清单,其中,对于所述多个数据表中的各个数据表,初始关系清单中包括数据表中字段对应的相似关系,相似关系中包括数据表中的字段、数据表中字段对应的相似字段以及数据表中的字段与对应的相似字段之间的相似度;基于所述多个数据表的表内数据,对所述多个数据表分别对应的初始关系清单中字段对应的相似关系进行验证和筛选,得到所述多个数据表分别对应的字段关系清单。3.根据权利要求2所述的数据生成方法,其特征在于,所述对所述多个数据表的表结构进行特征提取,得到所述多个数据表分别对应的表特征,包括:针对所述多个数据表中的各个数据表,按照配置的特征类型,对数据表的表结构进行特征提取,得到数据表在所述特征类型下的表特征,其中,所述特征类型包括如下至少一种:数据表表名、数据表所属业务类型、数据表字段名、数据表字段类型。4.根据权利要求3所述的数据生成方法,其特征在于,所述对所述多个数据表分别对应的表特征进行相似度分析,得到所述多个数据表分别对应的初始关系清单,包括:针对所述多个数据表中的各个数据表,按照特征组合方式,将数据表对应的多个表特征进行组合,得到数据表对应的组合特征;基于所述多个数据表分别对应的多个表特征和所述多个数据表分别对应的组合特征进行字段的相似度识别,得到所述多个数据表之间的字段相似度;根据所述多个数据表之间的字段相似度,得到所述初始关系清单。5.根据权利要求4所述的数据生成方法,其特征在于,所述特征组合方式为多个,不同的特征组合方式对应不同的组合特征,所述不同的组合特征中均包括特征类型为数据表表名的表特征和特征类型为数据表字段名的表特征;所述针对所述多个数据表中的各个数据表,按照特征组合方式,将数据表对应的多个表特征进行组合,得到数据表对应的组合特征,包括:针对所述多个数据表中的各个数据表,按照所述特征组合方式,将数据表对应的多个
表特征中属于不同的特征类型的表特征进行组合,得到数据表对应的多个组合特征。6.根据权利要求4所述的数据生成方法,其特征在于,所述基于所述多个数据表分别对应的多个表...
【专利技术属性】
技术研发人员:盛燕芬,徐彩霞,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。