数据表分组方法及装置、可读存储介质、电子设备制造方法及图纸

技术编号:36577010 阅读:34 留言:0更新日期:2023-02-04 17:35
本公开属于计算机技术领域,涉及一种数据表分组方法及装置、可读存储介质、电子设备。该方法包括:获取与目标业务数据库对应的多个待分组业务数据表,并获取多个待分组业务数据表中的目标数据字段以及与目标数据字段对应的目标字段类型;按照分组维度对目标数据字段进行分组得到字段分组结果,并根据字段分组结果生成聚类输入数据;其中,分组维度由目标数据字段以及目标字段类型确定;对聚类输入数据进行聚类处理得到聚类结果,以根据聚类结果确定多个待分组业务数据表的分组结果。在本公开中,聚类输入数据是根据字段分组结果产生的,进而实现对待分组业务数据表的分组,避免了分组过程中对人工的依赖,提高了获得分组结果的效率以及准确度。效率以及准确度。效率以及准确度。

【技术实现步骤摘要】
数据表分组方法及装置、可读存储介质、电子设备


[0001]本公开涉及计算机
,尤其涉及一种数据表分组方法与数据表分组装置、计算机可读存储介质及电子设备。

技术介绍

[0002]近年来,随着计算机技术的发展,在实现一个业务的过程中会产生大量的数据,基于此,对业务数据库中的业务数据表进行分组,会便于维护该业务的人员对于业务的理解,进而提高业务的处理效率。
[0003]在相关技术中,对业务数据库中的业务数据表进行分组的过程,通常由对业务非常熟悉的人员完成,进而增加了对人工的依赖程度,无法实时的产生对业务数据表的分组结果,进而降低了业务数据表分组的效率,同时,由于人工过程中会出现一些在所难免的错误,进而降低了业务数据表分组的准确度。
[0004]鉴于此,本领域亟需开发一种新的数据表分组方法及装置。
[0005]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开的目的在于提供一种数据表分组方法本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据表分组方法,其特征在于,所述方法包括:获取与目标业务数据库对应的多个待分组业务数据表,并获取多个所述待分组业务数据表中的目标数据字段以及与所述目标数据字段对应的目标字段类型;按照分组维度对所述目标数据字段进行分组得到字段分组结果,并根据所述字段分组结果生成聚类输入数据;其中,所述分组维度由所述目标数据字段以及所述目标字段类型确定;对所述聚类输入数据进行聚类处理得到聚类结果,以根据所述聚类结果确定多个所述待分组业务数据表的分组结果。2.根据权利要求1所述数据表分组方法,其特征在于,所述目标数据字段包括非关系字段;所述按照分组维度对所述目标数据字段进行分组得到字段分组结果,包括:过滤所述目标数据字段中存在的所述非关系字段得到关系字段,并按照分组维度对所述关系字段进行分组得到关系字段分组结果;对所述待分组业务数据表中的所述关系字段分组结果进行统计得到分组统计结果,并基于所述分组统计结果,确定与所述待分组业务数据表对应的字段分组结果。3.根据权利要求2所述数据表分组方法,其特征在于,所述根据所述字段分组结果生成聚类输入数据,包括:计算多个所述待分组业务数据表中同一所述关系字段分组结果的个数得到个数计算结果,对所述个数计算结果进行降序排序得到个数排序结果;基于所述个数排序结果,在所述关系字段分组结果中确定预设个高个数分组结果,并根据所述高个数分组结果生成聚类输入数据。4.根据权利要求3所述的数据表分组方法,其特征在于,所述根据所述高个数分组结果生成聚类输入数据,包括:根据所述高个数分组结果,生成与多个所述待分组业务数据表对应的多个字段行向量,并根据所述多个字段行向量生成聚类输入矩阵。5.根据权利要求4所述的数据表分组方法,其特征在于,所述根据所述高个数分组结果,生成与多个所述待分组业务数据表对应的多个字段行向量,包括:生成与所述高个数分组结果对应的初始字段行向量,并依次对所述待分组业务数据表中的所述关系字段分组结果和所述高个数分组结果进行判断;其中,所述初始行向量中的元素与所述高个数分组结果一一对应;若存在与所述高个数分组结果一致的所述关系字段分组,在所述初始...

【专利技术属性】
技术研发人员:曾文杰
申请(专利权)人:京东科技控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1