System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于源端静态数据建模的数据治理优化方法及系统技术方案_技高网

基于源端静态数据建模的数据治理优化方法及系统技术方案

技术编号:40808619 阅读:14 留言:0更新日期:2024-03-28 19:31
本发明专利技术提供了基于源端静态数据建模的数据治理优化方法及系统,涉及数据处理技术领域,方法包括:通过对初始化源端静态数据集进行数据变更分析,得到基于多个业务模块的多个数据量变更指标对初始化源端静态数据集进行分解,得到多组训练数据集集进行训练,得到多个数据优化子模型,对多个数据优化子模型的模型性能进行评估,得到多个数据优化子模型的性能评估结果对多个数据优化子模型进行更新融合,得到数据融合优化模型进行单核驱动封装,用于对目标企业的数据进行管理。本发明专利技术解决了现有技术中缺乏对源端静态数据建模的内容变更管控,导致数据治理优化效率低的技术问题,实现了对多个模型保持相同的训练数据量,提高数据治理优化效率。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体涉及基于源端静态数据建模的数据治理优化方法及系统


技术介绍

1、随着科学技术的发展,特别是数据治理领域的发展,传统的主数据管理的思想只考虑了数据的共享问题,只初步解决了企业比较关注的各业务系统间的数据孤岛问题,而源端静态数据是企业数据质量的全部所属,数字化转型更需要全面数据质量的支撑,现有传统的主数据建模方法无法满足全面数据质量的管控。

2、现有传统主数据建模只片面的解决了各业务系统共享需要的数据内容的模型,没有考虑到未来由于企业业务系统的新增、变更等造成的主数据内容的变更问题,存在传统主数据的变更使平时的主数据管理运维难度较大,数据治理效率低的技术问题。


技术实现思路

1、本申请提供了基于源端静态数据建模的数据治理优化方法及系统,用于解决现有技术中存在的无法满足全面数据质量的管控不足,缺乏对源端静态数据建模的内容变更管控,导致数据治理优化效率低的技术问题。

2、鉴于上述问题,本申请提供了基于源端静态数据建模的数据治理优化方法及系统。

3、第一方面,本申请提供了基于源端静态数据建模的数据治理优化方法,所述方法包括:获取初始化源端静态数据集,其中,所述初始化源端静态数据集包括目标企业的多个业务模块对应的数据集;通过对所述初始化源端静态数据集进行数据变更分析,得到基于所述多个业务模块的多个数据量变更指标;基于所述多个数据量变更指标对所述初始化源端静态数据集进行分解,得到多组训练数据集,其中,每一组训练数据集的数据量相似度满足预设相似度;根据所述多组训练数据集进行训练,得到多个数据优化子模型,其中,每个数据优化子模型对应一组训练数据集;对所述多个数据优化子模型的模型性能进行评估,得到所述多个数据优化子模型的性能评估结果;根据所述多个数据优化子模型的性能评估结果对所述多个数据优化子模型进行更新融合,得到数据融合优化模型,将所述数据融合优化模型进行单核驱动封装,用于对所述目标企业的数据进行管理。

4、第二方面,本申请提供了基于源端静态数据建模的数据治理优化系统,所述系统包括:第一数据获取模块,所述第一数据获取模块用于获取初始化源端静态数据集,其中,所述初始化源端静态数据集包括目标企业的多个业务模块对应的数据集;第一分析模块,所述第一分析模块用于通过对所述初始化源端静态数据集进行数据变更分析,得到基于所述多个业务模块的多个数据量变更指标;分解模块,所述分解模块用于基于所述多个数据量变更指标对所述初始化源端静态数据集进行分解,得到多组训练数据集,其中,每一组训练数据集的数据量相似度满足预设相似度;第一训练模块,所述第一训练模块用于根据所述多组训练数据集进行训练,得到多个数据优化子模型,其中,每个数据优化子模型对应一组训练数据集;评估模块,所述评估模块用于对所述多个数据优化子模型的模型性能进行评估,得到所述多个数据优化子模型的性能评估结果;更新融合模块,所述更新融合模块用于根据所述多个数据优化子模型的性能评估结果对所述多个数据优化子模型进行更新融合,得到数据融合优化模型,将所述数据融合优化模型进行单核驱动封装,用于对所述目标企业的数据进行管理。

5、本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:

6、本申请提供的基于源端静态数据建模的数据治理优化方法及系统,涉及数据处理
,解决了现有技术中无法满足全面数据质量的管控不足,缺乏对源端静态数据建模的内容变更管控,导致数据治理优化效率低的技术问题,实现了实现了对多个模型保持相同的训练数据量,提高数据治理优化效率。

本文档来自技高网...

【技术保护点】

1.基于源端静态数据建模的数据治理优化方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,根据所述多组训练数据集进行训练,得到多个数据优化子模型,包括:

3.如权利要求2所述的方法,其特征在于,根据预先训练好的数据优化网络对所述多组训练数据集进行训练,得到多个数据优化子模型,包括:

4.如权利要求1所述的方法,其特征在于,根据所述多个数据优化子模型的性能评估结果对所述多个数据优化子模型进行更新融合,包括:

5.如权利要求4所述的方法,其特征在于,当满足第一收敛条件时,输出收敛的多个数据优化子模型,所述第一收敛条件为所述多个数据优化子模型的性能评估结果之间的偏差小于期望偏差;

6.如权利要求1所述的方法,其特征在于,基于所述多个数据量变更指标对所述初始化源端静态数据集进行分解,包括:

7.如权利要求6所述的方法,其特征在于,基于所述多个数据量变更指标对所述初始化源端静态数据集进行分解,还包括:

8.基于源端静态数据建模的数据治理优化系统,其特征在于,所述系统包括:

【技术特征摘要】

1.基于源端静态数据建模的数据治理优化方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,根据所述多组训练数据集进行训练,得到多个数据优化子模型,包括:

3.如权利要求2所述的方法,其特征在于,根据预先训练好的数据优化网络对所述多组训练数据集进行训练,得到多个数据优化子模型,包括:

4.如权利要求1所述的方法,其特征在于,根据所述多个数据优化子模型的性能评估结果对所述多个数据优化子模型进行更新融合,包括:

5.如权利...

【专利技术属性】
技术研发人员:段效亮张娟
申请(专利权)人:山东中翰软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1