【技术实现步骤摘要】
一种基于数据指标的综合能源企业数据治理方法及系统
[0001]本专利技术涉及能源企业数据治理领域,尤其涉及一种基于数据指标的综合能源企业数据治理方法及系统。
技术介绍
[0002]企业数字化转型是将企业管理和业务运营相关的流程和数据进行信息化、数字化和智能化的过程,其目标是实现业务数据化、数据业务化的闭环,进而实现业务资源配置可持续发展,实现决策的自动化提效。目前,现有技术更多的是从技术研发的角度来实现数据的开发,在能源企业数据中涉及到数据指标、数据的分析指标较多,数据也呈现多源性,传统方式主要依赖研发人员的开发,忽略了业务人员对数据资产的规则定义、确认、复核等需求,这容易导致研发和业务人员对企业数据资产及处理规则细节均会出现不一致,也会影响业务指标的准确性,数据质量得不到有效保障。
技术实现思路
[0003]本专利技术的目的在于解决
技术介绍
所存在的技术问题,提供一种基于数据指标的综合能源企业数据治理方法及系统,明确了多源数据到目标数据的转换规则、标准及校验机制,让相关权限人员均能参与到数据构建、清洗、治理过 ...
【技术保护点】
【技术特征摘要】
1.一种基于数据指标的综合能源企业数据治理方法,其特征在于:其方法如下:S1、根据业务分析目标创建并定义所对应的属性表集合,属性表集合包括主数据表、指标表、维度表;S2、基于属性表集合构建得到指标数据模型;S3、获取多个数据源根据指标数据模型进行数据融合生成目标业务表,数据融合过程通过融合引擎执行数据采集、数据转换、数据校验和数据融合作业;S4、将目标业务表存入数据库缓冲表中提示进行确认,将确认后数据存储于业务数据库中并发布。2.按照权利要求1所述的一种基于数据指标的综合能源企业数据治理方法,其特征在于:在S1中,属性表集合中各个表的属性对应构建血缘有向图;步骤S2中指标数据模型的指标数据定义包括字段定义、数据的内外部来源定义、从数据源获取入库的转换规则、当前数据版本以及访问权限。3.按照权利要求1所述的一种基于数据指标的综合能源企业数据治理方法,其特征在于:在S3中,指标数据模型的数据采集设置有数据取值规则,数据取值规则为采集存储时所定义的描述语言,指标数据模型的数据采集会根据数据源的来源设定置信度评分表;指标数据模型的数据校验设置有效验约束规则,效验约束规则包括血缘有向图匹配度。4.按照权利要求1所述的一种基于数据指标的综合能源企业数据治理方法,其特征在于:在S4中,目标业务表中列属性对应属性表集合,行属性对应目标业务表中数据融合后的数据,数据库缓冲表根据数据自检得出数据的重复、缺失、错误信息给出确认提示;对于数据的重复情况,根据数据来源构建置信概率表针对不同数据来源的数据赋值置信概率;对于数据的缺失情况,提供数据源所采集的、相关联的原始数据供确认及添加,创建行为记录规则表对数据源、原始数据位置进行记录;对于数据的错误情况,提供数据源所采集的列属性与行属性的原始数据供确认及更正,创建行为记录规则表对数据源、原始数据列属性与行属性映射关系进行记录。5.按照权利要求1所述的一种基于数据指标的综合能源企业数据治理方法,其特征在于:步骤S2中数据融合方法如下:将不同来源的数据源作为不同的数据集,通过支持向量机模型以不同数据集中的数据元作为各支持向量样本按照目标业务表的列属性进行核函数K()的相似性度量并按照如下公式计算加权求和值M...
【专利技术属性】
技术研发人员:高云龙,于瑞雪,李夏光,刘海峰,
申请(专利权)人:国能网信科技北京有限公司徐州天露中矿矿业科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。