一种融合维度模型的指标数据自动化计算方法及装置制造方法及图纸

技术编号:35948943 阅读:13 留言:0更新日期:2022-12-14 10:40
本发明专利技术公开了一种指标体系构建的方法,包括:接收指标定义和管理的需求,定义业务指标;创建数据模型,定义数据模型间的映射关系;以数据模型为基础,构建技术指标体系,关联技术指标与业务指标。本发明专利技术的有益效果是,在业务指标与技术指标间建立起关联,在数据模型与数据指标间建立起关联,通过标准化的数据模型和数据计算模型的定义,将从业务指标定义到指标数据产出的过程实现了数据计算逻辑的系统的可配置化、数据计算代码生成和数据计算任务执行的自动化。提高了业务指标的管理水平,提升了指标数据的产出效率和质量。了指标数据的产出效率和质量。了指标数据的产出效率和质量。

【技术实现步骤摘要】
一种融合维度模型的指标数据自动化计算方法及装置


[0001]本专利技术涉及计算机领域,特别是一种融合维度模型的指标数据自动化计算方法及装置。

技术介绍

[0002]长久以来,企业在信息系统建设和使用的过程中,累积和生产着大量的甚至是海量的业务数据。近些年来,随着大数据技术的迅猛发展和企业数字化转型的需求越来越迫切,很多企业都已开始建设自己的数据中台、大数据处理平台等,依托于数据中台或数据处理平台加工、计算和分析业务数据,以期望挖掘和提炼出业务数据中所蕴藏着的价值,为企业实现以数据驱动经营决策提供支持。
[0003]无论是搭建数据中台,还是建设大数据处理平台,都面临着以下几个难于解决的问题:问题1:业务人员定义业务指标,技术人员将业务指标的计算逻辑实现为程序代码,业务指标与技术指标数据独立存在、缺少关联,难于将业务角度的指标管控与技术角度的实现结合起来;问题2:业务指标的计算逻辑实现为程序代码块,指标数据与数据模型间的关系隐藏在程序代码之中,缺少指标计算逻辑的建模,指标计算逻辑变更难于管理和维护;问题3:指标数据的加工处理越来越依赖大数据技术,大数据技术体系复杂,难于学习和使用,数据项目开发周期长,维护困难。

技术实现思路

[0004]本专利技术的目的是为了解决上述问题,设计了一种融合维度模型的指标数据自动化计算方法及装置。
[0005]实现上述目的本专利技术的技术方案为,一种融合维度模型的指标数据自动化计算方法及装置,包括:接收指标定义和管理的需求,定义业务指标;创建数据模型,定义数据模型间的映射关系;以数据模型为基础,构建技术指标体系,关联技术指标与业务指标。
[0006]所述业务指标的定义包括指标的业务含义、计算公式、统计周期、统计维度、其它业务限定条件限制;指标的业务含义,是对指标在数据统计和分析方面的业务规则和业务意义的描述;指标的计算公式,是以计算表达式的方式定义如何加工和计算指标数据;指标的统计周期,是对指标计算的时间条件的限定;指标的统计维度,是对指标统计的业务实体对象、地域范围、业务类别类型等数据范围的定义;
其它业务限定条件限制,是对统计周期和统计维度之外的其它统计数据过滤条件的描述。
[0007]所述创建数据模型包括五种类型的数据表:贴源层表、整合层表、维度表、事实明细表、维度汇总表,这五种类型的数据模型构成了数据在数据平台内流通和转换的基础架构。
[0008]所述贴源层表用来对接业务应用数据,其表定义与业务应用系统的数据模型基本保持一致,在数据集成过程中作为目标端表,接收业务应用系统的数据。
[0009]整合层表以业务流程或活动为视角,对贴源层表进行汇聚和连接;汇聚是指将业务流程或活动一致、数据结构相似、数据范围不同的多张贴源层数据表识别出来,为这些贴源层表创建通用数据结构的整合层表;连接是指将同一业务流程或活动中相关的多张贴源层数据表识别出来,为这些贴源层表创建数据结构连接后的整合层表。汇聚意在将相同业务流程或活动、不同业务范围的数据合并到一起;连接意在将同一业务流程或活动、不同业务节点的数据合并到一起;在对贴源层表的数据模型进行汇聚和连接的基础上,整合层表对贴源层表的数据同时进行转储、加工和计算,即整合层的数据来源于贴源层,这通过定义整合层表与贴源层表间的数据映射关系实现。
[0010]所述数据映射的关系具体包括:定义映射关系中的目标表和来源表,定义来源表之间的连接关系;定义与目标表各字段相映射的来源表的字段,以及对来源表字段的加工计算逻辑。
[0011]所述维度描述了指标统计的业务实体对象、地域范围、业务类别类型等,是对指标数据进行统计和分析的视角。维度表定义了维度的数据模型,包括代理键、业务主键和维度属性等不同类型的字段;所述维度表的代理键是维度表的物理主键,唯一标识一条维度表记录;维度表的业务主键是维度实体的唯一业务标识,维度属性是维度实体的属性信息,在维度实体的属性信息变更后,维度表内会记录维度实体的新旧两条信息,两条记录的业务主键相同,代理键不同;维度表的数据来源可以是业务应用数据,这通过数据集成实现;也可以是贴源层数据,这通过定义维度表与贴源层表的数据映射关系实现。关于数据映射关系,详见前文的阐述。
[0012]所述事实明细表是将整合层表与维度表进行关联,明确整合层业务流程或活动视角的数据进行指标数据分析和统计的维度。事实明细表构建起星型模型或雪花模型,满足业务指标多维度统计分析的需要;在贴源层表能够对业务流程或活动的表达完整的条件下,事实明细表也可将贴源层表与维度表进行关联,构建星型模型或雪花模型;所述事实明细表包括度量属性和维度属性,度量属性是可进行数据分析和统计的属性,维度属性是进行维度表关联的属性;事实明细表的数据来源于对贴源层表、整合层表和维度表的转储、加工和计算,这通过定义事实表与贴源层表、整合层表、维度表间的数据映射关系来实现。
[0013]在进行数据模型建模之前,可为数据模型中使用到的通用属性预先定义数据元标
准,通过对数据元的标准化定义,保证通用属性在各数据模型中的数据类型、数据长度、数据精度等定义的一致性。
[0014]所述所述技术指标体系包括原子指标、衍生指标、复合指标三种类型的指标定义和时间限定的基础信息。
[0015]所述以明细事实表为基础,创建原子指标。原子指标定义的是对事实明细表度量字段的以聚合计算为主的计算逻辑。
[0016]所述在原子指标上叠加统计维度、统计周期和其它业务限定条件的限定,创建衍生指标。衍生指标定义的是有着完整业务含义的对业务数据进行分析统计的计算逻辑。在原子指标上叠加的统计维度必须是原子指标所依赖的事实明细表已关联的维度表,在原子指标上叠加的统计周期,也必须指定其所对应的明细事实表的日期型字段;衍生指标指定的统计维度可以是由单一维度表构成,也可由多张维度表组合而成,为明确其含义,以下统称为指标的“统计维度(组)”,统计维度(组),是指标数据汇总的范围和边界。
[0017]对于同一统计维度(组)范围内的衍生指标,指定相互间加减乘除的运算逻辑,创建复合指标。复合指标定义的是对衍生指标的再加工,主要适用于相同统计维度(组)、不同明细事实表间的指标数据的计算,以实现不同业务流程或活动间横向的数据联合统计和分析。
[0018]所述时间限定是以某一时间点为基准,界定了用于指标数据计算的业务数据的时间区间,是对指标数据统计周期的标准化定义。
[0019]将衍生指标、复合指标关联到已定义好的业务指标,建立起业务指标与技术指标的关联关系。
[0020]所述将同一统计维度(组)范围内的衍生指标和复合指标全部或者部分汇总到一起,创建维度汇总表,维度汇总表定义的是统计维度视角的指标数据的集合。维度汇总表由维度属性和指标属性构成,维度属性包括统计维度(组)中各维度表的所有维度属性,指标属性包括衍生指标和复合指标。
[0021]一种数据指标计算的方法,包括:将数据模型物理化到数据存储组件中;将数据模型间的映射关系生成数据映射计算本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种指标体系构建的方法,其特征在于,包括:接收指标定义和管理的需求,定义业务指标;创建数据模型,定义数据模型间的映射关系;以数据模型为基础,构建技术指标体系,关联技术指标与业务指标。2.根据权利要求1所述的一种指标体系构建的方法,其特征在于,所述业务指标的定义包括指标的业务含义、计算公式、统计周期、统计维度、其它业务限定条件限制;指标的业务含义,是对指标在数据统计和分析方面的业务规则和业务意义的描述;指标的计算公式,是以计算表达式的方式定义如何加工和计算指标数据;指标的统计周期,是对指标计算的时间条件的限定;指标的统计维度,是对指标统计的业务实体对象、地域范围、业务类别类型等数据范围的定义;其它业务限定条件限制,是对统计周期和统计维度之外的其它统计数据过滤条件的描述。3.根据权利要求1所述的一种指标体系构建的方法,其特征在于,所述创建数据模型包括五种类型的数据表:贴源层表、整合层表、维度表、事实明细表、维度汇总表,这五种类型的数据模型构成了数据在数据平台内流通和转换的基础架构;所述贴源层表用来对接业务应用数据,其表定义与业务应用系统的数据模型基本保持一致,在数据集成过程中作为目标端表,接收业务应用系统的数据;整合层表以业务流程或活动为视角,对贴源层表进行汇聚和连接;汇聚是指将业务流程或活动一致、数据结构相似、数据范围不同的多张贴源层数据表识别出来,为这些贴源层表创建通用数据结构的整合层表;连接是指将同一业务流程或活动中相关的多张贴源层数据表识别出来,为这些贴源层表创建数据结构连接后的整合层表;汇聚意在将相同业务流程或活动、不同业务范围的数据合并到一起;连接意在将同一业务流程或活动、不同业务节点的数据合并到一起;在对贴源层表的数据模型进行汇聚和连接的基础上,整合层表对贴源层表的数据同时进行转储、加工和计算,即整合层的数据来源于贴源层,这通过定义整合层表与贴源层表间的数据映射关系实现;所述数据映射的关系具体包括:定义映射关系中的目标表和来源表,定义来源表之间的连接关系;定义与目标表各字段相映射的来源表的字段,以及对来源表字段的加工计算逻辑;所述维度描述了指标统计的业务实体对象、地域范围、业务类别类型等,是对指标数据进行统计和分析的视角;维度表定义了维度的数据模型,包括代理键、业务主键和维度属性等不同类型的字段;所述维度表的代理键是维度表的物理主键,唯一标识一条维度表记录;维度表的业务主键是维度实体的唯一业务标识,维度属性是维度实体的属性信息,在维度实体的属性信息变更后,维度表内会记录维度实体的新旧两条信息,两条记录的业务主键相同,代理键不同;维度表的数据来源可以是业务应用数据,这通过数据集成实现;也可以是贴源层数据,这通过定义维度表与贴源层表的数据映射关系实现;关于数据映射关系,详见前文的阐述;
所述事实明细表是将整合层表与维度表进行关联,明确整合层业务流程或活动视角的数据进行指标数据分析和统计的维度;事实明细表构建起星型模型或雪花模型,满足业务指标多维度统计分析的需要;在贴源层表能够对业务流程或活动的表达完整的条件下,事实明细表也可将贴源层表与维度表进行关联,构建星型模型或雪花模型;所述事实明细表包括度量属性和维度属性,度量属性是可进行数据分析和统计的属性,维度属性是进行维度表关联的属性;事实明细表的数据来源于对贴源层表、整合层表和维度表的转储、加工和计算,这通过定义事实表与贴源层表、整合层表、维度表间的数据映射关系来实现;在进行数据模型建模之前,可为数据模型中使用到的通用属性预先定义数据元标准,通过对数据元的标准化定义,保证通用属性在各数据模型中的数据类型、数据长度、数据精度等定义的一致性。4.根据权利要求1所述的一种指标体系构建的方法,其特征在于,所述所述技术指标体系包括原子指标、衍生指标、复合指标三种类型的指标定义和时间限定的基础信息;所述以明细事实表为基础,创建原子指标;原子指标定义的是对事实明细表度量字段的以聚合计算为主的计算逻辑;所述在原子指标上叠加统计维度、统计周期和其它业务限定条件的限定,创建衍生指标;衍生指标定义的是有着完整业务含义的对业务数据进行分析统计的计算逻辑;在原子指标上叠加的统计维度必须是原子指标所依赖的事实明细表已关联的维度表,在原子指标上叠加的统计周期,也必须指定其所对应的明细事实表的日期型字段;衍生指标指定的统计维度可以是由单一维度表构成,也可由多张维度表组合而成,为明确其含义,以下统称为指标的“统计维度(组)”,统计维度(组),是指标数据汇总的范围和边界;对于同一统计维度(组)范围内的衍生指标,指定相互间加减乘除的运算逻辑,创建复合指标;复合指标定义的是对衍生指标的再加工,主要适用于相同统计维度(组)、不同明细事实表间的指标数据的计算,以实现不同业务流程或活动间横向的数据联合统计和分析;所述时间限定是以某一时间点为基准,界定了用于指标数据计算的业务数据的时间区间,是对指标数据统计周期的标准化定义;将衍生指标、复合指标关联到已定义好的业务指标,建立起业务指标与技术指标的关联关系;所述将同一统计维度(组)范围内的衍生指标...

【专利技术属性】
技术研发人员:兰勇孙松涛李艳娇王兰石琳
申请(专利权)人:信华信技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1