一种数据资产估计方法、系统、装置以及数据中台制造方法及图纸

技术编号:37964726 阅读:11 留言:0更新日期:2023-06-30 09:40
本申请公开了一种数据资产估计方法、系统、装置以及数据中台,其中方法包括:确定数据表加工路径,其中,数据表加工路径为将多个初始数据表加工为数据宽表的数据流向;将多个初始数据表作为数据表加工路径的根节点,并将多个初始数据表的成本从根节点向数据表加工路径的下游节点进行分配,得到数据宽表的成本;获取数据宽表的指定评估指标所对应的分数值以及数据宽表的资产回报率,其中,指定评估指标用于描述影响数据宽表的资产价值的因素,资产回报率用于描述数据宽表在使用层面所带来的资产价值;通过数据宽表的成本、分数值、资产回报率确定数据宽表的资产价值,解决了相关技术中,无法对数据中台的数据资产进行评估的技术问题。术问题。术问题。

【技术实现步骤摘要】
一种数据资产估计方法、系统、装置以及数据中台


[0001]本申请涉及到数字化领域,具体而言,涉及一种数据资产估计方法、系统、装置以及数据中台。

技术介绍

[0002]数据中台是一个数据管理体系,包括全局数据仓库规划、数据规范定义、数据建模研发、数据连接萃取、数据运维监测、数据资产管理工具等。数据中台是一个数据集成平台,它不仅仅是为数据分析挖掘而建,它更重要的功能是作为各个服务的数据源,为服务系统提供数据和计算服务,即,数据中台的本质是“数据仓库+数据服务中间件”,然而在相关技术中,数据中台往往仅是作为一个数据库的形式存在,无法对数据中台的数据资产进行评估。

技术实现思路

[0003]本申请实施例提供了一种数据资产估计方法、系统、装置以及数据中台,以至少解决现有技术中无法对数据中台的数据资产进行评估的技术问题。
[0004]根据本申请的一个方面,提供了一种数据资产估计方法,包括:确定数据表加工路径,其中,所述数据表加工路径为将多个初始数据表加工为数据宽表的数据流向;将所述多个初始数据表作为所述数据表加工路径的根节点,并将所述多个初始数据表的成本从所述根节点向所述数据表加工路径的下游节点进行分配,得到所述数据宽表的成本;获取所述数据宽表的指定评估指标所对应的分数值以及所述数据宽表的资产回报率,其中,所述指定评估指标用于描述影响所述数据宽表的资产价值的因素,所述资产回报率用于描述所述数据宽表在使用层面所带来的资产价值;通过所述数据宽表的成本、所述分数值、所述资产回报率确定所述数据宽表的资产价值。r/>[0005]可选地,将所述多个初始数据表的成本从所述根节点向所述数据表加工路径的下游节点进行分配,得到所述数据宽表的成本包括:获取所述数据表加工路径中的第一数据表加工路径,并将所述多个初始数据表的成本从所述根节点向所述第一数据表加工路径的下游节点进行分配,得到第一数据宽表的成本,其中,所述第一数据表加工路径为所述数据表加工路径中经过不同数据加工层的数据表加工路径;获取所述数据表加工路径中的第二数据表加工路径,并将所述多个初始数据表的成本从所述根节点向所述第二数据表加工路径的下游节点进行分配,得到第二数据宽表的成本,其中,所述第二数据表加工路径为同一数据加工层的数据表加工路径;将所述第一数据宽表的成本和所述第二数据宽表的成本,设置为所述数据宽表的成本。
[0006]可选地,获取所述数据表加工路径中的第一数据表加工路径包括:将所述多个初始数据表作为所述第一数据表加工路径的根节点,执行以下循环步骤,直至跳出所述数据宽表所在的数据加工层:通过深度遍历搜索的方式,搜索所述根节点附近具有访问权限的数据表,得到目标数据表,以完成当前数据表加工层的路径搜索;将搜索到的所述目标数据
表作为下一次循环步骤的根节点。
[0007]可选地,获取所述数据表加工路径中的第二数据表加工路径包括:将所述多个初始数据表作为所述第二数据表加工路径的根节点,执行以下循环步骤,直至跳出所述数据宽表所在的数据加工层:向所述根节点的直接下游节点发送递增标签,并通过该递增标签搜索目标数据表,以完成一次数据表加工路径的搜索,其中,所述标签作为访问所述下游节点的依据;将搜索到的所述目标数据表作为下一次循环步骤的根节点。
[0008]可选地,将所述多个初始数据表的成本从所述根节点向所述第二数据表加工路径的下游节点进行分配,得到第二数据宽表的成本包括:计算所述第二数据表加工路径中的指定边集合,其中,所述指定边集合所包括的边可存储成本并在预设条件下释放一次成本,所述指定边集合中包括的边为所述第二数据表加工路径中的一段加工关系;释放所述指定边集合中的成本,并完成向所述下游节点的成本分配;获取所述指定边集合释放成本后的剩余成本与所述第二数据宽表得到的成本之间的比例;通过所述比例,得到所述第二数据宽表的成本。
[0009]可选地,获取所述数据宽表的指定评估指标所对应的分数值包括:通过层次分析法确定所述指定评估指标,其中,所述指定评估指标包括以下至少之一:数据属性指标、数据质量指标、数据应用指标;将所述指定评估指标进行两两比较,得到校验一致性矩阵,并根据所述矩阵得到所述指定评估指标的权重;通过所述指定评估指标的定义确定所述指定评估指标的评分;通过所述指定评估指标的权重和所述指定评估指标的评分的乘积确定所述分数值。
[0010]可选地,获取所述数据宽表的资产回报率包括:通过所述数据宽表的净资产回报值、年度数、风险折现率、数据资产调整系数,确定所述数据宽表的总资产价值,其中,所述净资产回报值为总资产回报值与以下取值的差值:固定资产对总资产的贡献值、流动资产对总资产的贡献值、除待评估数据表之外的其它数据对总资产的贡献值,所述风险折现率通过资本资产定价模型CAMP确定,所述数据资产调整系数取值范围为大于0;设置所述数据宽表的总资产价值与所述多个初始数据表的成本的比值作为所述数据资产回报率。
[0011]可选地,所述数据质量指标包括:数据质量规则触发率、元数据属性完整性、数据引用次数;所述数据应用指标包括:数据输出次数、数据访问次数、数据所在平台访问用户数。
[0012]可选地,通过所述数据宽表的成本、所述分数值、所述资产回报率确定所述数据宽表的资产价值包括:获取所述数据宽表的成本、所述分数值、所述资产回报率的乘积;将所述乘积作为所述数据宽表的资产价值。
[0013]根据本申请的一个方面,还提供了一种数据中台,包括:使用上述方法对数据资产进行估计的模块。
[0014]根据本申请的另一个方面,还提供了一种数据资产估计系统,包括:录入模块,用于录入多个初始数据表的成本;分配模块,用于将所述多个初始数据表作为所述数据表加工路径的根节点,并将所述多个初始数据表的成本从所述根节点向所述数据表加工路径的下游节点进行分配,得到所述数据宽表的成本,其中,所述数据表加工路径为将多个初始数据表加工为数据宽表的数据流向;管理模块,用于获取所述数据宽表的指定评估指标所对应的分数值,其中,所述指定评估指标用于描述影响所述数据宽表的资产价值的因素;处理
模块,用于获取所述数据宽表的资产回报率,所述资产回报率用于描述所述数据宽表在使用层面所带来的资产价值;评估模块,用于通过所述数据宽表的成本、所述分数值、所述资产回报率确定所述数据宽表的资产价值。
[0015]根据本申请的一个方面,还提供了一种数据资产估计装置,包括:确定模块,用于确定数据表加工路径,其中,所述数据表加工路径为将多个初始数据表加工为数据宽表的数据流向;分配模块,用于将所述多个初始数据表作为所述数据表加工路径的根节点,并将所述多个初始数据表的成本从所述根节点向所述数据表加工路径的下游节点进行分配,得到所述数据宽表的成本;第一获取模块,用于获取所述数据宽表的指定评估指标所对应的分数值以及所述数据宽表的资产回报率,其中,所述指定评估指标用于描述影响所述数据宽表的资产价值的因素,所述资产回报率用于描述所述数据宽表在使用层面所带来的资产价值;第二获取模块,用于通过所述数据宽表的成本、本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据资产估计方法,包括:确定数据表加工路径,其中,所述数据表加工路径为将多个初始数据表加工为数据宽表的数据流向;将所述多个初始数据表作为所述数据表加工路径的根节点,并将所述多个初始数据表的成本从所述根节点向所述数据表加工路径的下游节点进行分配,得到所述数据宽表的成本;获取所述数据宽表的指定评估指标所对应的分数值以及所述数据宽表的资产回报率,其中,所述指定评估指标用于描述影响所述数据宽表的资产价值的因素,所述资产回报率用于描述所述数据宽表在使用层面所带来的资产价值;通过所述数据宽表的成本、所述分数值、所述资产回报率确定所述数据宽表的资产价值。2.根据权利要求1所述的方法,其中,将所述多个初始数据表的成本从所述根节点向所述数据表加工路径的下游节点进行分配,得到所述数据宽表的成本包括:获取所述数据表加工路径中的第一数据表加工路径,并将所述多个初始数据表的成本从所述根节点向所述第一数据表加工路径的下游节点进行分配,得到第一数据宽表的成本,其中,所述第一数据表加工路径为所述数据表加工路径中经过不同数据加工层的数据表加工路径;获取所述数据表加工路径中的第二数据表加工路径,并将所述多个初始数据表的成本从所述根节点向所述第二数据表加工路径的下游节点进行分配,得到第二数据宽表的成本,其中,所述第二数据表加工路径为同一数据加工层的数据表加工路径;将所述第一数据宽表的成本和所述第二数据宽表的成本,设置为所述数据宽表的成本。3.根据权利要求2所述的方法,其中,获取所述数据表加工路径中的第一数据表加工路径包括:将所述多个初始数据表作为所述第一数据表加工路径的根节点,执行以下循环步骤,直至跳出所述数据宽表所在的数据加工层:通过深度遍历搜索的方式,搜索所述根节点附近具有访问权限的数据表,得到目标数据表,以完成当前数据表加工层的路径搜索;将搜索到的所述目标数据表作为下一次循环步骤的根节点。4.根据权利要求2所述的方法,其中,获取所述数据表加工路径中的第二数据表加工路径包括:将所述多个初始数据表作为所述第二数据表加工路径的根节点,执行以下循环步骤,直至跳出所述数据宽表所在的数据加工层:向所述根节点的直接下游节点发送递增标签,并通过该递增标签搜索目标数据表,以完成一次数据表加工路径的搜索,其中,所述标签作为访问所述下游节点的依据;将搜索到的所述目标数据表作为下一次循环步骤的根节点。5.根据权利要求4所述的方法,其中,将所述多个初始数据表的成本从所述根节点向所述第二数据表加工路径的下游节点进行分配,得到第二数据宽表的成本包括:计算所述第二数据表加工路径中的指定边集合,其中,所述指定边集合所包括的边可
存储成本并在预设条件下释放一次成本,所述指定边集合中包括的边为所述第二数据表加工路径中的一段加工关系;释放所述指定边集合中的成本,并完成向所述下游节点的成本分配;获取所述指定边集合释放成本后的剩余成本与所述第二数据宽表得到的成本之间的比例;通过所述比例,得到所述第二数据宽表的成本。6.根据权利要求1所述的方法,其中,获取所述数据宽表的指定评估指标所对应的分数值包括:通过层次分析法确定所述指定评估指标,其中,所述指定评估指标包括以下至少之一:数据属性指标、数据质量指标、数据应用指标;将所述指定评估指标进行两两比较...

【专利技术属性】
技术研发人员:李冬青游杰邓镭刘吟啸李铭洋
申请(专利权)人:阿里云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1