数据资产评估方法和装置制造方法及图纸

技术编号:35329042 阅读:13 留言:0更新日期:2022-10-26 11:45
本公开公开了一种数据资产评估方法和装置,涉及大数据处理及应用领域。该方法包括:抽取待评估数据的数据特征;将待评估数据的数据特征输入至训练好的价值评估模型,得到待评估数据对应的价值初始值;获取待评估数据之间的数据血缘关系;以及基于数据血缘关系,对价值初始值进行更新,得到待评估数据的价值最终值。本公开不仅减少了工程量和繁琐步骤,并且,由于考虑了数据之间的关联关系,使得数据资产价值评估更客观、更公正。更公正。更公正。

【技术实现步骤摘要】
数据资产评估方法和装置


[0001]本公开涉及大数据处理及应用领域,尤其涉及一种数据资产评估方法和装置。

技术介绍

[0002]数据资产是指由企业拥有或者控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录的数据资源,如文件资料、电子数据等。数据资产价值评估是使数据的内在价值和使用价值有一个可操作的量化指标,评估结果是数据交易的基础,同时也可以优化数据运营生成的流程和资源配置。
[0003]目前无形资产已形成了一套较为完善的评估体系,主要有成本法、市场法、收益折现法等。虽然数据资产也属于无形资产,但是由于数据资产的评估标准和影响因素与一般无形资产相差很大,因此无形资产的价值评估算法不能完全应用到数据资产价值评估当中去。同时,相同的数据资产,由于其应用领域、使用方法、获利方式的不同,会造成其价值差异。这些都导致数据资产价值评估工作的复杂性和难度更大。
[0004]由于数据资产价值受到越来越广泛的关注,数据资产价值评估作为数据资产价值的生命线,是数据资产发挥价值的基础,亟需开展数据资产价值评估工作以提升数据增值运营水平。
[0005]当前对数据资产价值评估的算法主要包括层次分析法,但使用层次分析法进行数据资产价值估算,工作量繁重,主观性也较强。该方法需要数据专家对每份数据下成本、固有价值、市场价值以及环境因素四个主因素下的多个影响因素构造比较判断矩阵以及评分。
[0006]另外,目前所有的数据价值评估都只考虑了数据本身的特性,导致不同数据之间的评估结果往往缺乏可比较性;另一方面,数据的价值常随时间变化,对关联数据的影响,也无法在独立评估过程中体现出来。

技术实现思路

[0007]本公开要解决的一个技术问题是,提供一种数据资产评估方法和装置,能够减少工程量和繁琐步骤,并且,由于考虑了数据之间的关联关系,使得数据资产价值评估更客观、更公正。
[0008]根据本公开一方面,提出一种数据资产评估方法,包括:抽取待评估数据的数据特征;将待评估数据的数据特征输入至训练好的价值评估模型,得到待评估数据对应的价值初始值;获取待评估数据之间的数据血缘关系;以及基于数据血缘关系,对价值初始值进行更新,得到待评估数据的价值最终值。
[0009]在一些实施例中,基于数据血缘关系,对价值初始值进行更新,得到待评估数据的价值最终值包括:根据待评估数据与生成待评估数据的父数据之间的最小血缘距离,计算待评估数据相对于父数据的权重函数值;基于数据血缘关系,对价值初始值进行迭代更新计算,得到待评估数据的价值临时值;利用权重函数值,对价值临时值进行加权平均计算,
得到价值加权值;以及判断迭代更新计算是否满足收敛条件或者达到设定的迭代次数,若是,则将价值加权值作为价值最终值。
[0010]在一些实施例中,利用公式计算待评估数据相对于父数据的权重函数值,其中,
x
为待评估数据与父数据之间的最小血缘距离,
wd
为权重函数值。
[0011]在一些实施例中,利用公对价值初始值进行迭代更新计算,其中,为待评估数据的价值临时值,
Bd
为生成待评估数据的父数据的集合,
Lj
为父数据的生成数据数,
r
为传播系数。
[0012]在一些实施例中,数据特征包括数据成本特征、数据质量特征和数据应用特征中的一项或多项。
[0013]在一些实施例中,数据成本特征包括数据存储量大小、数据运维人员人数、数据传输成本、数据运维成本、数据采集成本中的一项或多项;数据质量特征包括数据量、数据维度大小、数据一致性、数据准确性、数据延时时长、数据更新频率中的一项或多项;以及数据应用特征包括数据时效性、数据影响度、数据多源性、数据使用频次、数据使用部门、数据使用业务个数、数据拥有者数量中的一项或多项。
[0014]在一些实施例中,获取样本数据和样本数据对应的标签值,其中,标签值为价值;抽取样本数据的数据特征;以及利用样本数据的数据特征和标签值,训练回归模型,得到价值评估模型。
[0015]在一些实施例中,将标签值进行归一化处理。
[0016]在一些实施例中,样本数据包括数据交易合同中的数据,以及通过层次法进行价值评估的业务数据中的一种或多种。
[0017]根据本公开的另一方面,还提出一种数据资产评估装置,包括:特征抽取单元,被配置为抽取待评估数据的数据特征;初始值预测单元,被配置为将待评估数据的数据特征输入至训练好的价值评估模型,得到待评估数据对应的价值初始值;血缘关系获取单元,被配置为获取待评估数据之间的数据血缘关系;以及价值确定单元,被配置为基于数据血缘关系,对价值初始值进行更新,得到待评估数据的价值最终值。
[0018]在一些实施例中,价值确定单元被配置为根据待评估数据与生成待评估数据的父数据之间的最小血缘距离,计算待评估数据相对于父数据的权重函数值;基于数据血缘关系,对价值初始值进行迭代更新计算,得到待评估数据的价值临时值;利用权重函数值,对价值临时值进行加权平均计算,得到价值加权值;以及判断迭代更新计算是否满足收敛条件或者达到设定的迭代次数,若是,则将价值加权值作为价值最终值。
[0019]根据本公开的另一方面,还提出一种数据资产评估装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器的指令执行如上述的数据资产评估方法。
[0020]根据本公开的另一方面,还提出一种非瞬时性计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现上述的数据资产评估方法。
[0021]本公开实施例中,利用训练好的价值评估模型对待评估数据进行预测及设置初始值,然后基于数据血缘关系,对数据资产价值的初始值进行更新。不仅减少了工程量和繁琐
步骤,并且,由于考虑了数据之间的关联关系,使得数据资产价值评估更客观、更公正。
[0022]通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
[0023]构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
[0024]参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
[0025]图1为本公开的数据资产评估方法的一些实施例的流程示意图。
[0026]图2为本公开的数据资产评估方法的另一些实施例的流程示意图。
[0027]图3为本公开的数据资产评估装置的一些实施例的结构示意图。
[0028]图4为本公开的数据资产评估装置的另一些实施例的结构示意图。
[0029]图5为本公开的数据资产评估装置的另一些实施例的结构示意图。
具体实施方式
[0030]现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
[0031]同时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据资产评估方法,包括:抽取待评估数据的数据特征;将所述待评估数据的数据特征输入至训练好的价值评估模型,得到所述待评估数据对应的价值初始值;获取所述待评估数据之间的数据血缘关系;以及基于所述数据血缘关系,对所述价值初始值进行更新,得到所述待评估数据的价值最终值。2.根据权利要求1所述的数据资产评估方法,其中,基于所述数据血缘关系,对所述价值初始值进行更新,得到所述待评估数据的价值最终值包括:根据所述待评估数据与生成所述待评估数据的父数据之间的最小血缘距离,计算所述待评估数据相对于所述父数据的权重函数值;基于所述数据血缘关系,对所述价值初始值进行迭代更新计算,得到所述待评估数据的价值临时值;利用所述权重函数值,对所述价值临时值进行加权平均计算,得到价值加权值;以及判断所述迭代更新计算是否满足收敛条件或者达到设定的迭代次数,若是,则将所述价值加权值作为所述价值最终值。3.根据权利要求2所述的数据资产评估方法,其中,利用公式计算所述待评估数据相对于所述父数据的权重函数值,其中,x为所述待评估数据与所述父数据之间的最小血缘距离,w
d
为所述权重函数值。4.根据权利要求2所述的数据资产评估方法,其中,利用公4.根据权利要求2所述的数据资产评估方法,其中,利用公对所述价值初始值进行迭代更新计算,其中,为所述待评估数据的价值临时值,B
d
为生成所述待评估数据的父数据的集合,L
j
为父数据的生成数据数,r为传播系数。5.根据权利要求1至4任一所述的数据资产评估方法,其中,所述数据特征包括数据成本特征、数据质量特征和数据应用特征中的一项或多项。6.根据权利要求5所述的数据资产评估方法,其中,所述数据成本特征包括数据存储量大小、数据运维人员人数、数据传输成本、数据运维成本、数据采集成本中的一项或多项;所述数据质量特征包括数据量、数据维度大小、数据一致性、数据准确性、数据延时时长、数据更新频率中的一项或多项;以及所述数据...

【专利技术属性】
技术研发人员:付华峥陈康刘春郑永坤陈翀
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1