一种数据价值评估系统及方法技术方案

技术编号:23289323 阅读:42 留言:0更新日期:2020-02-08 19:03
本申请提供了一种数据价值评估系统及方法,其中,该系统包括:数据获取模块,用于获取企业提供的数据包含的至少一个数据集的重置成本、以及确定该至少一个数据集的数据价值影响值;价值评估模块,用于根据该至少一个数据集的重置成本和数据价值影响值,确定数据的价值评估值。本申请在考虑数据的重置成本的前提下,综合考虑了数据的数据价值影响值,避免了由于数据成本与数据所能带来的收益具有弱对应性而导致的数据价值评估不准确的问题,以实现对数据价值的准确评估。

A data value evaluation system and method

【技术实现步骤摘要】
一种数据价值评估系统及方法
本申请涉及计算机应用
,具体而言,涉及一种数据价值评估系统及方法。
技术介绍
数据已经成为一种同货币或黄金一样的新型经济资产类别。然而,用货币来衡量数据的价值并不容易。如对于某些数据来说,比如征信类数据,单纯论其价值,一般很难说得清楚,但是,对数据进行分析研究以后,很可能从中发掘出巨大的价值。然而,目前对于数据的价值评估仍处于探索阶段,且对数据的社会价值或者使用价值的评估,往往会参照传统资产评估方法,如利用重置成本来衡量企业数据的价值,但由于数据成本与数据所能带来的收益具有弱对应性,直接导致基于传统方法进行数据价值评估的不准确。
技术实现思路
有鉴于此,本申请的目的在于提供一种数据价值评估系统及方法,以提高数据价值评估的准确性。第一方面,本申请实施例提供了一种数据价值评估系统,包括:数据获取模块,用于获取企业提供的数据包含的至少一个数据集的重置成本、以及确定该至少一个数据集的数据价值影响值;价值评估模块,用于根据该至少一个数据集的重置成本和数据价值影响值,确定所述数据的价值评估值。结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述数据获取模块包括重置成本获取单元;所述重置成本获取单元用于:针对所述至少一个数据集中的每个数据集,获取生成该数据集的直接成本、间接成本以及其他成本;基于获取的所述直接成本、所述间接成本以及所述其他成本,确定该数据集的重置成本。结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述数据价值影响值包括数据一致性影响值,所述数据获取模块包括数据一致性确定单元;所述数据一致性确定单元包括:数据一致性获取子单元,用于针对所述至少一个数据集中的每个数据集,获取该数据集所包含的数据内容和该数据集对应的描述信息;数据一致性确定子单元,用于确定所述数据内容与所述描述信息中对应描述的一致性程度;并基于所述一致性程度确定该数据集的数据一致性影响值,且所述一致性程度越高,该数据集的数据一致性影响值越高。结合第一方面的第二种可能的实施方式,本申请实施例提供了第一方面的第三种可能的实施方式,其中,所述数据一致性获取子单元,具体用于针对每个数据集,确定该数据集对应数据文件的第一数据文件大小、以及该数据集对应的描述信息中描述的该数据集对应数据文件的第二数据文件大小;和/或,该数据集的第一数据量大小、以及所述描述信息中描述的该数据集对应的第二数据量大小;和/或,该数据集所包含数据的第一数据类型、以及所述描述信息中描述的该数据集的第二数据类型;数据一致性确定子单元,具体用于基于如下一种或多种一致性确定该数据集的数据一致性影响值:所述第一数据文件大小和所述第二数据文件大小之间的一致性;所述第一数据量大小和所述第二数据量大小之间的一致性;所述第一数据类型和所述第二数据类型之间的一致性;且满足:上述任一种一致性越高,该数据集的数据一致性影响值越高。结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中,所述数据价值影响值包括数据完整性影响值,所述数据获取模块包括数据完整性确定单元;所述数据完整性确定单元包括:数据项统计子单元,用于针对所述至少一个数据集中的每个数据集,统计该数据集中非空的数据项的个数;数据完整性确定子单元,用于基于统计的数据项的非空占比,确定该数据集的数据完整性影响值,并且满足:所述非空占比越高,该数据集的数据完整性影响值越高。结合第一方面,本申请实施例提供了第一方面的第五种可能的实施方式,其中,所述数据价值影响值包括数据冗余度影响值,所述数据获取模块包括数据冗余度确定单元;所述数据冗余度确定单元包括:数据条目统计子单元,用于针对所述至少一个数据集中的每个数据集,统计该数据集数据条目中的重复条目数;数据冗余度确定子单元,用于基于该数据集所包含的重复条目占比,确定该数据集的数据冗余度影响值,并且满足:统计的重复条目越少,该数据集的数据冗余度影响值越高。结合第一方面,本申请实施例提供了第一方面的第六种可能的实施方式,其中,所述数据价值影响值包括数据时效性影响值,所述数据获取模块包括数据时效性确定单元;所述数据时效性确定单元包括:数据时间确定子单元,用于针对所述至少一个数据集中的每个数据集,确定该数据集的终止记录时间、起始记录时间和当前评估时间;数据时效性确定子单元,用于基于确定的所述终止记录时间和所述起始记录时间之间所跨越的时间区间,以及所述起始记录时间和所述当前评估时间之间的时间差,确定该数据集的数据时效性影响值,并且满足:所述时间区间跨度越大,该数据集的数据时效性影响值越高;以及所述时间差越小,该数据集的数据时效性影响值越高。结合第一方面,本申请实施例提供了第一方面的第七种可能的实施方式,其中,所述价值评估模块包括:权重确定单元,用于基于预设算法,确定参与价值评估分析的数据价值影响值的权重,其中,所述参与价值评估分析的数据价值影响值包括:数据一致性影响值、数据完整性影响值、数据冗余度影响值和数据时效性影响值中的至少一种;影响值计算单元,用于针对所述至少一个数据集中的每个数据集,基于确定的权重以及各权重对应的数据价值影响值,计算该数据集的数据价值影响值;价值评估单元,用于根据所述至少一个数据集重置成本和数据价值影响值,确定所述数据的价值评估值。结合第一方面的第七种可能的实施方式,本申请实施例提供了第一方面的第八种可能的实施方式,其中,所述价值评估模块还包括:影响值系数确定单元,用于获取与所述数据属相同领域或具有相似应用场景的相似数据的交易价格、数据成本和数据价值影响值;基于获取的所述交易价格、数据成本和数据价值影响值,确定数据价值影响值系数;所述价值评估单元,具体用于针对所述至少一个数据集中的每个数据集,根据该数据集的数据价值影响值系数、数据价值影响值、重置成本,确定对该数据集的重置成本的调整值;根据该数据集的重置成本和所述调整值,确定该数据集的价值评估值;以及根据所述至少一个数据集的价值评估值确定所述数据的价值评估值。第二方面,本申请实施例还提供了一种数据价值评估方法,包括:获取企业提供的数据包含的至少一个数据集的重置成本、以及确定该至少一个数据集的数据价值影响值;根据该至少一个数据集的重置成本和数据价值影响值,确定所述数据的价值评估值。本申请实施例提供的数据价值评估系统及方法,其数据获取模块,用于获取企业提供的数据包含的至少一个数据集的重置成本、以及确定该至少一个数据集的数据价值影响值;价值评估模块,用于根据该至少一个数据集的重置成本和数据价值影响值,确定所述数据的价值评估值,也即,其在考虑数据的重置成本的前提下,综合考虑了数据的数据价值影响值,避免了由于数据成本与数据所能带来的收益具有弱对应性而导致的数据价值评估不准确的问题,以实现对数据价值的本文档来自技高网...

【技术保护点】
1.一种数据价值评估系统,其特征在于,包括:/n数据获取模块,用于获取企业提供的数据包含的至少一个数据集的重置成本、以及确定该至少一个数据集的数据价值影响值;/n价值评估模块,用于根据该至少一个数据集的重置成本和数据价值影响值,确定所述数据的价值评估值。/n

【技术特征摘要】
1.一种数据价值评估系统,其特征在于,包括:
数据获取模块,用于获取企业提供的数据包含的至少一个数据集的重置成本、以及确定该至少一个数据集的数据价值影响值;
价值评估模块,用于根据该至少一个数据集的重置成本和数据价值影响值,确定所述数据的价值评估值。


2.根据权利要求1所述的系统,其特征在于,所述数据获取模块包括重置成本获取单元;
所述重置成本获取单元用于:
针对所述至少一个数据集中的每个数据集,获取生成该数据集的直接成本、间接成本以及其他成本;
基于获取的所述直接成本、所述间接成本以及所述其他成本,确定该数据集的重置成本。


3.根据权利要求1所述的系统,其特征在于,所述数据价值影响值包括数据一致性影响值,所述数据获取模块包括数据一致性确定单元;所述数据一致性确定单元包括:
数据一致性获取子单元,用于针对所述至少一个数据集中的每个数据集,获取该数据集所包含的数据内容和该数据集对应的描述信息;
数据一致性确定子单元,用于确定所述数据内容与所述描述信息中对应描述的一致性程度;并基于所述一致性程度确定该数据集的数据一致性影响值,且所述一致性程度越高,该数据集的数据一致性影响值越高。


4.根据权利要求3所述的系统,其特征在于,所述数据一致性获取子单元,具体用于针对每个数据集,确定该数据集对应数据文件的第一数据文件大小、以及该数据集对应的描述信息中描述的该数据集对应数据文件的第二数据文件大小;和/或,该数据集的第一数据量大小、以及所述描述信息中描述的该数据集对应的第二数据量大小;和/或,该数据集所包含数据的第一数据类型、以及所述描述信息中描述的该数据集的第二数据类型;
数据一致性确定子单元,具体用于基于如下一种或多种一致性确定该数据集的数据一致性影响值:
所述第一数据文件大小和所述第二数据文件大小之间的一致性;
所述第一数据量大小和所述第二数据量大小之间的一致性;
所述第一数据类型和所述第二数据类型之间的一致性;
且满足:上述任一种一致性越高,该数据集的数据一致性影响值越高。


5.根据权利要求1所述的系统,其特征在于,所述数据价值影响值包括数据完整性影响值,所述数据获取模块包括数据完整性确定单元;所述数据完整性确定单元包括:
数据项统计子单元,用于针对所述至少一个数据集中的每个数据集,统计该数据集中非空的数据项的个数;
数据完整性确定子单元,用于基于统计的数据项的非空占比,确定该数据集的数据完整性影响值,并且满足:所述非空占比越高,该数据集的数据完整性影响值越高。


6.根据权利要求1所述的系统,其特征在于,所述数据价值...

【专利技术属性】
技术研发人员:李然辉吴燕飞阮亚芬夏珺峥
申请(专利权)人:国信优易数据有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1