一种数据价值评估系统以及方法技术方案

技术编号:23289322 阅读:45 留言:0更新日期:2020-02-08 19:03
本申请提供了一种数据价值评估系统以及方法,其中数据价值评估系统包括:数据获取模块,用于获取待评估数据;指标值确定模块,用于为所述待评估数据确定价值评估指标的指标值;其中,所述价值评估指标包括如下指标类型中任意指标类型包含的至少一个指标:表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标;价值评估模块,用于将确定的所述价值评估指标的指标值输入预先构建的数据价值评估模型,得到所述待评估数据的评估价值。该数据价值评估系统在对对数据价值的估价过程中受到人为主观因素影响小,能够较为客观、准确的得到业务数据的估价结果。

A data value evaluation system and method

【技术实现步骤摘要】
一种数据价值评估系统以及方法
本申请涉及数据估价
,具体而言,涉及一种数据价值评估系统以及方法。
技术介绍
在数字信息飞速发展的今天,数据对企业的影响日益增强,越来越多的企业需要“用数据说话”。对企业来说,无形资产占有的比重越来越大,除了专利、软件著作权、商标等知识产权等无形资产,业务数据这种无形资产的重要性不容小觑。业务数据的价值有时直接决定企业的价值。数据在交易之前,无论是数据的出售方还是数据的购买方,都会按照一定的方法对待交易数据进行定价。但是目前的数据价值评估方法由人为参与的因素较多;例如数据的购买方可能会由于数据对其的重要程度,过高的对数据进行估价;或者数据的出售方会由于各种人为的原因对数据进行错误的估价。这就造成数据的定价结果不够客观、准确,影响数据交易双方的利益。
技术实现思路
有鉴于此,本申请实施例的目的在于提供一种数据价值评估系统以及方法,在对数据估价过程中受到人为主观因素影响小,能够较为客观、准确的得到业务数据的估价结果。第一方面,本申请实施例提供了一种数据价值评估系统,该系统包括:本文档来自技高网...

【技术保护点】
1.一种数据价值评估系统,其特征在于,该系统包括:/n数据获取模块,用于获取待评估数据;/n指标值确定模块,用于为所述待评估数据确定价值评估指标的指标值;/n其中,所述价值评估指标包括如下指标类型中任意指标类型包含的至少一个指标:表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标;/n价值评估模块,用于将确定的所述价值评估指标的指标值输入预先构建的数据价值评估模型,得到所述待评估数据的评估价值。/n

【技术特征摘要】
1.一种数据价值评估系统,其特征在于,该系统包括:
数据获取模块,用于获取待评估数据;
指标值确定模块,用于为所述待评估数据确定价值评估指标的指标值;
其中,所述价值评估指标包括如下指标类型中任意指标类型包含的至少一个指标:表征数据自身价值的指标、表征数据市场影响因素的指标、以及表征市场竞争影响因素的指标;
价值评估模块,用于将确定的所述价值评估指标的指标值输入预先构建的数据价值评估模型,得到所述待评估数据的评估价值。


2.根据权利要求1所述的系统,其特征在于,所述表征数据自身价值的指标包括:数据一致性指标、数据完整性指标、数据冗余度指标、数据时效性指标、数据量指标、数据领域分类指标、应用场景指标、以及权益性质指标中一种或多种;
所述表征数据市场影响因素的指标包括:数据稀缺性指标、数据市场的供求紧张程度指标中至少一种;
所述表征市场竞争影响因素的指标包括:数据市场竞争程度指标。


3.根据权利要求2所述的系统,其特征在于:
针对所述表征数据自身价值的指标包括数据一致性指标的情况,所述待评估数据包括:数据内容以及所述待评估数据对应的描述信息;
所述指标值确定模块,具体用于确定所述待评估数据所包含数据内容与所述待评估数据对应描述信息的一致性程度;并基于所述一致性程度确定所述待评估数据在数据一致性指标下的指标值,且所述一致性程度越高,表征所述待评估数据在数据一致性指标下的指标值越高;
针对所述表征数据自身价值的指标包括数据完整性指标的情况,
所述指标值确定模块,具体用于确定所述待评估数据所包含数据条目中的空值占比;并基于所述空值占比确定所述待评估数据在数据完整性指标下的指标值,且所述空值占比越低,表征所述待评估数据的数据完整性越高;
针对所述表征数据自身价值的指标包括数据冗余度指标的情况,
所述指标值确定模块,具体用于确定所述待评估数据所包含的数据条目中重复条目的占比;并基于所述重复条目的占比确定所述待评估数据在数据冗余度指标下的指标值,且所述重复条目的占比越低,表征所述待评估数据的数据冗余度越低;
针对所述表征数据自身价值的指标包括数据时效性指标的情况,
所述指标值确定模块,具体用于确定所述待评估数据开始产生时间终止产生时间之间所跨越的时间区间,以及所述待评估数据开始产生时间与所述待评估数据提供时间之间的时间差;基于所述时间区间和所述时间差确定所述待评估数据在数据时效性指标下的指标值;其中,所述时间区间跨度越大,表征所述待评估数据在数据时效性指标下的指标值越高;以及所述时间差越小,表征所述待评估数据在数据时效性指标下的指标值越高;
针对所述表征数据自身价值的指标包括数据量指标的情况,
所述指标值确定模块,具体用于确定所述待评估数据包含的数据量;并基于所述数据量确定所述待评估数据在数据量指标下的指标值,且所述数据量越大,表征所述待评估数据在数据量指标下的指标值越高;
针对所述表征数据自身价值的指标包括数据领域分类指标的情况,
所述指标值确定模块,具体用于确定所述待评估数据所属数据集对应的行业领域标签数量与所述待评估数据所属数据类别对应的行业领域标签数量的比值;并基于所述比值确定所述待评估数据领域分类指标的指标值,且所述比值越大,表征所述待评估数据的领域分类指标的指标值越大;
针对所述表征数据自身价值的指标包括应用场景指标的情况,
所述指标值确定模块,具体用于根据所述待评估数据能够应用的场景个数,确定所述待评估数据在应用场景指标下的指标值;且所述待评估数据能够应用的场景越多,表征所述待评估数据在所述应用场景指标下的指标值越高;
针对所述表征数据自身价值的指标包括权益性质指标的情况,
所述指标值确定模块,具体用于根据所述待评估数据的可交易性,确定所述待评估数据在权益性质指标下的指标值;且所述待评估数据的可交易性为可以交易时所述待评估数据在所述权益性指标下的指标值,高于所述待评估数据的可交易性为不可交易时所述待评估数据在所述权益性指标下的指标值。


4.根据权利要求2所述的系统,其特征在于,
针对所述表征数据市场影响因素的指标包括数据稀缺性指标的情况,
所述数据获取模块,还用于:从预设平台爬取多个数据集;
所述系统,还包括:相似数据确定模块;
所述相似数据确定模块,用于分别对所述待评估数据及所述多个数据集进行解析,确定出所述待评估数据及各数据集的词汇特征;将所述待评估数据的词汇特征分别与各数据集的词汇特征进行文本相似度匹配;将文本相似度达到预设相似度阈值的数据集确定为所述待评估数据的相似数据;或者
用于确定所述待评估数据及所述多个数据集的属性标签信息;分别确定所述待评估数据的属性标签信息与各数据集的属性标签信息相似度;将属性标签相似度满足预设属性相似度阈值的数据集,确定为所述待评估数据的相似数据;
所述指标值确定模块,具体用于确定所述待评估数据以及与所述待评估数据相似的相似数据在预设平台的出现次数;并基于所述出现次数确定所述待评估数据在数据稀缺性指标下的指标值,且所述出现次数越少,表征所述待评估数据的稀缺性越高;
针对所述表征数据市场影响因素的指标包括数据市场的供求紧张程度指标的情况,
所述指标值确定模块,具体用于确定所述待评估数据和/或与所述待评估数据相似的相似数据在第一历史时间段的第一成交量;以及所述待评估数据和/或与所述待评估数据相似的相似数据在多个第二历史时间段的平均第二成交量;基于所述第一成交量和所述平均第二成交量,确定所述待评估数据在所述供求紧张程度指标下的指标值,且所述第一成交量越高,和/或所述平均第二成交量越低,表征所述待评估数据的供求紧张程度越高。


5.根据权利要求1所述的系统,其特征在于,针对所述数据市场竞争程度指标,
所述指标值确定模块,具体用于确定提供所述待评估数据的企业所属行业;确定属于所述行业的各企业在数据交易业务上分别所占市场份额;基于由大到小前预设数量市场份额的和值,确定所述数据市场竞争程度指标的指标值,且所述和值越大,表征所述数据市场竞争程度指标的指标值越大。


6.根据权利要求5所述的系统,其特征在于,所述指标值确定模块,具体用于确定所述各企业中每个企业在预设历史时间段内数据交易业务对应的数据成交量;并基于每个企业对应的数据成交量与各企业对应的数据成交总量的比值,分别确定每个企业在数据交易业务上所占市场份额;确定由大到小前预设数量的市场份额的和值,且满足前预设数量加一的市场份额的和值与前预设数量的市场份额的和值相比,增幅未达到预设增幅阈值。


7.根据权利要求1所述的系统,其特征在于,还包括:数据价值评估模型训练模块;
所述数据价值评估模型训练模块,用于将所述价值评估指标作为自变量,将数据评估价值作为因变量构建数据价值评估模型;
所述数据获取模块,还用于获取训练数据;
所述指标值确定模块,还用于确...

【专利技术属性】
技术研发人员:吴燕飞阮亚芬段立新李彩虹
申请(专利权)人:国信优易数据有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1