一种基于隐私计算数据探查的数据定价系统和方法技术方案

技术编号:34177867 阅读:15 留言:0更新日期:2022-07-17 12:21
本发明专利技术公开了一种基于隐私计算数据探查的数据定价系统和方法,涉及数据交易技术领域,包括数据初始化模块、资产匹配模块、资产价值评估模块、资产定价模块以及资产消费模块;数据定价系统接收外部输入的数据至数据初始化模块中,数据初始化模块的输出端信号连接在资产匹配模块的输入端,资产匹配模块的输出端信号连接在资产价值评估模块的输入端,资产价值评估模块的输出端信号连接在资产定价模块的输入端,资产定价模块与资产消费模块进行双向信号连接。在隐私计算技术的加持下,数据可以有效的实现使用权与所有权的分离,可以基于数据实用价值进行资产定价,同时可以收集到数据资产在真实消费场景的反馈情况,有效地矫正数据价值和定价。数据价值和定价。数据价值和定价。

【技术实现步骤摘要】
一种基于隐私计算数据探查的数据定价系统和方法


[0001]本专利技术涉及数据交易
,具体为一种基于隐私计算数据探查的数据定价系统和方法。

技术介绍

[0002]数据交易逐步成为市场的一种行为。数据交易的前提是数据定价,影响数据定价的因素较多,包括数据品种、时间跨度、数据深度、数据完整性、数据样本量及数据实时性等。同时,数据价值对于不同客户的不同场景,价值量也有巨大的差异;如何构建一套有效的、可实操的数据价值评估和定价机制是当务之急。
[0003]现有技术中,大多数数据定价仅仅停留在宏观层面,例如:通过大数据的元数据的准确的、完整性等一系列评估定价,通过合理建立层次结构模型,利用AHP分析法,求得各定价策略的权重,从而对数据资产评估定价;这些数据定价方式基本处于数据消费之前对数据估价,但往往数据的价值在不同的消费场景差异巨大,这是现有数据定价普遍存在的一个问题。
[0004]为了解决上述问题,我们提出了一种基于隐私计算数据探查的数据定价系统和方法。

技术实现思路

[0005]针对现有技术的不足,本专利技术提供了一种基于隐私计算数据探查的数据定价系统和方法,以解决上述
技术介绍
中提出的问题。
[0006]为实现上述目的,本专利技术提供如下技术方案:一种基于隐私计算数据探查的数据定价系统,在隐私安全计算背景下实现数据资产价值评估及定价功能,包括数据初始化模块、资产匹配模块、资产价值评估模块、资产定价模块以及资产消费模块;所述数据定价系统接收外部输入的数据至数据初始化模块中,所述数据初始化模块的输出端信号连接在资产匹配模块的输入端,所述资产匹配模块的输出端信号连接在资产价值评估模块的输入端,所述资产价值评估模块的输出端信号连接在资产定价模块的输入端,所述资产定价模块与资产消费模块进行双向信号连接;
[0007]所述数据初始化模块,用于对需要进行定价的数据进行初始化,并将整个数据定价体系中唯一的标识赋予待定价数据;
[0008]所述资产匹配模块,基于交易双方约定的数据主键字段隐私求交,得到联合样本集;
[0009]所述资产价值评估模块,用于评估目标字段与双方输入字段的有效性、相关性以及贡献度在内的价值指标;
[0010]所述资产定价模块,用于给出每条数据资产的估价;
[0011]所述资产消费模块,用于提供隐私计算消费场景中的消费数据资产。
[0012]进一步优化本技术方案,所述数据初始化模块对数据中的敏感字段名称进行脱敏
处理,包括性别、年龄的字段,分别使用x1,x2进行替换,并对数据的更新频率、实效性、覆盖率以及主键构成方式进行说明。
[0013]进一步优化本技术方案,所述资产匹配模块用于数据需求方上传自己的数据,并用于配置双方数据的求交字段,指定求交后样本表的字段,同时支持包括随机采样、分层采样在内的抽样策略;所述资产匹配模块用于数据提供方在数据中制定某个字段为目标列。
[0014]进一步优化本技术方案,所述资产价值评估模块用于支持数据预处理和特征工程的操作,并支持快速计算出数据提供方的数据资产的相关价值评估指标。
[0015]进一步优化本技术方案,所述资产价值评估模块支持的价值评估指标有Shapley特征贡献度α、特征多重共线性VIF值χ、特征IV重要度δ、特征GINI重要度ε、特征信息熵重要度φ以及特征相关系数γ,用于提供多角度、全面的量化每个特征在场景下的作用功效。
[0016]进一步优化本技术方案,基于所述价值评估指标,建立价值评估函数,则价值评估函数如下式所示:
[0017]value=ω1f
label
(α,δ,ε,φ)+ω2g
oth er feature
(χ,γ)+ω3z
label
(γ)+Constant
[0018]其中,f
label
、g
oth er feature
以及w
label
为数据资产价值评估三元组,Constant为价值常数。
[0019]进一步优化本技术方案,所述数据资产价值评估三元组进一步包括以下具体内容:
[0020]f
label
:包括Shapley特征贡献度α、特征IV重要度δ、特征GINI重要度ε、特征信息熵重要度φ,上述指标直接反映目标列label的关系,指标值越大,特征越重要;
[0021]g
oth er feature
:包括特征多重共线性VIF值χ,特征相关系数γ两个指标反映每个特征与其他特征之间的关系,指标值越大,说明特征独特性越小,越容易被替代;
[0022]w
label
:特征相关系数γ也反映与目标列label的关系重要度,这部分指标信息要进行单独处理。
[0023]进一步优化本技术方案,所述资产定价模块中的每个特征场景都有对应的市场成本,如:营销获客成本、风控欺诈平均成本、消费贷款风险成本,结合场景成本和价值评估的量化指标,可以给出每条数据资产的估价;支持提供以往本类目数据资产的交易成交价值,可以在估价基础上做一些微调;支持梯度定价策略、支持按计算次数定价策略、支持按包年包月定价策略。
[0024]进一步优化本技术方案,所述资产消费模块为平台提供数据消费的场所,提供数据建模能力、数据联合预测能力;平台提供资产上架、资产验证、资产消费的完整流程,可以审计验证阶段的场景与消费阶段的场景的一致性,确保数据提供方的利益得到保证,同时也可以收集到数据资产在真实消费场景的反馈情况,有效地矫正数据价值和定价。
[0025]一种基于隐私计算数据探查的数据定价方法,基于上述的一种基于隐私计算数据探查的数据定价系统进行依次操作,通过隐私求交、价值评估、数据定价、数据交易、数据消费进行合理定价,并根据数据资产在真实消费场景的反馈情况,有效地矫正数据定价。
[0026]与现有技术相比,本专利技术提供了一种基于隐私计算数据探查的数据定价系统和方法,具备以下有益效果:
[0027]该基于隐私计算数据探查的数据定价系统和方法,在隐私计算技术的加持下,数据可以有效的实现使用权与所有权的分离,可以基于数据实用价值进行资产定价,同时可
以收集到数据资产在真实消费场景的反馈情况,有效地矫正数据价值和定价。
附图说明
[0028]图1为本专利技术提出的一种基于隐私计算数据探查的数据定价系统的结构示意图;
[0029]图2为本专利技术提出的一种基于隐私计算数据探查的数据定价方法的流程示意图。
具体实施方式
[0030]下面将结合本专利技术的实施例,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0031]实施例:
[0032]请参阅图1,一种基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于隐私计算数据探查的数据定价系统,其特征在于,在隐私安全计算背景下实现数据资产价值评估及定价功能,包括数据初始化模块、资产匹配模块、资产价值评估模块、资产定价模块以及资产消费模块;所述数据定价系统接收外部输入的数据至数据初始化模块中,所述数据初始化模块的输出端信号连接在资产匹配模块的输入端,所述资产匹配模块的输出端信号连接在资产价值评估模块的输入端,所述资产价值评估模块的输出端信号连接在资产定价模块的输入端,所述资产定价模块与资产消费模块进行双向信号连接;所述数据初始化模块,用于对需要进行定价的数据进行初始化,并将整个数据定价体系中唯一的标识赋予待定价数据;所述资产匹配模块,基于交易双方约定的数据主键字段隐私求交,得到联合样本集;所述资产价值评估模块,用于评估目标字段与双方输入字段的有效性、相关性以及贡献度在内的价值指标;所述资产定价模块,用于给出每条数据资产的估价;所述资产消费模块,用于提供隐私计算消费场景中的消费数据资产。2.根据权利要求1所述的一种基于隐私计算数据探查的数据定价系统,其特征在于,所述数据初始化模块对数据中的敏感字段名称进行脱敏处理,包括性别、年龄的字段,分别使用x1,x2进行替换,并对数据的更新频率、实效性、覆盖率以及主键构成方式进行说明。3.根据权利要求1所述的一种基于隐私计算数据探查的数据定价系统,其特征在于,所述资产匹配模块用于数据需求方上传自己的数据,并用于配置双方数据的求交字段,指定求交后样本表的字段,同时支持包括随机采样、分层采样在内的抽样策略;所述资产匹配模块用于数据提供方在数据中制定某个字段为目标列。4.根据权利要求1所述的一种基于隐私计算数据探查的数据定价系统,其特征在于,所述资产价值评估模块用于支持数据预处理和特征工程的操作,并支持快速计算出数据提供方的数据资产的相关价值评估指标。5.根据权利要求4所述的一种基于隐私计算数据探查的数据定价系统,其特征在于,所述资产价值评估模块支持的价值评估指标有Shapley特征贡献度α、特征多重共线性VIF值χ、特征IV重要度δ、特征GINI重要度ε、特征信息熵重要度φ以及特征相关系数γ,用于提供多角度、全面的量化每个特征在场景下的作用功效。6.根据权利要求5所述的一种基于隐私计算数据探查的数据定价系统,其特征在于,基于所述价值评...

【专利技术属性】
技术研发人员:刘登涛毛仁歆倪壮
申请(专利权)人:蓝象智联杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1