一种密文数据交易产品定价方法、模型训练方法及装置制造方法及图纸

技术编号:35611259 阅读:18 留言:0更新日期:2022-11-16 15:35
本申请公开了一种密文数据交易产品定价方法、模型训练方法及装置,涉及多方安全计算技术领域和隐私计算技术领域,包括:获取待定价的计算合约产品的合约信息,算法信息,以及包含的各数据产品的数据信息,合约信息中包含数据价格总和;基于合约信息、算法信息和数据信息,生成该计算合约产品的特征数据;将特征数据输入预先训练的算法定价模型,得到该计算合约产品的预估价格增值率,该算法定价模型是采用已成交的多个计算合约产品作为多个训练样本进行模型训练得到的;使用预估价格增值率乘以数据价格总和,得到该计算合约产品的预估合约增值价格,作为预估算法价格。采用本方案,提高了针对计算合约产品中的密文算法定价的合理性。合理性。合理性。

【技术实现步骤摘要】
一种密文数据交易产品定价方法、模型训练方法及装置


[0001]本申请涉及多方安全计算
和隐私计算
,尤其涉及一种密文数据交易产品定价方法、模型训练方法及装置。

技术介绍

[0002]多方安全计算(MPC)可以在保护个人隐私信息的前提下,实现隐私数据共享。MPC是指某一组互相不信任的参与者在保护个人隐私的同时,还可以进行协同计算。MPC需要确保输入数据的独立性、传递数据的准确性、计算过程的正确性,同时不能将个人的隐私数据泄露给其他参与者。
[0003]隐私保护计算(Privacy

Preserving Computing)是指在保护隐私信息的前提下,实现数据价值的分析和挖掘,即实现数据在加密的、非透明的状态下的计算,以保护计算各参与方的隐私信息安全。隐私保护计算的技术,可应用于多方安全计算。
[0004]基于多方安全计算和隐私保护计算,数据成为更有价值的产品,因此,在实际应用中,诞生了用于交易数据产品的新型数据交易平台,也可以称作隐私保护型数据交易市场。
[0005]在数据交易平台上,有商业价值的原始数据被打包成商品出售。隐私保护型数据交易市场,是指底层使用隐私保护计算技术来完成数字商品交付环节的新型数据交易市场。在这种数据交易市场中,买家收到的并不是原始的明文数据,而是原始数据经隐私保护计算过后的计算结果。
[0006]在隐私保护型数据交易市场网站里的密文数据交易过程,首先是数据卖家将原始数据打包成产品,在网站上进行上架。但是买家无法直接购买原始数据,而是由数据卖家将多份原始数据、处理数据的密文算法、以及执行算法中约定的计算所需的算力整合在一起,打包成一份计算合约产品,发布在交易市场网站上进行出售。此时买家可以在交易市场网站上对计算合约产品通过下单操作进行购买。在之后的交付流程中,网站根据计算合约产品中的设定,在约定的算力单元上,对各原始数据执行密文算法,即使用隐私保护的方式进行计算,并将计算结果发给数据买家。
[0007]在这一过程中,数据买家只能得到计算结果,但是看不到任何的原始数据,实现了在保护原始数据隐私的前提下,对于其中蕴含的数据使用价值进行交易。
[0008]对于数据买家而言,其所获得的最终商品(即前述的计算结果)的质量和价值,是由所有的原始数据和处理数据使用的密文算法所共同决定的。密文算法所起的作用是从遮蔽、杂乱的原始数据中,提取真正对于用户有价值的信息,以计算结果的方式发给数据买家,其代表着对原始数据提炼和增值的过程。
[0009]然而,已有的数据资产定价方法,大都是关注怎样对一份原始数据本身进行定价,或是,如何确定多份数据中的每一份在总体收益中的分配比例。在密文数据交易的过程中,这些已有的数据资产定价方法无法很好的体现出,特定的密文算法对于原始数据的提炼和增值的过程与价值。
[0010]因此,现有的数据资产定价方法对于密文数据交易的过程是不够完善的。在一些
隐私保护型数据交易市场的具体产品形态中,在数据卖家在将多份原始数据与密文算法、算力打包成一份“计算合约产品”的过程中,有一栏“合约增值价格”的输入项,供数据卖家输入一个表示密文算法价格的金额,以体现其所开发、调试的密文算法在此处的特定使用场景下,对于原始数据的增值价值。
[0011]目前,由于缺乏针对密文算法的定价机制,所以数据卖家在此处往往都是凭感觉随意输入一个金额,很容易导致输入的金额过高或是过低,从而与该密文算法实际所产生的价值不相符,价格过高可能阻碍计算合约产品的成交,浪费平台和用户的计算机资源,价格过低将减少数据卖家的收入,不利于密文数据交易的长远发展。

技术实现思路

[0012]本申请实施例提供一种密文数据交易产品定价方法、模型训练方法及装置,用以解决现有技术中存在的在密文数据交易过程中针对密文算法的定价与实际产生的价值不相符的问题。
[0013]本申请实施例提供一种密文数据交易产品定价方法,包括:获取待定价的计算合约产品的合约信息,采用的密文算法的算法信息,以及包含的各数据产品的数据信息,所述合约信息中包含数据价格总和;基于所述合约信息、所述算法信息和所述数据信息,生成所述计算合约产品的特征数据;将所述特征数据输入预先训练的算法定价模型,得到所述计算合约产品的预估价格增值率,所述算法定价模型是采用已成交的多个计算合约产品作为多个训练样本进行模型训练得到的;使用所述预估价格增值率乘以所述数据价格总和,得到所述计算合约产品的预估合约增值价格,作为预估算法价格。
[0014]进一步的,所述合约信息中还至少包含如下信息之一:合约应用领域信息,所述计算合约产品包含的各数据产品的价格比率,一个数据产品的所述价格比率为该数据产品的价格除以所述数据价格总和的值;所述算法信息至少包含如下信息之一:代码行数信息,各密文库的使用信息;所述计算合约产品包含的各数据产品的所述数据信息至少包含如下信息之一:数据来源信息,数据应用领域信息,数据提供商信息,数据密级信息,数据上架日期。
[0015]进一步的,所述基于所述合约信息、所述算法信息和所述数据信息,生成所述计算合约产品的特征数据,包括:分别对所述数据价格总和以及所述代码行数信息的数值加1并取对数,以及针对得到的结果采用z

score标准化进行归一化处理,得到的处理后的结果作为所述计算合约产品的特征数据;使用所述上架日期减去预设日期,得到的结果作为所述计算合约产品的特征数据;分别对所述合约应用领域信息、所述价格比率、所述代码行数信息、各密文库的所
述使用信息、所述数据来源信息、所述数据应用领域信息、所述数据提供商信息和所述数据密级信息,采用独热编码方式进行编码,得到的结果作为所述计算合约产品的特征数据。
[0016]进一步的,所述算法定价模型为XGBoost模型。
[0017]本申请实施例还提供一种模型训练方法,包括:针对已成交的多个计算合约产品中的每个计算合约产品,获取该计算合约产品的合约信息,采用的密文算法的算法信息,以及包含的各数据产品的数据信息,所述合约信息中包含数据价格总和以及合约增值价格,所述合约增值价格表示算法价格,所述多个计算合约产品作为多个训练样本;针对每个计算合约产品,基于该计算合约产品的除所述合约增值价格之外的所述合约信息、所述算法信息和所述数据信息,生成该计算合约产品作为训练样本的输入数据;针对每个计算合约产品,使用该计算合约产品的所述合约增值价格除以所述数据价格总和,得到价格增值率,作为该计算合约产品作为训练样本的标签;使用具有所述输入数据和所述标签的所述多个训练样本,对预设结构的训练模型进行训练,得到算法定价模型。
[0018]进一步的,所述合约信息中还至少包含如下信息之一:合约应用领域信息,所述计算合约产品包含的各数据产品的价格比率,一个数据产品的所述价格比率为该数据产品的价格除以所述数据价格总和的值;所述算法信息至少包含如下信息之一:代码行数信息,各密文库的使用信息;所述计算合约产品包含的各数据产品的所述数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种密文数据交易产品定价方法,其特征在于,包括:获取待定价的计算合约产品的合约信息,采用的密文算法的算法信息,以及包含的各数据产品的数据信息,所述合约信息中包含数据价格总和;基于所述合约信息、所述算法信息和所述数据信息,生成所述计算合约产品的特征数据;将所述特征数据输入预先训练的算法定价模型,得到所述计算合约产品的预估价格增值率,所述算法定价模型是采用已成交的多个计算合约产品作为多个训练样本进行模型训练得到的;使用所述预估价格增值率乘以所述数据价格总和,得到所述计算合约产品的预估合约增值价格,作为预估算法价格。2.如权利要求1所述的方法,其特征在于,所述合约信息中还至少包含如下信息之一:合约应用领域信息,所述计算合约产品包含的各数据产品的价格比率,一个数据产品的所述价格比率为该数据产品的价格除以所述数据价格总和的值;所述算法信息至少包含如下信息之一:代码行数信息,各密文库的使用信息;所述计算合约产品包含的各数据产品的所述数据信息至少包含如下信息之一:数据来源信息,数据应用领域信息,数据提供商信息,数据密级信息,数据上架日期。3.如权利要求2所述的方法,其特征在于,所述基于所述合约信息、所述算法信息和所述数据信息,生成所述计算合约产品的特征数据,包括:分别对所述数据价格总和以及所述代码行数信息的数值加1并取对数,以及针对得到的结果采用z

score标准化进行归一化处理,得到的处理后的结果作为所述计算合约产品的特征数据;使用所述上架日期减去预设日期,得到的结果作为所述计算合约产品的特征数据;分别对所述合约应用领域信息、所述价格比率、所述代码行数信息、各密文库的所述使用信息、所述数据来源信息、所述数据应用领域信息、所述数据提供商信息和所述数据密级信息,采用独热编码方式进行编码,得到的结果作为所述计算合约产品的特征数据。4.如权利要求1

3任一项所述的方法,其特征在于,所述算法定价模型为XGBoost模型。5.一种模型训练方法,其特征在于,包括:针对已成交的多个计算合约产品中的每个计算合约产品,获取该计算合约产品的合约信息,采用的密文算法的算法信息,以及包含的各数据产品的数据信息,所述合约信息中包含数据价格总和以及合约增值价格,所述合约增值价格表示算法价格,所述多个计算合约产品作为多个训练样本;针对每个计算合约产品,基于该计算合约产品的除所述合约增值价格之外的所述合约信息、所述算法信息和所述数据信息,生成该计算合约产品作为训练样本的输入数据;针对每个计算合约产品,使用该计算合约产品的所述合约增值价格除以所述数据价格总和,得到价格增值率,作为该计算合约产品作为训练样本的标签;使用具有所述输入数据和所述标签的所述多个训练样本,对预设结构的训练模型进行训练,得到算法定价模型。6.如权利要求5所述的方法,其特征在于,所述合约信息中还至少包含如下信息之一:
合约应用领域信息,所述计算合约产品包含的各数据产品的价格比率,一个数据产品的所述价格比率为该数据产品的价格除以所述数据价格总和的值;所述算法信息至少包含如下信息之一:代码行数信息,各密文库的使用信息;所述计算合约产品包含的各数据产品的所述数据信息至少包含如下信息之一:数据来源信息,数据应用领域信息,数据提供商信息,数据密级信息,数据上架日期。7.如权利要求6所述的方法,其特征在于,所述基于该计算合约产品的除所述合约增值价格之外的所述合约信息、所述算法信息和所...

【专利技术属性】
技术研发人员:刘琛
申请(专利权)人:华控清交信息科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1