当前位置: 首页 > 专利查询>北京大学专利>正文

一种基于强化学习的数据定价方法、装置、设备和介质制造方法及图纸

技术编号:40935280 阅读:20 留言:0更新日期:2024-04-18 14:54
本发明专利技术公开了一种基于强化学习的数据定价方法、装置、计算设备和存储介质。根据本发明专利技术提供的技术方案,获取多个数据提供方的原始数据生成数据集合;构建样本价值函数及特征价值函数,对其进行初始化;确定参与预测模型训练的训练数据并进行训练,得到预测器;基于验证数据计算预估值,即作为当前样本价值函数及特征价值函数的奖励值;采用梯度下降法进行迭代计算,确定当前样本价值函数和特征价值函数中的参数及对应的损失函数;根据条件输出两种价值函数中的参数并计算数据价值。通过本发明专利技术可使价值计算的复杂度不依赖于训练集的大小,十分简洁且准确;并通过梯度下降法获得两种价值函数中的参数和损失函数,最终得到更为合理的数据价值。

【技术实现步骤摘要】

本专利技术涉及数据交易领域,特别涉及一种基于强化学习的数据定价方法、装置、计算设备和计算机存储介质。


技术介绍

1、随着大数据、机器学习、人工智能等技术的持续发展,这些技术已经逐步深入到社会经济生活的各个方面。许多企业都在此基础上推进数字化转型,而在这一过程中,这些企业都积累了大量数据,这些数据成为了它们宝贵的资产。但出于对数据隐私保护和企业资产保护的考虑,企业通常都不愿意直接出售源数据,但同时又希望能够利用其他企业的数据来改善自身采用的相关数据模型。因此,基于协同训练的场景成为了未来数据交易的一个重要方向。协同训练是指通过多个企业共同训练一个模型的方式,每个企业贡献出自己的数据,从而获得更好的模型效果。基于协同训练的这种数据交易方式不仅可以提高数据的使用效率,还可以通过联邦学习等手段保护企业的数据隐私和资产。基于此,协同训练将在数据交易中扮演越来越重要的角色。

2、在协同训练的交易场景中,由于来自于不同数据所有者的数据集对最后的机器学习模型有不同的贡献,因此需要一种算法来评估各个数据所有者的数据集对模型的贡献,以此为基础进一步进行收入分配。基本文档来自技高网...

【技术保护点】

1.一种基于强化学习的数据定价方法,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取多个数据提供方的原始数据,并基于获取到的原始数据生成数据集合,进一步包括:

3.根据权利要求1所述的方法,其特征在于,所述构建样本价值函数以及特征价值函数,对样本价值函数和特征价值函数进行初始化,进一步包括:

4.根据权利要求1所述的方法,其特征在于,所述根据样本价值函数和特征价值函数,确定参与预测模型训练的训练数据;根据训练数据对预测模型进行训练,得到预测器,进一步包括:

5.根据权利要求1所述的方法,其特征在于,所述验证数据由场景使用方确定,或...

【技术特征摘要】

1.一种基于强化学习的数据定价方法,包括:

2.根据权利要求1所述的方法,其特征在于,所述获取多个数据提供方的原始数据,并基于获取到的原始数据生成数据集合,进一步包括:

3.根据权利要求1所述的方法,其特征在于,所述构建样本价值函数以及特征价值函数,对样本价值函数和特征价值函数进行初始化,进一步包括:

4.根据权利要求1所述的方法,其特征在于,所述根据样本价值函数和特征价值函数,确定参与预测模型训练的训练数据;根据训练数据对预测模型进行训练,得到预测器,进一步包括:

5.根据权利要求1所述的方法,其特征在于,所述验证数据由场景使用方确定,或者,从数据集合中进行抽样得到验证数据。

6.根据权利要求1所述的方法,其特征在于,所述采用梯度下降法进行迭代计...

【专利技术属性】
技术研发人员:黄晶宋洁张平文
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1