【技术实现步骤摘要】
一种基于中央协调方的数据安全共享方法及装置
本申请属于数据处理
,尤其涉及一种基于中央协调方的数据安全共享方法及装置。
技术介绍
随着大数据及AI产业的蓬勃发展,数据资源的重要价值日趋凸显。为了提升竞争实力,很多机构将大量人力和资金投入到了数据资源的建设上。由于数据资源可以零成本复制,使其只拥有一次交易获利的机会,而数据生产者并不愿意自己花费大量成本得来的数据被他人无偿使用,这一现象使得各个机构重复生产同一任务所需的数据,最终又难以实现数据的流通及聚合,造成了社会资源的浪费。数据资源流通的瓶颈限制了大数据及AI产业的发展,使得很多先进的机器学习模型无法落地。对于数据安全共享,当前的研究热点主要集中在联邦学习领域,联邦学习通过将同一模型的训练任务分派给多个参与方,每个参与方利用自己的数据,在自己的计算资源上训练模型,并在训练过程中交换非隐私信息,最终通过模型聚合得到一个全局模型。该技术虽然实现了数据所有权和使用权的分离,但具有下述局限性:第一,合作方必须经过事先协商,且自身也要拥有数据作为合作前提,限制了个人和小 ...
【技术保护点】
1.一种基于中央协调方的数据安全共享方法,其特征在于:/n数据拥有方将数据集上传至所述中央协调方指定的预设储存设备;/n由中央协调方对所述数据集进行抽样,得到抽样结果,向数据使用方公开所述抽样结果,所述抽样结果用于对所述数据集质量进行监控;/n所述数据使用方通过所述抽样结果,对所述数据集质量进行评估;/n所述数据使用方对所述数据集申请使用授权;/n由所述数据使用方编写计算指令;/n在所述中央协调方指定的预设计算环境中执行所述计算指令;/n将所述计算指令的执行结果交付给所述数据使用方。/n
【技术特征摘要】
1.一种基于中央协调方的数据安全共享方法,其特征在于:
数据拥有方将数据集上传至所述中央协调方指定的预设储存设备;
由中央协调方对所述数据集进行抽样,得到抽样结果,向数据使用方公开所述抽样结果,所述抽样结果用于对所述数据集质量进行监控;
所述数据使用方通过所述抽样结果,对所述数据集质量进行评估;
所述数据使用方对所述数据集申请使用授权;
由所述数据使用方编写计算指令;
在所述中央协调方指定的预设计算环境中执行所述计算指令;
将所述计算指令的执行结果交付给所述数据使用方。
2.根据权利要求1所述的数据安全共享方法,其特征在于,所述数据拥有方将数据集上传至所述中央协调方指定的预设储存设备,包括:
数据拥有方利用中央协调方提供的公钥,对所述数据集逐条进行非对称加密,将所述数据集以密文形式上传至中央协调方指定的数据储存设备。
3.根据权利要求1所述的数据安全共享方法,其特征在于:所述数据拥有方将数据集上传至所述中央协调方指定的预设储存设备,包括:
数据拥有方在上传数据集时为数据集指定标签字段,所述标签字段表示在使用该数据集训练统计模型时,该字段包含的内容可以作为所述模型的拟合目标。
4.根据权利要求3所述的数据安全共享方法,其特征在于:所述由所述数据使用方编写计算指令,包括:
所述计算指令中,涉及统计模型训练时,在为所述统计模型指定拟合目标时,仅允许将所述数据拥有方为所述数据集指定的标签字段所含内容作为所述统计模型的拟合目标。
5.根据权利要求1所述的数据安全共享方法,其特征在于:所述数据拥有方将数据集上传至所述中央协调方指定的预设储存设备,包括:
由所述数据拥有方为所述数据集设定计价方案,所述计价方案中指定了所述数据集的收费模式与价格。
6.根据权利要求1所述的数据安全共享方法,其特征在于:所述所述数据使用方对所述数据集申请使用授权,包括:
所述数据使用方可以申请所述数据集中满足特定条件的部分数据的使用权,所述特定条件包括:样本数等于预设值、类别属于预设集合、图片数据的尺寸介于预设范围、文本数据的字符数介于预设范围、数据集任意一个字段的取值介于预设范...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。