【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于公平、安全且私密的数据评估和转移的系统、方法和计算机可读介质。
技术介绍
1、机器学习(machine learning,ml)技术发生了革命性的变化,并在计算机视觉、自然语言处理和自动驾驶车辆等许多领域具有最先进的性能。准确的ml模型的创建可能在很大程度上依赖于对大量高质量和多样化的训练数据的访问。通常,收集数据的过程既困难又耗时,由称为数据聚合方(也称为数据卖方或数据提供方)的专业公司处理。另一方面,数据处理组织(也称为数据寻求方或买方)需要这些数据集来提取有价值的业务见解或训练机器学习模型。因此,数据处理组织用报酬向数据聚合方换取数据集。
2、这就需要一个在线数据市场,其中数据提供方(卖方)以一定的价格提供他们精选的数据集,而数据寻求方(买方)则希望购买数据集用于训练ml模型。为了促进交易,卖方和买方需要进行交互,这对买方和卖方的资产安全、公平、隐私等产生了许多现实挑战。
3、数据市场中的一个核心问题是发现对给定买方可能有用的数据集。找到可能有用的数据集的一个简单方法是使用数据属性,如数据
...【技术保护点】
1.一种方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,还包括:
3.根据权利要求1所述的方法,其特征在于,所述第一实体、第二实体和第三实体均包括相应的受控访问计算机系统,并且(i)所述第二实体和所述第三实体都没有访问所述一组原始数据样本的权限,(ii)所述第二实体没有访问所述一组可信标签的权限,(iii)在所述第一实体完成所述预定的转移要求之前,所述第一实体没有访问所述第二实体数据集的权限。
4.根据权利要求1所述的方法,其特征在于,所述第二实体是多个第二实体中的一个,
5.根据权利要求4所述的方法
...【技术特征摘要】
【国外来华专利技术】
1.一种方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,还包括:
3.根据权利要求1所述的方法,其特征在于,所述第一实体、第二实体和第三实体均包括相应的受控访问计算机系统,并且(i)所述第二实体和所述第三实体都没有访问所述一组原始数据样本的权限,(ii)所述第二实体没有访问所述一组可信标签的权限,(iii)在所述第一实体完成所述预定的转移要求之前,所述第一实体没有访问所述第二实体数据集的权限。
4.根据权利要求1所述的方法,其特征在于,所述第二实体是多个第二实体中的一个,
5.根据权利要求4所述的方法,其特征在于,所述第一实体生成所述一组合成数据样本包括:基于优化效用目的和安全目的来为每个原始数据样本合成相应的数据样本,所述效用目的使所述第三实体能够针对每个所述相应的第二实体数据集生成一致的评估信息,所述安全目的将所述合成数据样本与所述原始数据样本区分开。
6.根据权利要求1所述的方法,其特征在于,所述第一实体生成所述一组合成数据样本包括:
7.根据权利要求6所述的方法,其特征在于,所述原始数据样本是图像样本,样本空间是像素空间,所述相应的模型输出是最终层激活。
8.根据权利要求1所述的方法,其特征在于,所述第二实体是多个第二实体中的一个,每个第二实体使用相应的训练后机器学习(machine learning,ml)模型针对所述一组合成数据样本生成一组相应的第二实体预测,所述相应的训练后机器学习模型已经使用所述第二实体特有的相应的第二实体数据集进行训练,所述方法包括:
9.根据权利要求8所述的方法,其特征在于,每个相应的第二实体数据集的所述评估信息包括:单个效用值,基于所述一组可信标签与针对所述第二实体生成的所述一组第二实体预测的个别比较;边际效用值,基于与包括多个所述第二实体预测的预测相比,所述相应的第二实体预测的效用的边际增加。
10.根据权利要求8所述的方法,其特征在于,包括向所述多个第二实体中的每个第二实体发送公共模型架构和训练算法的指示,以供所述第二实体应用于训练其相应的ml模型,其中所述第一实体基于所述...
【专利技术属性】
技术研发人员:古西姆兰·辛格,阿纳夫·塔兹瓦尔·阿尤布,王晨迪,王岚君,张勇,
申请(专利权)人:华为云计算技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。