【技术实现步骤摘要】
一种隐私计算平台系统及数据导入方法
[0001]本申请涉及隐私计算
,具体而言,涉及一种隐私计算平台系统及数据导入方法。
技术介绍
[0002]隐私计算具有多个参与节点的,每个参与节点都拥有自己的数据(根据数据的类型,将这些节点分别成为数据查询方和数据提供方,其中数据查询方是指数据中有标签的一方(业内也叫做发起方、guest节点),其他节点称为数据提供方(业内也叫做参与方、host节点),由于双方的数据不是一一映射的,所以需要先进行数据的隐私保护集合求交(Private Set Intersection,PSI),PSI简单来说是在保证数据隐私安全的前提下,求出多个节点之间相同的数据(求两方数据的交集)。这个过程使用了密码学的加解密计算,会导致性能较差。同时需要预先将所有数据导入隐私计算平台,增加了一些无关数据的泄漏风险。
[0003]隐私计算平台将数据源中的数据导入到隐私计算平台的过程,是独立完成的,但是在隐私计算场景中,双方仅关心有相关性的数据,对于完全无关联关系的数据是不需要导入的,对于数据提供方来说,并 ...
【技术保护点】
【技术特征摘要】
1.一种隐私计算平台系统的数据导入方法,其特征在于,所述隐私计算平台系统包括数据查询方和数据提供方;所述方法应用于数据查询方,所述方法包括:由所述数据查询方的隐私计算平台拉取数据查询方数据仓库的全量数据;根据全量数据提取数据因子,向所述数据提供方发送数据因子;接收用于指示数据因子命中的指令,并根据该指令对所述全量数据进行过滤,以得到命中数据;其中,所述命中数据为导入数据查询方的隐私计算平台的数据,该数据用于进行隐私保护集合求交。2.如权利要求1所述的方法,其特征在于,其中,所述根据全量数据提取数据因子,包括:通过全量提取、前N位提取、数组提取和加密提取中至少一种提取方式提取所述数据因子。3.如权利要求2所述的方法,其特征在于,通过前N位提取的方式提取数据因子,包括:获取到原始数据的前N位字符的值并生成数据因子。4.如权利要求2所述的方法,其特征在于,通过数组提取的方式提取数据因子,包括:预先生成一组匹配数据选举数组,根据匹配数据选举数组进行数据提取并生成数据因子。5.如权利要求2所述的方法,其特征在于,通过加密提取的方式提取数据因子,包括:先对原始数据进行加密,以加密后的数据生成数据因子。6.一种隐私计算平台系统的数据导入方法,其特征在于,所述隐私计算平台系统包括数据查询方和数据提供方;所述方法应用于数据提供方,所述方法包括:接收数据查询方发送的数据因子;数据提供方的隐私计算平台根据数据因子查询是否命中数据提供方数据仓库中的数据;若是,则向数据查询方发送用于指示数据因子命中的指令,并保存命中的数据;其中,所述命中的数据为导入数据提供方的隐私计算平台的数据,该数据用于进行隐私保护集合求交。7.如权利要求6所述的方法,其特征在于,所述根据数据因子查询是否命中数据提供方数据仓库中的数据,包括:基于全量提取的数据因子,进行等值匹配查询。8.如权利要求6所述的方法,其特征在于,所述根据数据因子查询是否命中数据提供方数据仓库中的数据,包括:基于前N位提取的数据因子,进行模糊匹配查询。9.如权利要求6所述的方法,其特征在于,所述根据数据因子查询是否命中数据提供方数据仓库中的数据,包括:基于数组提取的数据因子和匹配数据选举数组,进行数据匹配查询。10.如权利要求6所述的方法,其特征在于,所述根据数据因子查询是否命中数据提供方数据仓库中的数...
【专利技术属性】
技术研发人员:伊世林,卞阳,杜浩,朱崇炳,
申请(专利权)人:上海富数科技有限公司广州分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。