一种私有数据处理方法及系统技术方案

技术编号:23852664 阅读:38 留言:0更新日期:2020-04-18 09:27
本说明书实施例公开了一种私有数据处理方法。所述方法可以由可信执行环境中的一个或多个处理器执行,其包括:可以获取私有数据,私有数据经过加密。可以处理私有数据以获取两个或以上的数据分块。可以基于至少一个数据分块训练树模型。以及,可以将至少一个数据分块存储至第一存储设备,第一存储设备位于可信执行环境之外,且存储至第一存储设备的数据分块经过加密。本说明书所披露的方法,可以缓解大数据下可信执行环境内的存储空间受限的问题。

A private data processing method and system

【技术实现步骤摘要】
一种私有数据处理方法及系统
本说明书涉及数据处理领域,特别涉及一种私有数据处理方法、系统、装置以及可读存储介质。
技术介绍
随着信息科技的发展,数据已经成为其拥有方的重要资源。而现今多方数据联合使用已经成为常态,如何在数据的联合使用中保护各方数据的隐私安全、防止数据泄露成为一个亟待解决的关键问题。因此,有必要提供一种能够在数据使用过程中保护各方私有数据安全的数据处理方法。
技术实现思路
本说明书实施例的一个方面提供一种私有数据处理方法。所述方法可以由可信执行环境中的一个或多个处理器执行。所述私有数据处理方法包括:可以获取所述私有数据,所述私有数据经过加密。可以处理所述私有数据以获取两个或以上的数据分块。可以基于至少一个数据分块训练树模型。以及,可以将至少一个数据分块存储至第一存储设备,所述第一存储设备位于所述可信执行环境之外,且存储至第一存储设备的数据分块经过加密。本说明书实施例的另一个方面提供一种私有数据处理系统,所述系统位于可信执行环境中。所述系统可以包括获取模块、处理模块、执行模块以及存储模块。获取模块,可以用本文档来自技高网...

【技术保护点】
1.一种私有数据处理方法,其中,所述方法由可信执行环境中的一个或多个处理器执行,其包括:/n获取所述私有数据,所述私有数据经过加密;/n处理所述私有数据以获取两个或以上的数据分块;/n基于至少一个数据分块训练至少一个树模型;/n以及,将至少一个数据分块存储至第一存储设备,所述第一存储设备位于所述可信执行环境之外,且存储至第一存储设备的数据分块经过加密。/n

【技术特征摘要】
1.一种私有数据处理方法,其中,所述方法由可信执行环境中的一个或多个处理器执行,其包括:
获取所述私有数据,所述私有数据经过加密;
处理所述私有数据以获取两个或以上的数据分块;
基于至少一个数据分块训练至少一个树模型;
以及,将至少一个数据分块存储至第一存储设备,所述第一存储设备位于所述可信执行环境之外,且存储至第一存储设备的数据分块经过加密。


2.根据权利要求1所述的方法,其中,所述将至少一个数据分块存储至第一存储设备,包括:
存储至少一个数据分块至第二存储设备直到第二存储设备不满足第一预设条件,所述第二存储设备位于所述可信执行环境中;
当第二存储设备不满足第一预设条件时,则对至少一个数据分块加密后存储至第一存储设备。


3.根据权利要求2所述的方法,其中,所述当第二存储设备不满足第一预设条件时,则对至少一个数据分块加密后存储至第一存储设备,包括:
将剩余的至少一个数据分块加密后存储至第一存储设备;或者,
基于预设筛选策略从第二存储设备中选择至少一个数据分块,将其加密后存储至第一存储设备,以使第二存储设备满足第一预设条件。


4.根据权利要求2所述的方法,其中,所述基于至少一个数据分块训练至少一个树模型,包括:
确定所述第二存储设备是否存储有目标数据分块;
若存储有目标数据分块,则利用所述目标数据分块训练至少一个树模型;
若未存储有目标数据分块,则从所述第一存储设备中读取目标数据分块至所述可信执行环境中并解密,并利用解密后的目标数据分块训练至少一个树模型。


5.根据权利要求4所述的方法,其中,所述从所述第一存储设备中读取目标数据分块至所述可信执行环境中,包括:
判断所述第二存储设备是否满足第二预设条件;
若满足第二预设条件,存储所述目标数据分块于所述第二存储设备;
若未满足第二预设条件,基于预设筛选策略从第二存储设备中选择至少一个数据分块,将其加密后存储至第一存储设备,并将所述目标数据分块存储至所述第二存储设备。


6.根据权利要求1所述的方法,其中,所述可信执行环境至少包括SoftwareGuardExtensions、SecureEncryptedVirtualization、或TrustZone。


7.根据权利要求1所述的方法,其中,所述私有数据包括来自多个数据源的训练样本数据;所述处理所述私有数据以获取两个或以上的数据分块,包括:
解密所述私有数据;
基于训练样本的一个或多个特征项将训练样本数据划分,得到一个或多个垂直切分数据分块;和/或,
基于训练样本的标识性特征项的特征值将训练样本数据划分,得到一个或多个水平切分数据分块。


8.根据权利要求7所述的方法,其中,所述树模型至少包括GBDT模型;
所述利用所述至少一个数据分块进行多任务机器学习模型训练,包括:
利用一个或多个垂直切分数据分块训练所述GBDT模型;和/或,
利用一个或多个水平切分数据分块测试所述GBDT模型。


9.一种私有数据处理系统,其中,所述系统位于可信执行环境中,所述系统包括获取模块、处理模块、执行模块以及存储模块;
获取模块,用于获取所述私有数据,所述私有数据经过加密;
处理模块,用于处理所述私有数据以获取两个或以上的数据分块;
执行模块,用于基于至少一个数据...

【专利技术属性】
技术研发人员:巫锡斌陈岑
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1