超级计算与云计算环境下大数据安全隐私计算控制方法技术

技术编号:32684314 阅读:18 留言:0更新日期:2022-03-17 11:43
本发明专利技术涉及超级计算与云计算环境下大数据安全隐私计算控制方法,通过样例数据规则对原始数据进行数据保护级别判定,对于判定后的原始数据生成系统对其进行脱敏采集,并生成样例数据;同时加密传输到安全存储系统中;若数据应用方需求使用数据,则需向数据管理员进行请求,数据管理员需对请求进行审批;审批过后数据应用方样例数据在算法调试系统中进行调试,并生成算法模型;最终将算法模型输入至计算任务执行系统云计算环境中,进行可信计算,数据应用方得到计算结果数据。本发明专利技术能够确保采集上来的数据不会被篡改:通过与区块链上的数据指纹信息进行比对,确保每次参与计算的都是真实未经篡改的数据。是真实未经篡改的数据。是真实未经篡改的数据。

【技术实现步骤摘要】
超级计算与云计算环境下大数据安全隐私计算控制方法


[0001]本专利技术属于超级计算机隐私安全控制领域,尤其是超级计算与云计算环境下大数据安全隐私计算控制方法。

技术介绍

[0002]随着信息时代的蓬勃发展,信息化产生了越来越多的各样式的数据,如针对患者采集到的健康数据、使用智能设备的浏览数据、电子监控设备采集到的人员未知图像等数据;目前这些数据存储在各个数据采集者的环境中,由于数据包含了大量的用户隐私信息既无法共享又无法统筹的使用,从而使数据产生最大化的价值。
[0003]期望的一种数据使用方式是:提供一个数据交易平台,不同的数据提供方将数据加密存储到一个集中的系统后,该系统可以提供某种方法既保证数据的安全性、完整性,又能够确保数据对其它参与方不可见,参与方只能够在授权的条件下使用数据进行基于某个算法的计算且无法拿到任何的原始数据。
[0004]从数据的安全和完整性来说:现有技术中,通常对数据的传输进行加密,但是对传输过后集中存储的数据缺乏使用时的完整性验证,使用数据的用户无法得知正在使用的数据是否是真实的还是被篡改过的;从算法的调试来说:现有的技术通常基于一个通用的平台进行算法的调试,在算法调试过程中参与方即可通过调试的方式拿到原始的数据,如在算法中将原始数据直接输出到命令行窗口或者写入到某个文件等;这个做法无法保证原始数据的安全。
[0005]从整个计算过程来说:现有的技术通常在一个共享的环境中进行算法的执行,如果在算法代码里直接对原始数据进行输出,将会导致原始数据的泄露;同时由于数据量的不断快速增长,普通的算力难以满足计算需求。

技术实现思路

[0006]本专利技术的目的在于克服现有技术的不足,提出超级计算与云计算环境下大数据安全隐私计算控制方法,从数据采集、数据存储、区块链隐私保护、算法调试和可信计算环境实现基于超级计算与云计算融合的大数据安全隐私计算,实现了每次参与计算的都是真实未经篡改的数据。
[0007]本专利技术解决其技术问题是采取以下技术方案实现的:超级计算与云计算环境下大数据安全隐私计算控制方法,包括以下步骤:步骤1、数据管理员根据样例数据规则对原始数据进行数据保护级别判定;步骤2、通过步骤1判定的数据保护级别并且根据样例数据生成系统对原始数据进行脱敏采集,并生成样例数据;步骤3、将步骤2生成的样例数据加密并传输到安全存储系统中;步骤4、数据应用方向数据管理员进行请求,数据管理员对请求进行审批;步骤5、数据应用方对步骤3中的样例数据在算法调试系统中进行调试,并生成算
法模型;步骤6、数据应用方将步骤4中得到的算法模型输入至超级计算任务执行系统云计算环境中,计算任务执行系统进行可信计算并将计算结果传送至数据应用方。
[0008]而且,所述步骤2中的样例数据生成系统、步骤4的算法调试系统和步骤5的计算任务执行系统云计算环境位于虚拟化隔离环境中,原始数据、样例数据、算法模型和计算结果数据位于数据存储系统中。
[0009]而且,所述步骤1中样例数据规则为:根据原始数据中的敏感信息的敏感程度设定不同的保护级别。
[0010]而且,所述步骤3的具体实现方法为:样例数据通过的SSL或TLS安全隧道的方式加密传输至安全存储系统中,同时将原始数据的指纹信息写入区块链,并记录原始数据的特征码。
[0011]而且,所述步骤4包括以下步骤:步骤4.1、数据应用方根据需求填写结果数据申请表,并发送至数据管理员;步骤4.2、数据管理员对数据应用方的需求进行审核,若审核通过则进行步骤4.3,否则返回步骤4.1,数据应用方重新根据需求填写结果数据申请表;步骤4.3、数据所有方对数据应用方的需求进行审核,若审核通过则进行向数据应用方发送样例数据的解密秘钥,同时数据应用方获取样例数据,否则返回步骤4.1。
[0012]而且,所述步骤5的具体实现方法为:数据应用方在使用样例数据前,先从区块链上获取数据的指纹信息并与要使用的数据进行比对,若对比数据完整,则数据应用方使用解密秘钥对样例数据进行解密,并在算法调试系统中进行调试,并生成算法模型,否则样例数据不能使用。
[0013]而且,所述步骤6包括以下步骤:步骤6.1、将步骤4中得到的算法模型输入至计算任务执行系统云计算环境中,计算任务执行系统云计算环境根据超级计算机和云计算环境的可用资源量,数据量和算法复杂程度预期进行计算环境的选择;步骤6.2、在计算任务执行系统云计算环境进行可信计算,并得到计算结果数据同时进行加密;步骤6.3、数据应用方根据需求填写结果数据申请表,并发送至数据管理员;步骤6.4、数据管理员对数据应用方的需求进行审核,若审核通过则进行步骤6.5,否则返回步骤6.3,数据应用方重新根据需求填写结果数据申请表;步骤6.5、数据所有方对数据应用方的需求进行审核,若审核通过则进行向数据应用方发送计算结果数据的解密秘钥,同时数据应用方获取计算结果数据,否则返回步骤6.3。
[0014]而且,所述计算任务执行系统云计算环境根据超级计算机和云计算环境的可用资源量,数据量和算法复杂程度预期进行计算环境的选择的具体实现方法为:算法空间复杂度;算法时间复杂度;
;;当时,使用云计算;当时,使用超级计算;其中,n为数据量,S

为云环境可用的存储,S

为超算环境可用的存储,C

为云环境可用CPU核数,C

为超算环境可用CPU核数,CPower

为云环境CPU的计算能力,CPower

为超算环境CPU的计算能力。
[0015]本专利技术的优点和积极效果是:1、本专利技术通过样例数据规则对原始数据进行数据保护级别判定,对于判定后的原始数据生成系统对其进行脱敏采集,并生成样例数据;同时加密传输到安全存储系统中;若数据应用方需求使用数据,则需向数据管理员进行请求,数据管理员需对请求进行审批;审批过后数据应用方样例数据在算法调试系统中进行调试,并生成算法模型;最终将算法模型输入至计算任务执行系统云计算环境中,进行可信计算,数据应用方得到计算结果数据。本专利技术能够确保采集上来的数据不会被篡改:通过与区块链上的数据指纹信息进行比对,确保每次参与计算的都是真实未经篡改的数据。
[0016]2、本专利技术中样例数据生成系统、算法调试系统和计算任务执行系统云计算环境位于虚拟化隔离环境中,原始数据、样例数据、算法模型和计算结果数据位于数据存储系统中,使得数据算法模型调试过程中不能接触到真实的原始数据,算法调试基于脱敏后的样例数据,除了数据格式外不包含任何敏感信息,同时算法运行阶段在基于虚拟化的隔离环境中进行,除了算法的运行结果外,其它数据信息一律隔离在运行环境内,无法读取或者下载。
附图说明
[0017]图1为本专利技术的工作流程图;图2为本专利技术的数据使用工作流程图;图3为本专利技术的计算结果数据使用流程图;图4为本专利技术的计算环境结构图。
具体实施方式
[0018]以下结合附图对本专利技术做进一步详本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.超级计算与云计算环境下大数据安全隐私计算控制方法,其特征在于:包括以下步骤:步骤1、数据管理员根据样例数据规则对原始数据进行数据保护级别判定;步骤2、通过步骤1判定的数据保护级别并且根据样例数据生成系统对原始数据进行脱敏采集,并生成样例数据;步骤3、将步骤2生成的样例数据加密并传输到安全存储系统中;步骤4、数据应用方向数据管理员进行请求,数据管理员对请求进行审批;步骤5、数据应用方对步骤3中的样例数据在算法调试系统中进行调试,并生成算法模型;步骤6、数据应用方将步骤4中得到的算法模型输入至超级计算任务执行系统云计算环境中,计算任务执行系统进行可信计算并将计算结果传送至数据应用方。2.根据权利要求1所述的超级计算与云计算环境下大数据安全隐私计算控制方法,其特征在于:所述步骤2中的样例数据生成系统、步骤4的算法调试系统和步骤5的计算任务执行系统云计算环境位于虚拟化隔离环境中,原始数据、样例数据、算法模型和计算结果数据位于数据存储系统中。3.根据权利要求1所述的超级计算与云计算环境下大数据安全隐私计算控制方法,其特征在于:所述步骤1中样例数据规则为:根据原始数据中的敏感信息的敏感程度设定不同的保护级别。4.根据权利要求1所述的超级计算与云计算环境下大数据安全隐私计算控制方法,其特征在于:所述步骤3的具体实现方法为:样例数据通过的SSL或TLS安全隧道的方式加密传输至安全存储系统中,同时将原始数据的指纹信息写入区块链,并记录原始数据的特征码。5.根据权利要求1所述的超级计算与云计算环境下大数据安全隐私计算控制方法,其特征在于:所述步骤4包括以下步骤:步骤4.1、数据应用方根据需求填写结果数据申请表,并发送至数据管理员;步骤4.2、数据管理员对数据应用方的需求进行审核,若审核通过则进行步骤4.3,否则返回步骤4.1,数据应用方重新根据需求填写结果数据申请表;步骤4.3、数据所有方对数据应用方的需求进行审核,若审核通过则进行向数据应用方发送样例数据的解密秘钥,同时数据应用方获取样例数据,否则返回步骤4.1。6.根据权利要求1或4...

【专利技术属性】
技术研发人员:庞晓磊张婷吴晓菲赵欣婷李长松王普杨晶李学智贾子傲张森乐刘嘉琦
申请(专利权)人:国家超级计算天津中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1