基于安全屋的数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39185386 阅读:11 留言:0更新日期:2023-10-27 08:32
本发明专利技术涉及金融科技领域,揭露一种基于安全屋的数据处理方法,包括:响应于第一客户端请求构建安全屋;将数据集划分为公开样本集和非公开样本集,将公开样本集传输至安全屋的前端,将非公开样本集传输至安全屋的后端;利用前端接收第一代码对公开样本集进行调试,将调试后的第二代码和训练环境打包为虚拟镜像文件;利用后端挂载虚拟镜像文件和非公开样本集,生成初始模型的训练参数,基于训练参数以使第二客户端对初始模型调试得到目标模型并返回至第一客户端。本发明专利技术应用在金融科技领域中,在委托模型开发过程,确保委托方的金融数据的敏感信息放置于没有第三方接触到的后台中,避免金融数据发生泄露的技术问题,提高金融交易数据的安全性。融交易数据的安全性。融交易数据的安全性。

【技术实现步骤摘要】
基于安全屋的数据处理方法、装置、电子设备及存储介质


[0001]本专利技术涉及金融科技领域的数据处理领域,尤其涉及一种基于安全屋的数据处理方法、装置、电子设备及存储介质。

技术介绍

[0002]在金融科技领域中,数据是企业非常重要的资产,比如,用户数据和业务数据。这些用户数据和业务数据大多会涉及到用户的电子支付、网络购物、证券交易等敏感属性的信息。
[0003]通常企业需要利用机器学习模型对数据进行模型预测,以确定业务运营的布局,至于如何确保金融科技领域的敏感属性信息不被第三方盗取,是企业一直重视的金融安全课题。
[0004]机器学习模型一般由模型服务的承接方来提供,例如,委托方(企业)直接将金融科技领域的数据交给承接方,或通过可信的第三方交换双方数据,最后由承接方训练出机器学习模型。
[0005]但在数据训练或交换的过程中,只要第三方或承接方能接触到敏感属性信息的数据(例如,用户的银行帐号,信用卡帐号、保险订单、网络购物地址),都会存在发生数据泄露的风险,造成金融安全事件的发生,例如,承接方可以保存数据副本或第三方泄露、篡改数据。

技术实现思路

[0006]鉴于以上内容,有必要提供一种基于安全屋的数据处理方法,其目的在于解决现有技术中金融科技领域的敏感属性信息存在发生泄露的技术问题。
[0007]本专利技术提供的基于安全屋的数据处理方法,包括:响应第一客户端的数据处理请求,在预设的可信环境中构建安全屋,所述数据处理请求包含有待处理的数据集;将所述数据集划分为公开样本集和非公开样本集,将所述公开样本集传输至所述安全屋的前端,将所述非公开样本集传输至所述安全屋的后端;利用所述前端接收第二客户端输入的第一代码对所述公开样本集进行调试,将调试后得到的第二代码和训练环境打包为虚拟镜像文件;利用所述后端挂载所述虚拟镜像文件和所述非公开样本集,生成预设的初始模型的训练参数,基于所述训练参数以使所述第二客户端执行所述第二代码对所述初始模型进行调试得到目标模型,将所述目标模型返回至所述第一客户端。可选的,所述安全屋包括前端、后端及虚拟机云桌面,所述前端用于接收所述第一客户端上传的数据集,及以供所述第二客户端进行代码调试,所述后端用于显示所述初始模型的训练参数。
[0008]可选的,所述利用所述前端接收第二客户端输入的第一代码对所述公开样本集进
行调试,将调试后得到的第二代码和第一训练环境打包为虚拟镜像文件,包括:接收所述第二客户端在所述虚拟机云桌面的第一显示界面输入的第一代码进行部署第一训练环境;基于所述第一训练环境和所述第一代码,对所述公开样本集进行调试,将调试后得到的所述第二代码和所述第一训练环境打包为所述虚拟镜像文件。
[0009]可选的,所述利用所述后端挂载所述虚拟镜像文件和所述非公开样本集,生成预设的初始模型的训练参数,包括:利用所述后端的镜像挂载工具对所述虚拟镜像文件进行挂载,生成所述初始模型;利用所述非公开样本集对所述初始模型进行训练,得到所述初始模型的训练参数。
[0010]可选的,所述利用所述非公开样本集对所述初始模型进行训练,得到所述初始模型的训练参数,包括:利用所述非公开样本集的训练集确定所述初始模型的参数;利用所述非公开样本集的验证集确定所述初始模型的网络结构和超参数;利用所述非公开样本集的测试集检验所述初始模型的泛化能力参数;将所述参数、所述网络结构、所述超参数及所述泛化能力参数作为所述训练参数。
[0011]可选的,所述基于所述训练参数以使所述第二客户端执行所述第二代码对所述初始模型进行调试得到目标模型,包括:基于所述初始模型的训练参数;接收所述第二客户端在所述前端的第一显示界面对所述第二代码进行调试,以使所述初始模型的损失函数小于阈值,得到所述目标模型。
[0012]可选的,在所述将所述目标模型返回至所述第一客户端之前,该方法还包括:将所述安全屋中除了所述目标模型以外的所有数据进行销毁,并将所述目标模型导出。
[0013]为了解决上述问题,本专利技术还提供一种基于安全屋的数据处理装置,所述装置包括:请求模块,用于响应第一客户端的数据处理请求,在预设的可信环境中构建安全屋,所述数据处理请求包含有待处理的数据集;划分模块,用于将所述数据集划分为公开样本集和非公开样本集,将所述公开样本集传输至所述安全屋的前端,将所述非公开样本集传输至所述安全屋的后端;打包模块,用于利用所述前端接收第二客户端输入的第一代码对所述公开样本集进行调试,将调试后得到的第二代码和训练环境打包为虚拟镜像文件;调试模块,用于利用所述后端挂载所述虚拟镜像文件和所述非公开样本集,生成预设的初始模型的训练参数,基于所述训练参数以使所述第二客户端执行所述第二代码对所述初始模型进行调试得到目标模型,将所述目标模型返回至所述第一客户端。
[0014]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的基于安全屋的数据处理程序,所述基于安全屋的数据处理程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述基于安全屋的数据处理方法。
[0015]为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于安全屋的数据处理程序,所述基于安全屋的数据处理程序可被一个或者多个处理器执行,以实现上述基于安全屋的数据处理方法。
[0016]相较现有技术,本专利技术响应第一客户端的数据处理请求,在预设的可信环境中构建安全屋,所述数据处理请求包含有待处理的数据集;将所述数据集划分为公开样本集和非公开样本集,将公开样本集传输至安全屋的前端,将非公开样本集传输至无人接触的安全屋的后端,确保第二客户端由始到终都没有机会接触到非公开样本集,有效保证了敏感数据(非公开样本集)的安全性。
[0017]利用所述前端接收第二客户端输入的第一代码对所述公开样本集进行调试,将调试后得到的第二代码和训练环境打包为虚拟镜像文件;利用所述后端挂载所述虚拟镜像文件和所述非公开样本集,生成预设的初始模型的训练参数,基于所述训练参数以使所述第二客户端执行所述第二代码对所述初始模型进行调试得到目标模型,将所述目标模型返回至所述第一客户端。确保委托方(企业)的金融科技领域的敏感属性信息在安全屋中只进不出,第二客户端在后端只能观看到模型的训练参数,无法进入后端修改第二代码,通过后端确保第二客户端在整个流程中均无法接触到非公开样本集,只能在前端利用金融科技领域的非敏感属性信息进行作业,保障了敏感属性信息的非公开样本集不会发生一丝一毫的泄露,也防止第二客户端利用公开样本集对非公开样本集进行精确查询,提高了金融领域的数据交易的安全性。
附图说明
[0018]图1为本专利技术一实施例提供的基于安全屋的数据处理方法的流程示意图;图2为本专利技术一实施例提供的基于安全屋的数据处理装置的模块示意图;图3为本专利技术一实施例提供的实现基于安全屋的数据处理方法的电子设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于安全屋的数据处理方法,其特征在于,所述方法包括:响应第一客户端的数据处理请求,在预设的可信环境中构建安全屋,所述数据处理请求包含有待处理的数据集;将所述数据集划分为公开样本集和非公开样本集,将所述公开样本集传输至所述安全屋的前端,将所述非公开样本集传输至所述安全屋的后端;利用所述前端接收第二客户端输入的第一代码对所述公开样本集进行调试,将调试后得到的第二代码和训练环境打包为虚拟镜像文件;利用所述后端挂载所述虚拟镜像文件和所述非公开样本集,生成预设的初始模型的训练参数,基于所述训练参数以使所述第二客户端执行所述第二代码对所述初始模型进行调试得到目标模型,将所述目标模型返回至所述第一客户端。2.如权利要求1所述的基于安全屋的数据处理方法,其特征在于,所述安全屋包括前端、后端及虚拟机云桌面,所述前端用于接收所述第一客户端上传的数据集,及以供所述第二客户端进行代码调试,所述后端用于显示所述初始模型的训练参数。3.如权利要求1所述的基于安全屋的数据处理方法,其特征在于,所述利用所述前端接收第二客户端输入的第一代码对所述公开样本集进行调试,将调试后得到的第二代码和第一训练环境打包为虚拟镜像文件,包括:接收所述第二客户端在所述虚拟机云桌面的第一显示界面输入的第一代码进行部署第一训练环境;基于所述第一训练环境和所述第一代码,对所述公开样本集进行调试,将调试后得到的所述第二代码和所述第一训练环境打包为所述虚拟镜像文件。4.如权利要求1所述的基于安全屋的数据处理方法,其特征在于,所述利用所述后端挂载所述虚拟镜像文件和所述非公开样本集,生成预设的初始模型的训练参数,包括:利用所述后端的镜像挂载工具对所述虚拟镜像文件进行挂载,生成所述初始模型;利用所述非公开样本集对所述初始模型进行训练,得到所述初始模型的训练参数。5.如权利要求1所述的基于安全屋的数据处理方法,其特征在于,所述利用所述非公开样本集对所述初始模型进行训练,得到所述初始模型的训练参数,包括:利用所述非公开样本集的训练集确定所述初始模型的参数;利用所述非公开样本集的验证集确定所述初始模型的网络结构和超参数;利用所述非公开样本集的测试集检验所述...

【专利技术属性】
技术研发人员:刘鹏伊旻忞陈远旭
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1