数据处理方法技术

技术编号:39409695 阅读:9 留言:0更新日期:2023-11-19 16:01
本公开涉及一种数据处理方法

【技术实现步骤摘要】
数据处理方法、装置、可读介质及电子设备


[0001]本公开涉及计算机
,具体地,涉及一种数据处理方法

装置

可读介质及电子设备


技术介绍

[0002]大语言模型
(Large Language Model

LLM)
在人工智能和自然语言处理领域有着广泛的应用场景,并且大语言模型涉及大量用户数据以及模型算法,因此数据和模型的安全变得尤为重要

[0003]在模型微调或使用过程中,需要获取相应的模型以及数据以进行模型微调或模型推理

在获取数据以及模型的过程中,若数据和模型被恶意窃取,会导致数据和模型的泄露

此外,利用集群或云服务进行模型微调或模型推理时,由于集群或云服务的环境可能是不可信的,集群节点在进行数据处理的过程中,也有可能导致数据和模型的泄露


技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述


技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围

[0005]第一方面,本公开提供一种数据处理方法,所述方法包括:
[0006]接收数据处理任务;
[0007]确定所述数据处理任务对应的目标数据和所述目标数据对应的目标第一密钥,所述目标数据由第一密钥对待处理数据加密得到,所述目标第一密钥由第一会话密钥对所述第一密钥加密得到,所述第一会话密钥由所述数据处理任务的任务处理方和所述第一密钥的密钥持有方协商得到;
[0008]通过目标计算节点根据所述第一会话密钥对所述目标第一密钥进行解密,得到所述第一密钥,并根据所述第一密钥对所述目标数据进行解密,得到所述待处理数据,其中,所述目标计算节点运行在可信执行环境中;
[0009]根据目标模型和所述待处理数据,确定数据处理结果,所述目标模型是基于模型密钥对加密的所述目标模型解密得到的,所述模型密钥保存在密钥管理服务,所述密钥管理服务运行在所述可信执行环境中

[0010]第二方面,本公开提供一种数据处理装置,所述装置包括:
[0011]接收模块,用于接收数据处理任务;
[0012]确定模块,用于确定所述数据处理任务对应的目标数据和所述目标数据对应的目标第一密钥,所述目标数据由第一密钥对待处理数据加密得到,所述目标第一密钥由第一会话密钥对所述第一密钥加密得到,所述第一会话密钥由所述数据处理任务的任务处理方和所述第一密钥的密钥持有方协商得到;
[0013]解密模块,用于通过目标计算节点根据所述第一会话密钥对所述目标第一密钥进
行解密,得到所述第一密钥,并根据所述第一密钥对所述目标数据进行解密,得到所述待处理数据,其中,所述目标计算节点运行在可信执行环境中;
[0014]处理模块,用于根据目标模型和所述待处理数据,确定数据处理结果,所述目标模型是基于模型密钥对加密的所述目标模型解密得到的,所述模型密钥保存在密钥管理服务,所述密钥管理服务运行在所述可信执行环境中

[0015]第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现第一方面中任一项所述方法的步骤

[0016]第四方面,本公开提供一种电子设备,包括:
[0017]存储装置,其上存储有计算机程序;
[0018]处理装置,用于执行所述存储装置中的所述计算机程序,以实现第一方面中任一项所述方法的步骤

[0019]通过上述技术方案,首先接收数据处理任务,然后确定数据处理任务对应的目标数据和目标数据对应的目标第一密钥,进而通过目标计算节点根据第一会话密钥对目标第一密钥进行解密,得到第一密钥,并根据第一密钥对目标数据进行解密,得到待处理数据,最后根据目标模型和待处理数据,确定数据处理结果

其中,目标数据由第一密钥对待处理数据加密得到,目标模型是基于保存在密钥管理服务中的模型密钥对加密的目标模型解密得到的,并且目标计算节点和密钥管理服务运行均在可信执行环境中

[0020]采用上述方法,解密目标数据的第一密钥是基于第一会话密钥进行加密通信获取的,解密加密的目标模型的模型密钥是保存在可信执行环境中的,且解密的过程也在可信执行环境中进行,这样在获取数据以及模型的过程中,即使数据和模型被恶意窃取也无法进行解密,后续数据处理的过程同样也是在可信执行环境中进行,从而保障数据和模型的安全,进而可以保护数据中的隐私数据

[0021]本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明

附图说明
[0022]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征

优点及方面将变得更加明显

贯穿附图中,相同或相似的附图标记表示相同或相似的元素

应当理解附图是示意性的,原件和元素不一定按照比例绘制

在附图中:
[0023]图1是根据一示例性实施例提供的一种数据处理方法的流程示意图;
[0024]图2是根据一示例性实施例提供的一种模型推理的流程示意图;
[0025]图3是根据一示例性实施例提供的一种执行微调任务的流程示意图;
[0026]图4是根据一示例性实施例提供的一种部署镜像文件的流程示意图;
[0027]图5是根据一示例性实施例提供的一种数据处理装置的框图;
[0028]图6是根据一示例性实施例提供的一种电子设备的框图

具体实施方式
[0029]下面将参照附图更详细地描述本公开的实施例

虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开

应当理解的
是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围

[0030]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和
/
或并行执行

此外,方法实施方式可以包括附加的步骤和
/
或省略执行示出的步骤

本公开的范围在此方面不受限制

[0031]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。
术语“基于”是“至少部分地基于”。
术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。
其他术语的相关定义将在下文描述中给出
。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种数据处理方法,其特征在于,所述方法包括:接收数据处理任务;确定所述数据处理任务对应的目标数据和所述目标数据对应的目标第一密钥,所述目标数据由第一密钥对待处理数据加密得到,所述目标第一密钥由第一会话密钥对所述第一密钥加密得到,所述第一会话密钥由所述数据处理任务的任务处理方和所述第一密钥的密钥持有方协商得到;通过目标计算节点根据所述第一会话密钥对所述目标第一密钥进行解密,得到所述第一密钥,并根据所述第一密钥对所述目标数据进行解密,得到所述待处理数据,其中,所述目标计算节点运行在可信执行环境中;根据目标模型和所述待处理数据,确定数据处理结果,所述目标模型是基于模型密钥对加密的所述目标模型解密得到的,所述模型密钥保存在密钥管理服务,所述密钥管理服务运行在所述可信执行环境中
。2.
根据权利要求1所述的方法,其特征在于,所述数据处理任务为模型微调任务,所述确定所述数据处理任务对应的目标数据和所述目标数据对应的目标第一密钥,包括:通过所述目标计算节点基于所述数据处理任务中携带的数据路径读取所述目标数据,并向所述密钥管理服务请求所述目标第一密钥;所述根据目标模型和所述待处理数据,确定数据处理结果,包括:根据所述待处理数据执行所述模型微调任务,并根据所述模型微调任务的执行结果对所述目标模型进行微调,得到目标微调模型
。3.
根据权利要求2所述的方法,其特征在于,所述向所述密钥管理服务请求所述目标第一密钥,包括:在所述目标计算节点和所述密钥管理服务基于各自的远程证明信息进行双向远程证明建立第一安全通道后,向所述密钥管理服务请求所述目标第一密钥;其中,所述目标计算节点的远程证明信息用于验证所述目标计算节点运行的硬件环境和代码逻辑,所述密钥管理服务的远程证明信息用于验证所述密钥管理服务运行的硬件环境和代码逻辑,所述密钥管理服务预先保存有所述第一密钥和第一密钥访问策略,所述密钥管理服务用于当所述第一密钥访问策略和所述目标计算节点的远程证明信息匹配时,向所述目标计算节点下发所述目标第一密钥
。4.
根据权利要求3所述的方法,其特征在于,所述密钥管理服务中的所述第一密钥和所述第一密钥访问策略是通过如下方式得到的:通过所述密钥管理服务响应于远程证明请求,根据所述密钥管理服务的远程证明信息确定第二会话密钥;根据所述第二会话密钥与所述待处理数据的数据提供方进行加密通信,基于所述加密通信确定所述第一密钥和所述第一密钥访问策略并进行保存,其中,所述第一密钥由所述数据提供方或所述密钥管理服务生成,所述第一密钥访问策略由所述数据提供方生成
。5.
根据权利要求2所述的方法,其特征在于,所述方法还包括:在根据所述模型微调任务的执行结果对所述目标模型进行微调,得到目标微调模型之后,基于所述模型密钥对所述目标微调模型进行加密,并将加密后的目标微调模型保存到模型仓库;
将所述模型密钥和所述模型密钥的模型密钥访问策略发送给所述密钥管理服务进行保存
。6.
根据权利要求2所述的方法,其特征在于,所述目标计算节点的数量为多个,所述方法还包括:在所述根据所述待处理数据执行所述模型微调任务之前,通过每一所述目标计算节点向所述密钥管理服务请求任务节点凭证;所述根据所述待处理数据执行所述模型微调任务,并根据所述模型微调任务的执行结果对所述目标模型进行微调,得到目标微调模型,包括:通过多个所述目标计算节点根据所述待处理数据执行所述模型微调任务,并根据所述模型微调任务的执行结果对所述目标模型进行微调,得到目标微调模型,其中每个所述目标计算节点之间根据所述任务节点凭证进行加密通信,以交互所述模型微调任务的相关数据
。7.
根据权利要求2所述的方法,其特征在于,所述接收数据处理任务,包括:通过中心节点接收所述模型微调任务;所述方法还包括:根据所述模型微调任务的任务信息,确定用于执行所述模型微调任务的至少一个目标计算节点,并将所述模型微调任务分发给所述至少一个目标计算节点
。8.
根据权利要求1‑7任一项所述的方法,其特征在于,所述数据处理任务为模型推理任务,所述确定所述数据处理任务对应的目标数据和所述目标数据对应的目标第一密钥,包括:确定所述模型推理任务中携带的所述目标数据和所述目标第一密钥,其中,所述目标第一密钥由所述第一会话密钥的公钥对所述第一密钥加密得到,所述第一会话密钥包括所述公钥和私钥;所述通过目标计算节点根据所述第一会话密钥对所述目标第一密钥进行解密,得到所述第一密钥,包括:通过目标计算节点根据所述私钥对所述目标第一密钥进行解密,得到所述第一密钥;所述根据目标模型和所述待处理数据,确定数据处理结果,包括:根据所述目标模型和所述待处理数据进行模型推理,得到模型推理结果
。9.
根据权利要求8所述的方法,其特征在于,所述方法还包括:在所述接收客户端发送的模型推理任务之前,响应于所述客户端发送的远程证明请求,基于所述目标计算节点的远程证明...

【专利技术属性】
技术研发人员:闫露张尧陈典刘敬彬吴烨
申请(专利权)人:北京火山引擎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1