【技术实现步骤摘要】
数据处理方法、装置、可读介质及电子设备
[0001]本公开涉及计算机
,具体地,涉及一种数据处理方法
、
装置
、
可读介质及电子设备
。
技术介绍
[0002]大语言模型
(Large Language Model
,
LLM)
在人工智能和自然语言处理领域有着广泛的应用场景,并且大语言模型涉及大量用户数据以及模型算法,因此数据和模型的安全变得尤为重要
。
[0003]在模型微调或使用过程中,需要获取相应的模型以及数据以进行模型微调或模型推理
。
在获取数据以及模型的过程中,若数据和模型被恶意窃取,会导致数据和模型的泄露
。
此外,利用集群或云服务进行模型微调或模型推理时,由于集群或云服务的环境可能是不可信的,集群节点在进行数据处理的过程中,也有可能导致数据和模型的泄露
。
技术实现思路
[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述
。
该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围
。
[0005]第一方面,本公开提供一种数据处理方法,所述方法包括:
[0006]接收数据处理任务;
[0007]确定所述数据处理任务对应的目标数据和所述目标数据对应的目标第一密钥,所述目标数据由第一密钥对待处理数 ...
【技术保护点】
【技术特征摘要】
1.
一种数据处理方法,其特征在于,所述方法包括:接收数据处理任务;确定所述数据处理任务对应的目标数据和所述目标数据对应的目标第一密钥,所述目标数据由第一密钥对待处理数据加密得到,所述目标第一密钥由第一会话密钥对所述第一密钥加密得到,所述第一会话密钥由所述数据处理任务的任务处理方和所述第一密钥的密钥持有方协商得到;通过目标计算节点根据所述第一会话密钥对所述目标第一密钥进行解密,得到所述第一密钥,并根据所述第一密钥对所述目标数据进行解密,得到所述待处理数据,其中,所述目标计算节点运行在可信执行环境中;根据目标模型和所述待处理数据,确定数据处理结果,所述目标模型是基于模型密钥对加密的所述目标模型解密得到的,所述模型密钥保存在密钥管理服务,所述密钥管理服务运行在所述可信执行环境中
。2.
根据权利要求1所述的方法,其特征在于,所述数据处理任务为模型微调任务,所述确定所述数据处理任务对应的目标数据和所述目标数据对应的目标第一密钥,包括:通过所述目标计算节点基于所述数据处理任务中携带的数据路径读取所述目标数据,并向所述密钥管理服务请求所述目标第一密钥;所述根据目标模型和所述待处理数据,确定数据处理结果,包括:根据所述待处理数据执行所述模型微调任务,并根据所述模型微调任务的执行结果对所述目标模型进行微调,得到目标微调模型
。3.
根据权利要求2所述的方法,其特征在于,所述向所述密钥管理服务请求所述目标第一密钥,包括:在所述目标计算节点和所述密钥管理服务基于各自的远程证明信息进行双向远程证明建立第一安全通道后,向所述密钥管理服务请求所述目标第一密钥;其中,所述目标计算节点的远程证明信息用于验证所述目标计算节点运行的硬件环境和代码逻辑,所述密钥管理服务的远程证明信息用于验证所述密钥管理服务运行的硬件环境和代码逻辑,所述密钥管理服务预先保存有所述第一密钥和第一密钥访问策略,所述密钥管理服务用于当所述第一密钥访问策略和所述目标计算节点的远程证明信息匹配时,向所述目标计算节点下发所述目标第一密钥
。4.
根据权利要求3所述的方法,其特征在于,所述密钥管理服务中的所述第一密钥和所述第一密钥访问策略是通过如下方式得到的:通过所述密钥管理服务响应于远程证明请求,根据所述密钥管理服务的远程证明信息确定第二会话密钥;根据所述第二会话密钥与所述待处理数据的数据提供方进行加密通信,基于所述加密通信确定所述第一密钥和所述第一密钥访问策略并进行保存,其中,所述第一密钥由所述数据提供方或所述密钥管理服务生成,所述第一密钥访问策略由所述数据提供方生成
。5.
根据权利要求2所述的方法,其特征在于,所述方法还包括:在根据所述模型微调任务的执行结果对所述目标模型进行微调,得到目标微调模型之后,基于所述模型密钥对所述目标微调模型进行加密,并将加密后的目标微调模型保存到模型仓库;
将所述模型密钥和所述模型密钥的模型密钥访问策略发送给所述密钥管理服务进行保存
。6.
根据权利要求2所述的方法,其特征在于,所述目标计算节点的数量为多个,所述方法还包括:在所述根据所述待处理数据执行所述模型微调任务之前,通过每一所述目标计算节点向所述密钥管理服务请求任务节点凭证;所述根据所述待处理数据执行所述模型微调任务,并根据所述模型微调任务的执行结果对所述目标模型进行微调,得到目标微调模型,包括:通过多个所述目标计算节点根据所述待处理数据执行所述模型微调任务,并根据所述模型微调任务的执行结果对所述目标模型进行微调,得到目标微调模型,其中每个所述目标计算节点之间根据所述任务节点凭证进行加密通信,以交互所述模型微调任务的相关数据
。7.
根据权利要求2所述的方法,其特征在于,所述接收数据处理任务,包括:通过中心节点接收所述模型微调任务;所述方法还包括:根据所述模型微调任务的任务信息,确定用于执行所述模型微调任务的至少一个目标计算节点,并将所述模型微调任务分发给所述至少一个目标计算节点
。8.
根据权利要求1‑7任一项所述的方法,其特征在于,所述数据处理任务为模型推理任务,所述确定所述数据处理任务对应的目标数据和所述目标数据对应的目标第一密钥,包括:确定所述模型推理任务中携带的所述目标数据和所述目标第一密钥,其中,所述目标第一密钥由所述第一会话密钥的公钥对所述第一密钥加密得到,所述第一会话密钥包括所述公钥和私钥;所述通过目标计算节点根据所述第一会话密钥对所述目标第一密钥进行解密,得到所述第一密钥,包括:通过目标计算节点根据所述私钥对所述目标第一密钥进行解密,得到所述第一密钥;所述根据目标模型和所述待处理数据,确定数据处理结果,包括:根据所述目标模型和所述待处理数据进行模型推理,得到模型推理结果
。9.
根据权利要求8所述的方法,其特征在于,所述方法还包括:在所述接收客户端发送的模型推理任务之前,响应于所述客户端发送的远程证明请求,基于所述目标计算节点的远程证明...
【专利技术属性】
技术研发人员:闫露,张尧,陈典,刘敬彬,吴烨,
申请(专利权)人:北京火山引擎科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。