一种基于敏感度感知的大模型分层加密部署方法技术

技术编号：45859576 阅读：13 留言：0更新日期：2025-07-19 11:17

本发明专利技术公开一种基于敏感度感知的大模型分层加密部署方法,涉及大语言模型数据安全领域；步骤1：针对大模型的网络的Transformer Block结构，划分高敏感层和低敏感层，步骤2：针对用户输入的请求数据，进行敏感词检测，若存在敏感词则将请求数据中包含敏感词的部分定向到大模型的可信执行环境TEE，用于进行高敏感层的加密计算；对请求数据中剩余部分分流到GPU集群进行低敏感层的计算。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术公开一种基于敏感度感知的大模型分层加密部署方法,涉及大语言模型数据安全领域。

技术介绍

1、各行各业都在设法部署本领域的大模型应用，由于大语言模型规模庞大，训练一个性能满足需求的大模型，对于普通企业来说比较困难，因此常规做法是使用开源的大语言模型经过微调等手段应用到行业企业内。但由于模型开源的特性，势必存在安全性的问题，尤其是在大语言模型(large language models,llms)加速赋能高敏感行业，如医疗、金融、政务的进程中，仍存在数据隐私与推理安全问题。

技术实现思路

1、本专利技术针对现有技术的问题，提供一种基于敏感度感知的大模型分层加密部署方法，基于敏感数据与计算分离的原则，通过设置可信执行环境安全tee岛，采用模型动态分层加密的方法将敏感度较高的数据及模型层分别计算，达到保护数据隐私的目的，并降低推理性能损失。

2、本专利技术提出的具体方案是：

3、本专利技术提供一种基于敏感度感知的大模型分层加密部署方法，包括：

4、步骤...

【技术保护点】

1.一种基于敏感度感知的大模型分层加密部署方法，其特征是包括：

2.根据权利要求1所述的一种基于敏感度感知的大模型分层加密部署方法，其特征是步骤1中划分高敏感层和低敏感层，包括：输入测试数据，获取每一层Transformer Block对应的输出，将每层的输出分别输入模型反演攻击模拟器，让攻击模拟器反推真实输入，评估攻击模拟器反推的输入与真实输入之间的误差，若误差低于设定阈值则对应的Transformer Block结构为高敏感层，若误差高于设定阈值则对应的Transformer Block结构为低敏感层。

3.根据权利要求1所述的一种基于敏感度感知的大模型分层加...

【技术特征摘要】

1.一种基于敏感度感知的大模型分层加密部署方法，其特征是包括：

2.根据权利要求1所述的一种基于敏感度感知的大模型分层加密部署方法，其特征是步骤1中划分高敏感层和低敏感层，包括：输入测试数据，获取每一层transformer block对应的输出，将每层的输出分别输入模型反演攻击模拟器，让攻击模拟器反推真实输入，评估攻击模拟器反推的输入与真实输入之间的误差，若误差低于设定阈值则对应的transformer block结构为高敏感层，若误差高于设定阈值则对应的transformer block结构为低敏感层。

3.根据权利要求1所述的一种基于敏感度感知的大模型分层加密部署方法，其特征是步骤2中tee进行加密计算，包括：

4.根据权利要求3所述的一种基于敏感度感知的大模型分层加密部署方法，其特征是步骤2中在gpu集群计算tee传输的块，并将计算结果返回至tee解密，包括：

5.一种基于敏感度感知的大模型分...

【专利技术属性】
技术研发人员：郝虹，赵鑫鑫，姜凯，
申请(专利权)人：山东浪潮科学研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人