一种用于隐私保护环境下执行机器学习的系统技术方案

技术编号：40071694 阅读：8 留言：0更新日期：2024-01-17 00:16

本发明专利技术提供了一种用于隐私保护环境下执行机器学习的系统，涉及电数字数据处理领域，包括数据加密模块、模型训练模块、训练分析模块和加密优化模块，所述数据加密模块用于对训练数据进行加密处理，所述模型训练模块用于对加密后的数据进行训练处理，所述训练分析模块用于对训练的成果进行分析，所述加密优化模块根据分析成果对数据加密模块进行参数优化；本系统通过对加密数据的训练效果进行分析，不断优化加密参数，强化训练效果，使得原始数据在加密后也能够用于机器学习之中。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及电数字数据处理领域，具体涉及一种用于隐私保护环境下执行机器学习的系统。

技术介绍

1、机器学习需要大量的数据用于训练，而这些数据会涉及到隐私问题，若对数据进行简单地加密处理后再训练，会影响到训练效果，甚至会实现不了机器学习的目的，因此，需要一种能够寻找一种适配加密方式的系统，实现保护隐私的前提下能够提高训练效果的目标。

2、
技术介绍
的前述论述仅意图便于理解本专利技术。此论述并不认可或承认提及的材料中的任一种公共常识的一部分。

3、现在已经开发出了很多机器学习系统，经过大量的检索与参考，发现现有的机器学习系统有如公开号为cn108717514b所公开的系统，这些系统方法一般包括以下步骤：1)选择需要应用的加密算法及系统参数，生成密钥；2)对原始数据进行加密，产生相应的密文数据；3)使用密文数据对需要使用的机器学习模型进行训练和参数调整，得到最优机器学习模型；4)采用步骤2)方法将待预测或分类的原始数据用步骤1)中的密钥进行加密，输入最优机器学习模型，得到预测或分类结果。但是该系统仅仅是从有限的加密算法中选择一种方式进行加密，无法保证这种加密方式的训练效果，可能导致无法实现机器学习目的。

技术实现思路

1、本专利技术的目的在于，针对所存在的不足，提出了一种用于隐私保护环境下执行机器学习的系统。

2、本专利技术采用如下技术方案：

3、一种用于隐私保护环境下执行机器学习的系统，包括数据加密模块、模型训练模块、训练分析模块和加密优化模块；

4、所述数据加密模块用于对训练数据进行加密处理，所述模型训练模块用于对加密后的数据进行训练处理，所述训练分析模块用于对训练的成果进行分析，所述加密优化模块根据分析成果对数据加密模块进行参数优化；

5、所述数据加密模块包括数据拆分单元、输入加密单元、输出加密单元、秘钥管理单元和数据整合单元，所述数据拆分单元用于将原始数据拆分为输入部分和结果部分，所述输入加密单元用于对数据的输入部分进行加密处理，所述输出加密单元用于对数据的结果部分进行加密处理，所述秘钥管理单元用于记录加密流程中的参数，所述数据整合单元用于将加密后的输入部分和结果部分配对整合成样本数据；

6、所述模型训练模块包括训练单元、训练管理单元和训练统计单元，所述训练单元用于对样本数据进行训练处理，所述训练管理单元用于存储样本数据并对训练的轮次进行管理，所述训练统计单元用于对每个轮次的训练结果进行统计记录；

7、所述训练分析模块包括离散分析单元和效果预测单元，所述离散分析单元用于对统计结果的离散性进行分析处理，所述效果预测单元用于对模型的极限效果和所需轮次进行预测；

8、所述加密优化模块包括历史记录单元、参数优化单元和参数输出单元，所述历史记录单元用于记录每组参数训练效果的历史数据，所述参数优化单元用于对参数进行优化计算处理，所述参数输出单元用于将优化后的参数发送至数据加密模块；

9、进一步的，所述训练统计单元包括单轮统计处理器、效果计算处理器和效果记录处理器，所述单轮统计处理器用于对每一轮训练时的结果进行统计，所述效果计算处理器在每轮训练结束后对统计的结果进行计算处理得到效果数据，所述效果记录处理器用于记录每一轮的效果数据；

10、所述效果计算处理器根据下式计算出模型效果值a：

11、；

12、其中，为该轮次处理的样本数据数量，为第i种结果的样本数据数量，为第i种结果且判断正确的样本数据数量，m为结果种类数量；

13、进一步的，所述离散分析单元包括效果分组处理器、局部计算处理器和离散计算处理器，所述效果分组处理器根据轮次将效果数据分成有序的多个小组，所述局部计算处理器用于对每个小组的效果数据进行计算处理，所述离散计算处理器根据每个小组的计算结果处理得到所有效果数据的离散度；

14、所述离散计算处理器根据下式计算出离散度dp：

15、；

16、其中，ng为效果数据分成的组数，为第i组效果数据的均值，为第i组效果数据的标准差；

17、进一步的，所述效果预测单元包括拟合处理器、差异计算处理器和预测输出处理器，所述拟合处理器用于创建一个拟合曲线，所述差异计算处理器用于计算出效果数据与拟合曲线的差异值，所述预测输出处理器用于输出预测数据；

18、所述拟合处理器创建的拟合曲线为：

19、；

20、其中，c、k和b为曲线参数；

21、进一步的，所述差异计算处理器将效果数据的序号作为输入值x计算出在拟合曲线中的输出值，并根据下式计算出差异值：

22、；

23、其中，turn为轮次数量，表示第i轮次的效果值；

24、所述差异计算处理器选择差异值最小的拟合曲线并发送给所述预测输出处理器；

25、所述预测输出处理器根据接收的拟合曲线计算出为阈值时的x时，取整处理后记为，将作为预测轮次，将c作为极限效果发送给所述加密优化模块。

26、本专利技术所取得的有益效果是：

27、本系统通过对加密数据的训练效果进行分析，不断优化加密方式，使得加密数据也能够实现机器学习的目的，在具体分析过程中，通过对训练效果数据的离散性进行分析，能够快速获知当前加密方式下能否进行机器学习，通过曲线拟合来预测机器学习的效果，最终找到合适的加密参数。

28、为使能更进一步了解本专利技术的特征及
技术实现思路
，请参阅以下有关本专利技术的详细说明与附图，然而所提供的附图仅用于提供参考与说明，并非用来对本专利技术加以限制。

本文档来自技高网...

【技术保护点】

1.一种用于隐私保护环境下执行机器学习的系统，其特征在于，包括数据加密模块、模型训练模块、训练分析模块和加密优化模块；

2.如权利要求1所述的一种用于隐私保护环境下执行机器学习的系统，其特征在于，所述训练统计单元包括单轮统计处理器、效果计算处理器和效果记录处理器，所述单轮统计处理器用于对每一轮训练时的结果进行统计，所述效果计算处理器在每轮训练结束后对统计的结果进行计算处理得到效果数据，所述效果记录处理器用于记录每一轮的效果数据；

3.如权利要求2所述的一种用于隐私保护环境下执行机器学习的系统，其特征在于，所述离散分析单元包括效果分组处理器、局部计算处理器和离散计算处理器，所述效果分组处理器根据轮次将效果数据分成有序的多个小组，所述局部计算处理器用于对每个小组的效果数据进行计算处理，所述离散计算处理器根据每个小组的计算结果处理得到所有效果数据的离散度；

4.如权利要求3所述的一种用于隐私保护环境下执行机器学习的系统，其特征在于，所述效果预测单元包括拟合处理器、差异计算处理器和预测输出处理器，所述拟合处理器用于创建一个拟合曲线，所述差异计算处理器用

5.如权利要求4所述的一种用于隐私保护环境下执行机器学习的系统，其特征在于，所述差异计算处理器将效果数据的序号作为输入值x计算出在拟合曲线中的输出值，并根据下式计算出差异值：

...

【技术特征摘要】

1.一种用于隐私保护环境下执行机器学习的系统，其特征在于，包括数据加密模块、模型训练模块、训练分析模块和加密优化模块；

3.如权利要求2所述的一种用于隐私保护环境下执行机器学习的系统，其特征在于，所述离散分析单元包括效果分组处理器、局部计算处理器和离散计算处理器，所述效果分组处理器根据轮次...

【专利技术属性】
技术研发人员：张卫平，丁洋，王晶，李显阔，王丹，
申请(专利权)人：环球数科集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人