一种基于元学习和知识蒸馏的租户监控方法技术

技术编号：42686310 阅读：21 留言：0更新日期：2024-09-10 12:34

本发明专利技术涉及一种基于元学习和知识蒸馏的租户监控方法，属于云计算领域，采用基于元学习的方法使得神经网络模型能动态调整模型参数以达到最优，并能较好的适应不同数据特征的变化。极大节省了人力和时间成本。考虑到元学习需要训练多个子任务中的模型，为了有效降低训练的资源消耗和提高模型的运行效率，使用了知识蒸馏的方法在模型之间进行有效知识信息的传递，降低了模型的资源消耗。但由于知识蒸馏需要预先训练一个复杂的教师模型，仍无法较好的适用于资源受限的设备。对此，本发明专利技术采用了自蒸馏的方法，在传统的知识蒸馏思想上使用模型在迭代训练中自身获取到的有效知识信息指导后续的模型训练，整体降低了模型训练的资源消耗。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于云计算领域，是iaas平台租户监控侧中的一个重要环节，尤其涉及一种基于元学习和知识蒸馏的租户监控方法。

技术介绍

1、随着信息化、互联网、移动互联网等技术的逐渐普及，使得低成本海量的数据存储和大规模的并行计算在基于互联网的新型服务体系架构下得到了快速发展。在这样的背景下，云计算作为一种通过集群的方式将计算能力通过互联网向用户提供服务的模式得到了越来越多的关注。

2、在云计算领域中，租户端资源的监控对维持整个客户业务流程的稳定性和可靠性起着至关重要的作用。因此，研究如何能高效的在租户端进行监控具有重要的研究意义和价值。传统的监控方案通常是采用被动监控的方式，通过在宿主机或者云主机上安装相应的代理程序来监控网络资源开销和系统占用。这种方式在系统资源出现异常的情况下，存在监控识别及数据上传产生一定时延使得运维无法及时进行处理，导致用户体验不佳等问题。得益于机器学习和深度学习的快速发展，有相关研究将基于深度学习的神经网络模型运用到监控中，通过深度神经网络模型强大的特征识别和学习能力，能够从以往发生监控报警前的数据中学习到相关特征信息，并主动分析日常的监控数据为可能发生异常的资源进行预警。通过主动监控的方式将发生监控报警的时间点前移，为后续的问题处理提供更加充裕的时间。

3、目前对于主动监控的模式主要使用的是基于神经网络的方法，这种方式存在需要人为的去调整参数，不适合于复杂的深度神经网络模型。模型的泛化能力也较低，对新的场景和新的数据特征会耗费大量的时间和人力成本。神经网络方法的准确率随着参数层数的增

4、因此，需要提供一种基于元学习和知识蒸馏的租户监控方法，旨在解决上述问题。

技术实现思路

1、鉴于以上现有技术的不足，专利技术的目的在于提供一种基于元学习和知识蒸馏的租户监控方法，使得传统的神经网络模型能动态调整自身参数设置，能适应动态变化的数据特征，并能有效降低模型的资源消耗。

2、本专利技术提出了一种基于元学习和知识蒸馏的租户监控方法，包括以下步骤：

3、获取租户监控的历史数据，对监控的历史数据进行标准化处理得到标准的数据集；

4、构建预设的深度神经网络模型，并对深度神经网络模型进行初始化参数设置；

5、利用元学习和知识蒸馏的方法进行模型训练，所述模型训练包括训练任务阶段和测试任务阶段；在训练任务阶段中，将整个训练任务划分为若干个子任务，每个子任务数据集分为训练集和测试集，利用子任务中训练集训练出相对于各个子任务的模型参数，在每个子任务中的模型训练过程中利用自蒸馏进行知识迁移，将上一迭代中获取的增益信息传递到当前迭代中；在测试任务阶段中，将数据集划分为训练集和测试集，并把经过训练任务得出的参数设置进行验证；

6、将得到的模型搭载到监控系统服务端，将模型内置并集成到监控程序的服务端中，对收集到的监控数据进行处理和分析，反馈数据的预测走势。

7、进一步地，所述对监控的历史数据进行标准化处理得到标准的数据集的步骤，具体包括：对所获取的历史数据进行标准化处理，根据各项监控指标进行二维化处理，并进行标注，所述监控指标包括cpu的使用率、空闲率、用户态以及内核态的使用时间、磁盘的吞吐量、吞吐速率和网络的速率；连接一个时间戳作为获取指标数据的时间记录；数据的格式与监控面板工具普罗米修斯所需的格式相符合，以便于监控数据的展示；对历史数据中重复的时间点进行合并，对合并后的空值进行向后重采样进行填补，得到标准的数据集。

8、进一步地，所述构建预设的深度神经网络模型的步骤，具体包括：使用标准的卷积神经网络，包含输入层、卷积层、池化层、全连接层以及激活函数；将输入层的输出与卷积层的输入端进行连接，卷积层的输出端后面连接一个激活函数，激活函数使用relu函数；激活函数的输出连接一个池化层和全连接层，并对模型进行初始化参数设置。

9、进一步地，所述利用元学习和知识蒸馏的方法进行模型训练时还会提取和融合不同子任务中的特征信息，避免模型的局部最优；再利用子任务的测试集计算出损失值并进行调整，最后利用梯度下降的方法更新超参数。

10、进一步地，所述训练任务阶段将任务划分为n个子任务，每个子任务中的数据集划分为训练集和测试集，子任务数量n的取值由监控指标格式决定，利用子任务中的训练集去训练构建初始的深度神经网络模型，得出训练后的子任务中的模型参数，然后利用不同子任务中的测试集去调整模型参数，整个过程的损失函数定义公式为：

11、

12、其中，n表示个子任务的数量，表示模型参数权重，表示整个任务的损失函数，整个过程的损失函数的值是由各个子任务中损失函数值的累加和，将初始构建的神经网络模型定义为θ，将训练后的模型参数权重赋值给θ。

13、进一步地，在子任务的训练集中，随着迭代过程中不断更新参数，定义为：

14、

15、表示第i个子任务中迭代更新以后的模型，θi表示第i个子任务迭代时的模型，αi表示i个子任务的学习率，在每个子任务中进行迭代训练，并分别在每个子任务中的测试集上计算损失值，最后计算总任务中的损失值。

16、进一步地，所述损失值定义为：

17、

18、通过将任务划分为若干个子任务，使得模型能获取数据中的局部特征信息，通过将每个任务中获取到的特征信息进行融合使得模型获取跨任务域的数据特征信息；将各个子任务中的特征信息融合，使得模型在能敏锐捕捉局部特征信息的同时还能够学习到数据的全局特征信息。

19、进一步地，在子任务模型的训练过程中利用知识蒸馏的方式进行知识迁移，通过优化教师模型和学生模型的软目标输出之间的kl散度损失来传递教师模型所提炼到的知识信息，定义为：

20、

21、分别表示学生模型和教师模型的软目标的预测值，τ表示温度系数，利用上一批次的历史信息生成将其作为一个更即时的平滑标签，用于正则化。

22、进一步地，利用自蒸馏进行知识迁移时，将第t次迭代中采样的原始数据批次表示为网络参数表示为θt，用网络中的第t-1次迭代中产生的软标签代替并引入了上一次迭代中的一次性正则化损失值，定义为公式：

23、

24、进一步地，所述测试任务阶段时，元学习在不同的子任务上使用不同的模型参数分别进行迭代训练，再将从各个子任务中获取到的特征参数信息进行聚合更新，使得模型能自主的调整权重参数适应不同的训练任务。

25、本专利技术有益效果如下：

26、1、现有的数据预测模型通常使用的是基于深度神经网络的模型，弊端是针对不同的数据场景下需要人为的不断调整参数，耗费大量的时间和人力成本。本专利技术使用元学习的方法能够自适应不同的数据场景，动态调整模型参数，极大的节省了时间和人力。并且改进了元学习的运行过程，在子任务模型的训练过程中使用自蒸馏的方式进行本文档来自技高网...

【技术保护点】

1.一种基于元学习和知识蒸馏的租户监控方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于元学习和知识蒸馏的租户监控方法，其特征在于，所述对监控的历史数据进行标准化处理得到标准的数据集的步骤，具体包括：对所获取的历史数据进行标准化处理，根据各项监控指标进行二维化处理，并进行标注，所述监控指标包括CPU的使用率、空闲率、用户态以及内核态的使用时间、磁盘的吞吐量、吞吐速率和网络的速率；连接一个时间戳作为获取指标数据的时间记录；数据的格式与监控面板工具普罗米修斯所需的格式相符合，以便于监控数据的展示；对历史数据中重复的时间点进行合并，对合并后的空值进行向后重采样进行填补，得到标准的数据集。

3.根据权利要求1所述的一种基于元学习和知识蒸馏的租户监控方法，其特征在于，所述构建预设的深度神经网络模型的步骤，具体包括：使用标准的卷积神经网络，包含输入层、卷积层、池化层、全连接层以及激活函数；将输入层的输出与卷积层的输入端进行连接，卷积层的输出端后面连接一个激活函数，激活函数使用ReLu函数；激活函数的输出连接一个池化层和全连接层，并对模型进行初始化参数设置。

4.根据权利要求1所述的一种基于元学习和知识蒸馏的租户监控方法，其特征在于，所述利用元学习和知识蒸馏的方法进行模型训练时还会提取和融合不同子任务中的特征信息，避免模型的局部最优；再利用子任务的测试集计算出损失值并进行调整，最后利用梯度下降的方法更新超参数。

5.根据权利要求1所述的一种基于元学习和知识蒸馏的租户监控方法，其特征在于，所述训练任务阶段将任务划分为n个子任务，每个子任务中的数据集划分为训练集和测试集，子任务数量n的取值由监控指标格式决定，利用子任务中的训练集去训练构建初始的深度神经网络模型，得出训练后的子任务中的模型参数，然后利用不同子任务中的测试集去调整模型参数，整个过程的损失函数定义公式为：

6.根据权利要求5所述的一种基于元学习和知识蒸馏的租户监控方法，其特征在于，在子任务的训练集中，随着迭代过程中不断更新参数，定义为：

7.根据权利要求6所述的一种基于元学习和知识蒸馏的租户监控方法，其特征在于，所述损失值定义为：

8.根据权利要求7所述的一种基于元学习和知识蒸馏的租户监控方法，其特征在于，在子任务模型的训练过程中利用知识蒸馏的方式进行知识迁移，通过优化教师模型和学生模型的软目标输出之间的KL散度损失来传递教师模型所提炼到的知识信息，定义为：

9.根据权利要求8所述的一种基于元学习和知识蒸馏的租户监控方法，其特征在于，利用自蒸馏进行知识迁移时，将第t次迭代中采样的原始数据批次表示为网络参数表示为θt，用网络中的第t-1次迭代中产生的软标签代替并引入了上一次迭代中的一次性正则化损失值，定义为公式：

10.根据权利要求1所述的一种基于元学习和知识蒸馏的租户监控方法，其特征在于，所述测试任务阶段时，元学习在不同的子任务上使用不同的模型参数分别进行迭代训练，再将从各个子任务中获取到的特征参数信息进行聚合更新，使得模型能自主的调整权重参数适应不同的训练任务。

...

【技术特征摘要】

1.一种基于元学习和知识蒸馏的租户监控方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于元学习和知识蒸馏的租户监控方法，其特征在于，所述对监控的历史数据进行标准化处理得到标准的数据集的步骤，具体包括：对所获取的历史数据进行标准化处理，根据各项监控指标进行二维化处理，并进行标注，所述监控指标包括cpu的使用率、空闲率、用户态以及内核态的使用时间、磁盘的吞吐量、吞吐速率和网络的速率；连接一个时间戳作为获取指标数据的时间记录；数据的格式与监控面板工具普罗米修斯所需的格式相符合，以便于监控数据的展示；对历史数据中重复的时间点进行合并，对合并后的空值进行向后重采样进行填补，得到标准的数据集。

3.根据权利要求1所述的一种基于元学习和知识蒸馏的租户监控方法，其特征在于，所述构建预设的深度神经网络模型的步骤，具体包括：使用标准的卷积神经网络，包含输入层、卷积层、池化层、全连接层以及激活函数；将输入层的输出与卷积层的输入端进行连接，卷积层的输出端后面连接一个激活函数，激活函数使用relu函数；激活函数的输出连接一个池化层和全连接层，并对模型进行初始化参数设置。

5.根据权利要求1所述的一种基于元学习和知识蒸馏的租户监...

【专利技术属性】
技术研发人员：刘俊，张玉，李平保，石明坤，凌徐，
申请(专利权)人：天翼云科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人