一种模型训练方法以及相关设备技术

技术编号:38686114 阅读:26 留言:0更新日期:2023-09-02 22:59
本申请实施例公开了一种模型训练方法以及相关设备,用于提高异常识别的准确性。本申请实施例方法包括:获取多个第一样本,多个第一样本中的每个第一样本包括应用遭遇一个异常时的第一性能数据以及异常的标识,且多个第一样本中的所有第一性能数据都为应用在相同的计算模式时的性能数据,计算模式与应用处理各项任务的时间占比存在关联关系,异常为影响应用的运行性能的因素。基于多个第一样本进行训练,得到第一模型。得到第一模型。得到第一模型。

【技术实现步骤摘要】
一种模型训练方法以及相关设备


[0001]本申请实施例涉及计算机领域,尤其涉及一种模型训练方法以及相关设备。

技术介绍

[0002]高性能计算机群是一种能够处理大资料量以及进行高速运算的电脑,其上可以运行多种应用。由于通信链路质量差以及非法进程干扰等各种异常的影响,应用运行的性能会劣化,这时需要确定造成应用运行的性能劣化的具体异常。
[0003]当前主要通过模型对应用遭遇的异常进行识别,通过将应用的性能数据输入模型,模型输出对异常的识别结果。模型的训练方式为在应用的运行过程中模拟各种异常,并获取应用在各种异常的持续时间内的性能数据,从而得到训练数据包括所模拟的异常的标识以及在该异常持续时间内的性能数据,再基于训练数据对模型进行训练。
[0004]然而在当前的技术中,应用在各种异常的持续时间内往往处于不同的计算模式,不同的计算模式也会对性能数据产生较大的影响,因此所训练得到的模型准确性不足。

技术实现思路

[0005]本申请实施例提供了一种模型训练方法以及相关设备,用于提高异常识别的准确性。r/>[0006]本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取多个第一样本,所述多个第一样本中的每个第一样本包括应用遭遇一个异常时的第一性能数据以及所述异常的标识,且所述多个第一样本中的所有所述第一性能数据都为所述应用在相同的计算模式时的性能数据,所述计算模式与所述应用处理各项任务的时间占比存在关联关系,所述异常为影响所述应用的运行性能的因素;基于所述多个第一样本进行训练,得到第一模型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取多个第二样本,所述多个第二样本中的每个第二样本包括所述应用处于一个所述计算模式时的第二性能数据以及所述计算模式的标识;基于所述多个第二样本进行训练,得到第二模型。3.根据权利要求2所述的方法,其特征在于,所述第一性能数据以及所述第二性能数据包括网络收发包速率、内存占用率以及中央处理器占用率。4.根据权利要求3所述的方法,其特征在于,所述各类任务包括计算任务、通信任务以及读写任务。5.根据权利要求4所述的方法,其特征在于,一个所述异常包括设备质量异常、通信链路异常以及进程干扰中的一种情况。6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:将所述应用的第三性能数据输入所述第一模型中;获取所述第一模型输出的所述异常的标识以及概率值,所述概率值用于指示所述异常发生的概率。7.根据权利要求6所述的方法,其特征在于,所述第三性能数据为所述应用在目标时间窗口的性能数据,所述目标时间窗口为所述应用运行过程中的一段时间;所述方法还包括:将所述第三性能数据输入所述第二模型;获取所述第二模型输出的识别结果;所述将第一性能数据输入第一模型中包括:若所述识别结果与预设计算模式标识不同,则将所述第一性能数据输入所述第一模型中,所述预设计算模式标识用于指示所述应用在所述目标时间窗口的所述计算模式。8.根据权利要求7所述的方法,其特征在于,所述第一性能数据与所述第三性能数据都为所述应用在相同的所述计算模式时的性能数据。9.一种模型训练设备,其特征在于,包括:获取单元,用于获取多个第一样本,所述多个第一样本中的每个第一样本包括应用遭遇一个异常时的第一性能数据以及所述异常的标识,且所述多个第一样本中的所有所述第一性能数据都为所述应用在相同的计算模式时的性能数据,所述计算模式与所述应用处理各项任务的时间占比存在关联关系,所述异常为影...

【专利技术属性】
技术研发人员:杨杰朱杰胡敏
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1