信息系统风险预警方法、装置、设备和介质制造方法及图纸

技术编号:38563000 阅读:8 留言:0更新日期:2023-08-22 21:02
本公开提供了一种信息系统风险预警方法和装置,可以应用于人工智能、信息安全技术领域。该方法包括:在风险提示窗口期内以第一时间间隔为单位采集窗口,采集所述信息系统的n个指标的值,得到与所述风险提示窗口期对应的第一时间序列数据,其中n为大于或等于2的整数;转换所述第一时间序列数据为第一灰度图像数据;以及输入所述第一灰度图像数据至训练好的风险检测模型,并获得所述风险检测模型输出的分类结果,其中,所述分类结果用于表示所述信息系统在所述风险提示窗口期内存在异常或不存在异常。本公开还提供了一种风险检测模型的训练方法和装置,以及相应的电子设备、存储介质和程序产品。介质和程序产品。介质和程序产品。

【技术实现步骤摘要】
信息系统风险预警方法、装置、设备和介质


[0001]本公开涉及人工智能、信息安全
,具体地涉及一种信息系统风险预警方法和装置,一种风险检测模型的训练方法和装置,一种电子设备、存储介质和程序产品。

技术介绍

[0002]信息系统运维是指对企业或组织的信息系统进行监控、管理、维护和优化等一系列活动,以确保其正常运行和高效运转。近年来,随着企业或组织对信息系统运营效率和可靠性的要求越来越高,利用数据分析和机器学习技术来预测和减少运维风险已经成为了一个重要的应用方向。
[0003]信息系统的运维风险预测主要通过时间序列数据的应用来进行。时间序列数据是指按照时间顺序排列的一系列数据,例如某个系统每小时的运行数据。时间序列数据的分析可以帮助企业或组织预测未来的趋势和行为,并采取相应的措施来减少运维风险,实现运维工作的自动化,以提高生产效率、减少停机时间并减少运维成本。
[0004]由于机器学习算法限制,在处理多维度数据时,会产生数据降维、特征选择、数据融合、过拟合、维度爆炸等问题,增加数据预处理和数据计算的复杂度。因此,目前借助于机器学习算法进行运维风险预测的时主要使用单一节点的单一指标(如CPU使用率),存在较大的局限性。

技术实现思路

[0005]鉴于上述问题,本公开提供了一种可以通过信息系统中多维度的性能数据,进行信息系统风险识别感知和事前预警的信息系统风险预警方法和装置,以及一种风险检测模型的训练方法和装置,一种电子设备、存储介质和程序产品。
[0006]本公开实施例的第一方面,提供了一种信息系统风险预警方法。所述方法包括:在风险提示窗口期内以第一时间间隔为单位采集窗口,采集所述信息系统的n个指标的值,得到与所述风险提示窗口期对应的第一时间序列数据;其中,在同一单位采集窗口内采集到的所述n个指标的值构成一个多维指标数据,每个多维指标数据中设置有对应的时间戳;其中n为大于或等于2的整数;按照预定的转换方式转换所述第一时间序列数据为第一灰度图像数据,其中,在所述转换方式中,不同多维指标数据对应的像素区域按照时间戳先后顺序排列,并且每个多维指标数据对应的像素区域中像素的灰度值,由该多维指标数据中每个指标的值映射得到;以及输入所述第一灰度图像数据至训练好的风险检测模型,并获得所述风险检测模型输出的分类结果,其中,所述分类结果用于表示所述信息系统在所述风险提示窗口期内存在异常或不存在异常。
[0007]根据本公开的实施例,所述按照预定的转换方式转换所述第一时间序列数据为第一灰度图像数据包括:在二维图像区域中,以x轴上划分出的n个等长区间分别对应所述n个指标,并以y轴上每个坐标对应一个时间戳;对所述第一时间序列中的每个指标的值,采取与每个指标对应的标准化处理方法,标准化处理为取值范围为[0,255]的值;以及以标准化
处理后得到的每个指标的值作为所述二维图像区域中对应像素的灰度值,填充所述二维图像区域,以得到所述第一灰度图像数据。
[0008]根据本公开实施例,所述风险检测模型的训练过程包括:在预定时间范围内以第二时间间隔为单位采集窗口,采集所述n个指标的值,得到与所述预定时间范围对应的原始时间序列数据;基于所述原始时间序列数据中每个多维指标数据对应的单位采集窗口中所述信息系统的状态,记录所述原始时间序列数据中每个多维指标数据的状态为异常或正常;基于多维指标数据的时间戳,利用第二时间窗口切分所述原始时间序列数据,其中,切分到同一个所述第二时间窗口中的多维指标数据构成一个样本;当所述样本中包含状态为异常的多维指标数据时,标记所述样本为负样本,否则标记所述样本为正样本;按照所述转换方式转换所述样本为第二灰度图像数据;以所述第二灰度图像数据和所述样本的标记,作为一个训练数据,训练所述风险检测模型。
[0009]根据本公开的实施例,所述基于多维指标数据的时间戳,利用第二时间窗口切分所述原始时间序列数据包括:分别按照时间临近性采样和时间周期性采样两种方式切分所述原始时间序列数据。
[0010]根据本公开的实施例,按照所述时间临近性采样切分所述原始时间序列数据包括:以每个状态为异常的多维指标数据的时间戳作为一个第二时间窗口的截止时刻,将该多维指标数据和时间戳位于所述第二时间窗口内的其他多维指标数据,切分到一起组成一个样本。
[0011]根据本公开的实施例,按照所述时间周期性采样切分所述原始时间序列数据包括:以所述第二时间窗口的时长为周期,利用所述第二时间窗口顺次切分所述原始时间序列数据。
[0012]根据本公开的实施例,所述利用第二时间窗口切分所述原始时间序列数据还包括:当按照所述时间临近性采样和所述时间周期性采样两种方式切分出的样本中,存在包含完全相同的多维指标数据的样本时,仅保留其中一个样本。
[0013]根据本公开的实施例,所述基于所述原始时间序列数据中每个多维指标数据对应的单位采集窗口中所述信息系统的状态,记录所述原始时间序列数据中每个多维指标数据的状态为异常或正常包括:当任意的第一多维指标数据对应的单位采集窗口内所述信息系统开始出现异常状态时,记录所述第一多维指标数据和在所述第一多维指标数据之前采集到的至少一个多维指标数据的状态均为异常;以及当任意的第二多维指标数据对应的单位采集窗口内所述信息系统由先前的异常状态转变为正常状态,记录所述第二多维指标数据和在所述第二多维指标数据之后采集到的至少一个多维指标数据的状态均为异常。
[0014]根据本公开的实施例,所述n个指标包括以下至少之一:CPU使用率、内存使用率、磁盘使用率、存储IO时延、网络流量、或网络连接个数。
[0015]根据本公开的实施例,所述风险检测模型包括残差网络模型。
[0016]本公开实施例的第二方面,提供了一种风险检测模型的训练方法。所述训练方法包括:在预定时间范围内以第二时间间隔为单位采集窗口,采集信息系统的n个指标的值,得到与所述预定时间范围对应的原始时间序列数据,其中,其中,在同一单位采集窗口内采集到的所述n个指标的值构成一个多维指标数据,每个多维指标数据中设置有对应的时间戳;基于所述原始时间序列数据中每个多维指标数据对应的单位采集窗口中所述信息系统
的状态,记录所述原始时间序列数据中每个多维指标数据的状态为异常或正常;基于多维指标数据的时间戳,利用第二时间窗口切分所述原始时间序列数据,其中,切分到同一个所述第二时间窗口中的多维指标数据构成一个样本;当所述样本中包含状态为异常的多维指标数据时,标记所述样本为负样本,否则标记所述样本为正样本;按照预定的转换方式转换所述样本为第二灰度图像数据;其中,在所述转换方式中,不同多维指标数据对应的像素区域按照时间戳先后顺序排列,并且每个多维指标数据对应的像素区域中像素的灰度值,由该多维指标数据中每个指标的值映射得到;以及以所述第二灰度图像数据和所述样本的标记,作为一个训练数据,训练所述风险检测模型。
[0017]根据本公开的实施例,所述按照预定的转换方式转换所述原始时间序列数据为第二灰度图像数据包括:在二维图像本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息系统风险预警方法,包括:在风险提示窗口期内以第一时间间隔为单位采集窗口,采集所述信息系统的n个指标的值,得到与所述风险提示窗口期对应的第一时间序列数据;其中,在同一单位采集窗口内采集到的所述n个指标的值构成一个多维指标数据,每个多维指标数据中设置有对应的时间戳;其中n为大于或等于2的整数;按照预定的转换方式转换所述第一时间序列数据为第一灰度图像数据,其中,在所述转换方式中,不同多维指标数据对应的像素区域按照时间戳先后顺序排列,并且每个多维指标数据对应的像素区域中像素的灰度值,由该多维指标数据中每个指标的值映射得到;以及输入所述第一灰度图像数据至训练好的风险检测模型,并获得所述风险检测模型输出的分类结果,其中,所述分类结果用于表示所述信息系统在所述风险提示窗口期内存在异常或不存在异常。2.根据权利要求1所述的方法,其中,所述按照预定的转换方式转换所述第一时间序列数据为第一灰度图像数据包括:在二维图像区域中,以x轴上划分出的n个等长区间分别对应所述n个指标,并以y轴上每个坐标对应一个时间戳;对所述第一时间序列中的每个指标的值,采取与每个指标对应的标准化处理方法,标准化处理为取值范围为[0,255]的值;以及以标准化处理后得到的每个指标的值作为所述二维图像区域中对应像素的灰度值,填充所述二维图像区域,以得到所述第一灰度图像数据。3.根据权利要求1所述的方法,其中,所述风险检测模型的训练过程包括:在预定时间范围内以第二时间间隔为单位采集窗口,采集所述n个指标的值,得到与所述预定时间范围对应的原始时间序列数据;基于所述原始时间序列数据中每个多维指标数据对应的单位采集窗口中所述信息系统的状态,记录所述原始时间序列数据中每个多维指标数据的状态为异常或正常;基于多维指标数据的时间戳,利用第二时间窗口切分所述原始时间序列数据,其中,切分到同一个所述第二时间窗口中的多维指标数据构成一个样本;当所述样本中包含状态为异常的多维指标数据时,标记所述样本为负样本,否则标记所述样本为正样本;按照所述转换方式转换所述样本为第二灰度图像数据;以及以所述第二灰度图像数据和所述样本的标记,作为一个训练数据,训练所述风险检测模型。4.根据权利要求3所述的方法,其中,所述基于多维指标数据的时间戳,利用第二时间窗口切分所述原始时间序列数据包括:分别按照时间临近性采样和时间周期性采样两种方式切分所述原始时间序列数据。5.根据权利要求3所述的方法,其中,按照所述时间临近性采样切分所述原始时间序列数据包括:以每个状态为异常的多维指标数据的时间戳作为一个第二时间窗口的截止时刻,将该多维指标数据和时间戳位于所述第二时间窗口内的其他多维指标数据,切分到一起组成一
个样本。6.根据权利要求3所述的方法,其中,按照所述时间周期性采样切分所述原始时间序列数据包括:以所述第二时间窗口的时长为周期,利用所述第二时间窗口顺次切分所述原始时间序列数据。7.根据权利要求4所述的方法,其中,所述利用第二时间窗口切分所述原始时间序列数据还包括:当按照所述时间临近性采样和所述时间周期性采样两种方式切分出的样本中,存在包含完全相同的多维指标数据的样本时,仅保留其中一个样本。8.根据权利要求3所述的方法,其中,所述基于所述原始时间序列数据中每个多维指标数据对应的单位采集窗口中所述信息系统的状态,记录所述原始时间序列数据中每个多维指标数据的状态为异常或正常包括:当任意的第一多维指标数据对应的单位采集窗口内所述信息系统开始出现异常状态时,记录所述第一多维指标数据和在所述第一多维指标数据之前采集到的至少一个多维指标数据的状态均为异常;以及当任意的第二多维指标数据对应的单位采集窗口内所述信息系统由先前的异常状态转变为正常状态,记录所述第二多维指标数据和在所述第二多维指标数据之后采集到的至少一个多维指标数据的状态均为异常。9.根据权利要求1所述的方法,其中,所述n个指标包括以下至少之一:CPU使用率、内存使用率、磁盘使用率、存储...

【专利技术属性】
技术研发人员:楼闯宇张蕊李吉孙杰
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1