基于自然语言描述的异常时序指标生成系统与方法技术方案

技术编号:37373122 阅读:16 留言:0更新日期:2023-04-27 07:17
本发明专利技术提供了一种基于自然语言描述的异常时序指标生成方法及系统,包括:步骤S1:构建典型指标样本库;步骤S2:构建异常时序指标生成器,并利用典型指标样本库训练异常时序指标生成器,得到训练后的异常时序指标生成器;步骤S3:利用训练后的异常时序指标生成器基于自然语言描述生成异常时序指标。本发明专利技术通过将多个异常指标矩阵化,使得系统可以表达某一异常场景下多个指标的相关现象,使得数据模拟更为全面。全面。全面。

【技术实现步骤摘要】
基于自然语言描述的异常时序指标生成系统与方法


[0001]本专利技术涉及时序数据处理
,具体地,涉及基于自然语言描述的异常时序指标生成系统与方法。

技术介绍

[0002]在智能运维领域,包含异常时序指标的数据是用于构建异常检测系统与评估异常检测系统有效性的重要资源。如在CPU异常时的“CPU占用率”、“内存占用率”、“磁盘吞吐率”、“业务成功率”等时序指标可用于构建与评估“CPU异常监控子模块”。目前,可通过专业运维人员构建系统仿真或基于规则的模拟生成异常时序指标数据。但仿真系统的成本高、灵活性不足,规则模拟欠缺真实性,且使用上述方法要求操作人员具备相关专业背景和技能。
[0003]专利文献CN115033386A(申请号:202210772022.4)公开了一种时序数据生成方法、装置及存储介质,用于提高非平稳时序数据的模拟精度和效率。本申请公开的时序数据生成方法包括:进行硬件配置;根据所述硬件配置进行具体配置;根据所述具体配置构建时序数据生成系统;根据所述时序数据生成系统生成时序数据。该专利需要根据具体要求调整生成的配置,对使用人员的专业性要求较高、成本也较高。
[0004]专利文献CN112926802A(申请号:202110354068.X)公开了一种时序数据对抗样本生成方法、系统、电子设备及存储介质;所述方法包括使用原始时序数据训练时序预测模型;采用随机梯度下降优化策略计算所述时序预测模型中损失函数的最大值;根据所述损失函数的最大值确定出对应的噪声;对所述原始时序数据叠加所述噪声生成全局扰动的时序数据对抗样本。该专利使用了对抗的方法生成数据,数据的仿真性有保障,但无法通过控制输入而得到不同类型的数据;本专利技术所述通过自然语言控制输出数据类型,同时“自然语言”这一输入形式降低了对应用人员技术背景的要求。
[0005]本专利技术提出基于自然语言描述的异常时序指标生成系统与方法,该系统与方法接收使用自然语言描述的异常,生成与语言描述对应的异常时序指标数据,且可以基于某一系统的历史指标日志生成具备该系统特点的异常(如指标的周期性、平稳性等特点)。该系统与方法降低了异常时序指标的构建成本,对比现有方法在灵活性、真实性方面得到了提高。

技术实现思路

[0006]针对现有技术中的缺陷,本专利技术的目的是提供一种基于自然语言描述的异常时序指标生成方法及系统。
[0007]根据本专利技术提供的一种基于自然语言描述的异常时序指标生成方法,包括:
[0008]步骤S1:构建指标样本库;
[0009]步骤S2:构建异常时序指标生成器,并利用指标样本库训练异常时序指标生成器,得到训练后的异常时序指标生成器;
[0010]步骤S3:利用训练后的异常时序指标生成器基于自然语言描述生成异常时序指标。
[0011]优选地,所述步骤S1采用:
[0012]步骤S1.1:基于预设场景收集指标数据,构成指标数据集;
[0013]步骤S1.2:对收集的指标数据进行归一化处理,得到归一化处理后的指标数据集;
[0014]步骤S1.3:基于归一化处理后的指标数据集构建预设场景异常指标样本库;
[0015]步骤S1.4:基于归一化处理后的指标数据集构建预设场景正常指标样本库;
[0016]所述预设场景包括:CPU占满、CPU停止、内存占满以及网络中断;
[0017]所述指标包括:CPU占用率、内存占用率、网络吞吐率以及业务成功率;
[0018]所述异常指标样本库为异常描述文本标签和相应的异常指标数据矩阵组成的二元组;
[0019]所述正常指标样本库为正常描述文本标签和相应的指标数据矩阵组成的二元组。
[0020]优选地,所述步骤S2采用:
[0021]步骤S2.1:构建异常时序指标矩阵生成器,包括时序指标矩阵判别器和时序指标矩阵生成器;
[0022]步骤S2.2:构建时序指标矩阵判别器所需样本集合,包括正样本集合和负样本集合;
[0023]步骤S2.3:基于时序指标矩阵判别器所需样本集合优化当前时序指标矩阵判别器的参数;
[0024]步骤S2.4:构建时序指标矩阵生成器所需样本集合,每个样本为[(预设长度的文本向量,随机短向量),1],其中,1表示样本标签;
[0025]步骤S2.5:将构建的时序指标矩阵生成器所需样本集合输入当前异常时序指标矩阵生成器,得到相应判别标签,基于判别标签和样本标签优化当前时序指标矩阵生成器,重复触发步骤S2.2至步骤S2.5,直至迭代次数达到预设值,得到训练后的异常时序指标矩阵生成器;
[0026]所述正样本集合包括:[(预设长度的文本向量,相对应的指标数据),1],其中,1表示正样本;
[0027]所述负样本集合包括:[(预设长度的文本向量,时序指标矩阵),0]以及[(与当前时序指标矩阵不对应的预设长度的文本向量,时序指标矩阵),0],其中,0表示负样本。
[0028]优选地,所述异常时序指标矩阵生成器采用:
[0029]步骤S2.1.1:将描述文本标签转化为预设长度的文本向量;
[0030]步骤S2.1.2:基于预设长度的文本向量以及随机短向量输入时序指标矩阵生成器获得尺寸与指标数据矩阵一致的时序指标矩阵;
[0031]步骤S2.1.3:将预设长度的文本向量与时序指标矩阵输入时序指标矩阵判别器,输出0或1;其中,0表示假;1表示真。
[0032]优选地,所述步骤S3采用:
[0033]步骤S3.1:基于自然语言描述利用训练后的异常时序指标矩阵生成器获取时序指标矩阵;
[0034]步骤S3.2:解析时序指标矩阵得到异常指标时序。
[0035]根据本专利技术提供的一种基于自然语言描述的异常时序指标生成系统,包括:
[0036]模块M1:构建指标样本库;
[0037]模块M2:构建异常时序指标生成器,并利用指标样本库训练异常时序指标生成器,得到训练后的异常时序指标生成器;
[0038]模块M3:利用训练后的异常时序指标生成器基于自然语言描述生成异常时序指标。
[0039]优选地,所述模块M1采用:
[0040]模块M1.1:基于预设场景收集指标数据,构成指标数据集;
[0041]模块M1.2:对收集的指标数据进行归一化处理,得到归一化处理后的指标数据集;
[0042]模块M1.3:基于归一化处理后的指标数据集构建预设场景异常指标样本库;
[0043]模块M1.4:基于归一化处理后的指标数据集构建预设场景正常指标样本库;
[0044]所述预设场景包括:CPU占满、CPU停止、内存占满以及网络中断;
[0045]所述指标包括:CPU占用率、内存占用率、网络吞吐率以及业务成功率;
[0046]所述异常指标样本库为异常描述文本标签和相应的异常指标数据矩阵组成的二元组;
[0047]所述正常指标样本库为正常描述文本标签和相应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自然语言描述的异常时序指标生成方法,其特征在于,包括:步骤S1:构建指标样本库;步骤S2:构建异常时序指标生成器,并利用指标样本库训练异常时序指标生成器,得到训练后的异常时序指标生成器;步骤S3:利用训练后的异常时序指标生成器基于自然语言描述生成异常时序指标。2.根据权利要求1所述的基于自然语言描述的异常时序指标生成方法,其特征在于,所述步骤S1采用:步骤S1.1:基于预设场景收集指标数据,构成指标数据集;步骤S1.2:对收集的指标数据进行归一化处理,得到归一化处理后的指标数据集;步骤S1.3:基于归一化处理后的指标数据集构建预设场景异常指标样本库;步骤S1.4:基于归一化处理后的指标数据集构建预设场景正常指标样本库;所述预设场景包括:CPU占满、CPU停止、内存占满以及网络中断;所述指标包括:CPU占用率、内存占用率、网络吞吐率以及业务成功率;所述异常指标样本库为异常描述文本标签和相应的异常指标数据矩阵组成的二元组;所述正常指标样本库为正常描述文本标签和相应的指标数据矩阵组成的二元组。3.根据权利要求1所述的基于自然语言描述的异常时序指标生成方法,其特征在于,所述步骤S2采用:步骤S2.1:构建异常时序指标矩阵生成器,包括时序指标矩阵判别器和时序指标矩阵生成器;步骤S2.2:构建时序指标矩阵判别器所需样本集合,包括正样本集合和负样本集合;步骤S2.3:基于时序指标矩阵判别器所需样本集合优化当前时序指标矩阵判别器的参数;步骤S2.4:构建时序指标矩阵生成器所需样本集合,每个样本为[(预设长度的文本向量,随机短向量),1],其中,1表示样本标签;步骤S2.5:将构建的时序指标矩阵生成器所需样本集合输入当前异常时序指标矩阵生成器,得到相应判别标签,基于判别标签和样本标签优化当前时序指标矩阵生成器,重复触发步骤S2.2至步骤S2.5,直至迭代次数达到预设值,得到训练后的异常时序指标矩阵生成器;所述正样本集合包括:[(预设长度的文本向量,相对应的指标数据),1],其中,1表示正样本;所述负样本集合包括:[(预设长度的文本向量,时序指标矩阵),0]以及[(与当前时序指标矩阵不对应的预设长度的文本向量,时序指标矩阵),0],其中,0表示负样本。4.根据权利要求3所述的基于自然语言描述的异常时序指标生成方法,其特征在于,所述异常时序指标矩阵生成器采用:步骤S2.1.1:将描述文本标签转化为预设长度的文本向量;步骤S2.1.2:基于预设长度的文本向量以及随机短向量输入时序指标矩阵生成器获得尺寸与指标数据矩阵一致的时序指标矩阵;步骤S2.1.3:将预设长度的文本向量与时序指标矩阵输入时序指标矩阵判别器,输出0或1;其中,0表示假;1表示真。
5.根据权利要求1所述的基于自然语言描述的异常时序指标生成方法,其特征在于,所述步骤S3采用:步骤S3.1:基于自然语言描述利用训练后的异常时序指标矩阵生成器获取时序指标矩阵;步骤S3.2:解析时序指标矩阵得到异常指标时序。6.一种...

【专利技术属性】
技术研发人员:支凤麟蔡晓华杨光辉
申请(专利权)人:上海天旦网络科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1