System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用于日志审计的数据处理方法、系统及存储介质技术方案_技高网

一种用于日志审计的数据处理方法、系统及存储介质技术方案

技术编号:40412280 阅读:4 留言:0更新日期:2024-02-20 22:30
本发明专利技术涉及日志审计系统领域,具体为一种用于日志审计的数据处理方法、系统及存储介质;本发明专利技术通过在每个数据采集周期点的基础上计算出周期面积的数值,从而形成历史序列和错误序列,从而能够综合考虑两个相邻数据之间的数值大小和变化趋势,相比较于仅通过比较相邻两个数据采集点数值的方式,增添了对数据变化趋势的选择,能够一定程度上降低因各个数据采集周期点自身的误差对后续判断的影响,利用正切函数的性质,当标准序列和错误序列中存在一处数据有较大差异时,会使相似度的数值急剧升高,避免误差分摊到各个数据上后使相似度的数值变化不明显而误判;解决了目前的错误日志难以为运维人员分析异常的具体原因进一步提供参考的问题。

【技术实现步骤摘要】

本专利技术涉及日志审计系统领域,具体为一种用于日志审计的数据处理方法、系统及存储介质


技术介绍

1、日志审计系统是用于全面收集企业it系统中常见的设备所产生的日志并进行存储、监控、审计、分析、错误、响应和报告的系统,错误日志通常会输出相关系统、网络或应用程序在运行过程中产生的错误信息,随后需要运维人员进行处理。

2、但是,在日志审计系统收集到了错误日志并通知运维人员据此进行处理时,运维人员需要根据错误日志中的信息来自行分析可能导致错误产生的原因以及解决方法,并对各系统、网络或应用程序进行检测分析后消除错误信息,但是对于一些欠缺经验的运维人员而言,很难通过错误日志对导致异常的具体原因进行分辨,从而导致处理不及时,使相关系统、网络或应用程序处于异常之中而影响正常使用。


技术实现思路

1、针对现有技术的不足,本专利技术提供了一种用于日志审计的数据处理方法、系统及存储介质,解决了目前的错误日志难以为运维人员分析错误产生的具体原因提供参考的问题。

2、为实现上述目的,本专利技术提供如下技术方案:

3、一种用于日志审计的数据处理方法,包括:

4、s1、根据日志审计系统内错误日志发生时的日志数据和日志生成时间建立日志折线图;

5、s2、在日志折线图上获取错误日志所对应的错误区域,将日志折线图上错误区域以外的区域标记为历史区域;

6、s3、根据日志折线图分别计算历史区域和错误区域相对应的历史序列和错误序列;

7、s4、判断历史序列中是否存在与错误序列相同的参考序列;

8、若存在,则输出参考序列所对应日志审计系统中的错误记录,并结束;

9、若不存在,则进入步骤s5;

10、s5、从历史区域筛选出若干个标准区域,并计算和错误区域的相似度与贴近度;

11、s6、根据相似度和贴近度判断标准区域中是否存在与错误区域近似的参考区域;

12、若是,则输出该参考区域所对应日志审计系统中的错误记录;

13、若否,则结束。

14、作为优选,在步骤s2中,具体包括如下步骤:

15、s21、根据错误日志的生成时间在日志折线图上获取相对应的日志数据,并作为错误区域;

16、s22、设置单个日志采集周期内日志生成数量的波动区间;

17、s23、根据错误区域两侧相邻的数据点是否位于波动区间外判断该数据点是否能够纳入错误区域内;

18、若是,则该数据点属于错误区域;

19、若否,则该数据点不属于错误区域;

20、s24、重复步骤s23直至在错误区域两侧均获得位于波动区间内的数据或无数据。

21、作为优选,在步骤s3中,具体包括如下步骤:

22、s31、计算各日志采集周期点的周期面积;周期面积的计算公式为:

23、

24、上式中,sj表示数据采集周期点j的周期面积,wj表示日志采集周期点j的日志数量,wi表示与日志采集周期点j相邻的日志采集周期点i的日志数量,δtj表示日志采集周期点i和j之间的时间间隔,为一个日志采集周期;

25、s32、根据日志采集周期点的周期面积分别生成历史区域的历史序列和错误区域的错误序列;

26、历史序列的表达式为:

27、τ={τ1,τ2,τ3…τn}

28、其中:τn=sn

29、错误序列的表达式为:

30、μ={μ1,μ2,μ3…μm}

31、其中:μn=sm

32、上式中,μ表示错误序列,μn表示错误区域的第n个日志采集周期点所对应的周期面积,即为sn,τ表示历史序列,τm表示错误区域的第m个日志采集周期点所对应的周期面积,即为sm。

33、作为优选,在步骤s5中,具体包括如下步骤:

34、s51、从错误区域中选取日志数据的最大值和最小值;

35、s52、设定变化阔值,并根据错误区域的日志数据的最大值和最小值分别建立最大基准区域和最小基准区域;

36、s53、设定正常区间,并剔除属于正常区间子集的最大基准区域或最小基准区域,并输出基准区域;

37、s54、根据基准区域在历史序列中获取若干个基准点;

38、s55、根据基准点获取若干个与错误序列长度相等的对比序列;

39、s56、建立标准区间,并将对比序列和历史序列映射到标准区间以分别生成标准序列和基准序列;

40、s57、计算标准序列和基准序列的相似度,相似度的计算公式为:

41、

42、上式中,l1表示相似度,βi表示标准序列中的第i个数据,β'i表示错误序列中的第i个数据;

43、s58、计算标准序列所对应折线图上的标准区域和错误区域的贴近度。

44、作为优选,在步骤s55中,具体包括如下步骤:

45、s551、依次在基准点两侧建立长度与错误序列长度相等的待选框;

46、s552、根据错误长度在待选框内建立包含基准点的对比框;

47、s553、将对比框以单个日志数据的周期间距作为步长从待选框一端向另一端移动;

48、s554、依次获取对比框内的数据以生成若干个对比序列。

49、作为优选,在步骤s56中,具体包括如下步骤:

50、s561、根据历史序列的日志数据建立幅度区间和标准区间;

51、幅度区间的表达式为:(-α,α),标准区间的表达式为:(-β,β),其中

52、上式中,α表示日志数据的幅度阔值,该值大于日志数据的极差,极差即为日志数据中各个日志采集周期点的最大值和最小值的差,β表示标准区间的角度阔值,其中,(-β,β)∈(kπ-π/2,kπ+π/2),k∈z,z为正整数。

53、s562、将对比序列和错误序列从幅度区间映射到标准区间以分别生成标准序列和基准序列;标准序列和基准序列中数据的计算公式为:

54、

55、上式中,βi表示标准序列或基准序列中的第i个数据,αi表示对比序列或错误序列中的第i个数据,α表示日志数据的幅度阔值,β表示标准区间的角度阔值,表示历史序列中日志数据的平均值。

56、作为优选,在步骤s58中,具体包括如下步骤:

57、s581、计算标准序列所对应参考区域和错误区域上相邻两个数据点之间的斜率以分别生成对比斜率序列和错误斜率序列;对比斜率序列和错误斜率序列中斜率数据的计算公式为:

58、

59、上式中,ki,j表示折线图上相邻两个数据点i和j之间的斜率,xi和yi分别表示数据点i的x和y坐标,xj和yj分别表示数据点j的x和y坐标;

60、s582、根据对比斜率序列、错误斜率序列计算错误区域和参考区域所对应折线图的贴近度;

61、贴本文档来自技高网...

【技术保护点】

1.一种用于日志审计的数据处理方法,其特征在于,包括:

2.根据权利要求1所述的数据处理方法,其特征在于,在步骤S2中,具体包括如下步骤:

3.根据权利要求1所述的数据处理方法,其特征在于,在步骤S3中,具体包括如下步骤:

4.根据权利要求1所述的数据处理方法,其特征在于,在步骤S5中,具体包括如下步骤:

5.根据权利要求4所述的数据处理方法,其特征在于,在步骤S55中,具体包括如下步骤:

6.根据权利要求4所述的数据处理方法,其特征在于,在步骤S56中,具体包括如下步骤:

7.根据权利要求4所述的数据处理方法,其特征在于,在步骤S58中,具体包括如下步骤:

8.根据权利要求1所述的数据处理方法,其特征在于,在步骤S6中,具体包括如下步骤:

9.一种用于实现上述权利要求1~8任一项所述数据处理方法的系统,其特征在于,包括:

10.一种计算机存储介质,其特征在于,存储有计算机程序,所述计算机程序被执行时实现如权利要求1至8中任一项所述的用于日志审计的数据处理方法的步骤。>...

【技术特征摘要】

1.一种用于日志审计的数据处理方法,其特征在于,包括:

2.根据权利要求1所述的数据处理方法,其特征在于,在步骤s2中,具体包括如下步骤:

3.根据权利要求1所述的数据处理方法,其特征在于,在步骤s3中,具体包括如下步骤:

4.根据权利要求1所述的数据处理方法,其特征在于,在步骤s5中,具体包括如下步骤:

5.根据权利要求4所述的数据处理方法,其特征在于,在步骤s55中,具体包括如下步骤:

6.根据权利要求4所述的数据处理方法,其...

【专利技术属性】
技术研发人员:夏书奎孙锐丁祥
申请(专利权)人:安徽墨菲信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1