【技术实现步骤摘要】
日志检测方法、装置及存储介质
[0001]本专利技术实施例涉及数据处理
,尤其涉及一种日志检测方法、装置及存储介质。
技术介绍
[0002]日志是记录服务器状态的关键信息。通过检测日志,可以挖掘服务器的运行情况,及时发现潜在的安全问题。
[0003]现有技术中,检测日志时需要以服务器一段时间内的行为特征为检测对象进行检测。常用的检测日志的算法有两种,分别为:Apriori算法和FP
‑
growth算法。其中,Apriori算法产生频繁模式完全集前需要多次扫描数据库,同时产生大量的候选频繁集,这就使Apriori算法的时间和空间复杂度较大,造成Apriori算法对日志的检测效率较低。FP
‑
growth算法需要对事务数据库进行两次扫描,当数据库容量较大时,扫描所耗费的时间较长,使得检测日志效率较低。所以,现有技术检测日志存在效率较低问题。
技术实现思路
[0004]本专利技术实施例提供的一种日志检测方法、装置及存储介质,可以提高检测日志的效率。
[0005]本专利技术的技术方案是这样实现的:
[0006]本专利技术实施例提供了一种日志检测方法,包括:
[0007]获取多个当前日志数据,基于多个当前日志数据,得到多个当前编码信息组;多个当前编码信息组包括:多个当前日志数据中的多个日志信息;日志信息表征对应的日志数据中的事项信息;
[0008]基于多个当前编码信息组包括的多个日志信息,构建第一矩阵;
[0009]根据第 ...
【技术保护点】
【技术特征摘要】
1.一种日志检测方法,其特征在于,包括:获取多个当前日志数据,基于所述多个当前日志数据,得到多个当前编码信息组;所述多个当前编码信息组包括:所述多个当前日志数据中的多个日志信息;日志信息表征对应的日志数据中的事项信息;基于所述多个当前编码信息组包括的多个日志信息,构建第一矩阵;根据所述第一矩阵中所述多个日志信息出现的次数,得到所述多个当前日志数据对应的多个当前日志信息组;所述多个当前日志信息组为频繁模式树中的重叠日志信息组;所述频繁模式树是根据所述多个日志信息出现的次数构建的;将所述多个当前日志信息组与模式库中的多个预存日志信息组进行匹配,得到所述多个当前日志信息组的匹配结果,基于所述匹配结果确定针对所述多个当前日志数据的检测结果。2.根据权利要求1所述的日志检测方法,其特征在于,所述基于所述多个当前编码信息组包括的多个日志信息,构建第一矩阵,包括:基于所述多个当前编码信息组中的多个日志信息的类别形成所述第一矩阵的第一列;基于第n
‑
1个当前编码信息组中的每个日志信息与对应的日志信息类别的预设标记值,形成所述第一矩阵的第n列;所述第一矩阵的列数为n;n为大于1的正整数。3.根据权利要求1所述的日志检测方法,其特征在于,所述将所述多个当前日志信息组与模式库中的多个预存日志信息组进行匹配,得到所述多个当前日志信息组的匹配结果,基于所述匹配结果确定针对所述多个当前日志数据的检测结果之后,所述方法还包括:若所述匹配结果表征至少一个当前日志信息组与至少一个预存日志信息组匹配,则将所述至少一个当前日志信息组对应的当前日志数据加入确定所述模式库时提取的多个样本日志数据,以得到更新后的所述多个预存日志信息组,以及基于所述更新后的所述多个预存日志信息组更新的所述模式库。4.根据权利要求1所述的日志检测方法,其特征在于,所述根据所述第一矩阵中所述多个日志信息出现的次数,得到所述多个当前日志数据对应的多个当前日志信息组,包括:基于所述第一矩阵中的所述多个当前编码信息组中的每个日志信息的出现次数,计算得到每个日志信息类别的支持度;确定大于支持度阈值的目标支持度对应的目标日志信息类别;在基于所述目标日志信息类别构建的第二矩阵中,确定所述多个当前编码信息组分别对应的首位日志信息组;基于多个首位日志信息组分别对应的属性信息,构建频繁模式树;所述属性信息包括:多个首位日志信息组分别对应的类别名称信息、父亲节点信息、总支持度、父亲路径信息、日志集合信息和日志记数信息;所述总支持度表征对应首位日志信息组的日志信息类别的支持度之和;在所述频繁模式树中,确定出所述频繁模式树中的左节点的第一频繁模式和所述频繁模式树中的右节点的第二繁模式,并确定所述第一频繁模式和所述第二频繁模式的重叠日志信息组为所述多个当前日志信息组。5.根据权利要求4所述的日志检测方法,其特征在于,所述基于多个首位日志信息组分别对应的属性信息,构建频繁模式树,包括:
在所述第二矩阵中,确定最小行数的首位日志信息组为根节点;基于所述根节点和所述多个首位日志信息组分别对应的已知属性信息,构建所述频繁模式树。6.根据权利要求4所述的日志检测方法,其特征在于,所述在所述频繁模式树中,确定出所述频繁模式树中的左节点的第一频繁模式和所述频繁模式树中的右节点的第二繁模式,并确定所述第一频繁模式和所述第二频繁模式的重叠日志信息组为所述多个当前日志信息组,包括:在所述频繁模式树中进行后序遍历,基于所述频繁模式树中的父亲节点和左节点的总支持度,确定出所述第一频繁...
【专利技术属性】
技术研发人员:魏坤,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。