一种日志的归类方法及系统技术方案

技术编号：18351257 阅读：24 留言：0更新日期：2018-07-02 01:02

本发明专利技术公开了一种日志的归类方法，包括：获取所述目标日志中包含的目标关键代码；解析所述目标关键代码对应的目标连续片段，所述目标连续片段由预设数量的日志状态序列组成；计算所述目标连续片段中的各个日志状态序列与预设的告警事件代码库中的目标告警事件连续片段中各个目标告警事件状态序列之间的第一距离测度；判断所述第一距离测度是否小于采用预设的计算方法计算得到的距离测度阈值，若是，将所述目标日志归类到目标告警事件对应的分类中。上述的方法，通过计算所述第一距离测度，可以将所述目标日志归类到对应的告警事件，避免了现有的日志归类过程中，归类结果准确性并不是很高，存在误判、漏判的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种日志的归类方法及系统
本专利技术涉及归类分析
，尤其涉及一种日志的归类方法及系统。
技术介绍
如今，伴随着网络技术的发展，互联网中每天至少产生几百万条原始日志为了减少日志存储占用空间、提高日志分析效率、提高有用日志的可读性，需要对原始日志进行归类，抛除无分析价值的日志，将有价值日志进行归类分析。只有与告警事件相关的日志，才更有分析和存储价值。因此，将原始日志归类到各类告警事件，保留与各类告警事件相关的日志，抛弃其他无用日志，才能让日志分析人员高效处理这些数据，同时又能大大节省日志存储空间。专利技术人对于海量日志信息的归类方法进行研究发现，现有的日志的归类方法如K-MEANS、K-MEDOIDS以及CHAMELEON等，上述的归类方法的误差高，得到的归类结果准确性并不是很高，存在误判、漏判的情况。
技术实现思路
有鉴于此，本专利技术提供了一种日志的归类方法，用以解决现有技术中归类结果准确性并不是很高，存在误判、漏判的情况的问题。具体方案如下：一种日志的归类方法，包括：获取所述目标日志中包含的目标关键代码；解析所述目标关键代码对应的目标连续片段，所述目标连续片段由预设数量的日志状态序列组成；计算所述目标连续片段中的各个日志状态序列与预设的告警事件代码库中的目标告警事件连续片段中各个目标告警事件状态序列之间的第一距离测度；判断所述第一距离测度是否小于采用预设的计算方法计算得到的距离测度阈值，若是，将所述目标日志归类到目标告警事件对应的分类中。上述的方法，可选的，还包括：若否，分别计算所述目标连续片段中的各个状态序列与所述预设的告警事件代码库其余的各个告警事...
一种日志的归类方法及系统

【技术保护点】
1.一种日志的归类方法，其特征在于，包括：获取所述目标日志中包含的目标关键代码；解析所述目标关键代码对应的目标连续片段，所述目标连续片段由预设数量的日志状态序列组成；计算所述目标连续片段中的各个日志状态序列与预设的告警事件代码库中的目标告警事件连续片段中各个目标告警事件状态序列之间的第一距离测度；判断所述第一距离测度是否小于采用预设的计算方法计算得到的距离测度阈值，若是，将所述目标日志归类到目标告警事件对应的分类中。

【技术特征摘要】
1.一种日志的归类方法，其特征在于，包括：获取所述目标日志中包含的目标关键代码；解析所述目标关键代码对应的目标连续片段，所述目标连续片段由预设数量的日志状态序列组成；计算所述目标连续片段中的各个日志状态序列与预设的告警事件代码库中的目标告警事件连续片段中各个目标告警事件状态序列之间的第一距离测度；判断所述第一距离测度是否小于采用预设的计算方法计算得到的距离测度阈值，若是，将所述目标日志归类到目标告警事件对应的分类中。2.根据权利要求1所述的方法，其特征在于，还包括：若否，分别计算所述目标连续片段中的各个状态序列与所述预设的告警事件代码库其余的各个告警事件连续片段中的告警事件状态序列之间对应的第二距离测度；判断是否存在一个第二距离测度小于与其对应的预设的距离测度阈值；若是，将所述目标日志存储到与所述第二距离测度对应的告警事件的分类中。3.根据权利要求2所述的方法，其特征在于，还包括：若否，判定所述目标日志为无用日志，对所述无用日志进行舍弃处理。4.根据权利要求1所述的方法，其特征在于，计算所述目标连续片段中的各个日志状态序列分别与预设的告警事件代码库中的目标告警事件连续片段中各个目标告警事件状态序列之间的第一距离测度包括：确定计算所述第一距离测度的第一表达式；解析所述第一表达式中与所述第一距离测度关联的第一权重；采用预设的第一优化函数对所述第一权重进行优化，得到目标权重；将所述目标权重传递给所述第一表达式，计算得到所述第一距离测度。5.根据权利要求4所述的方法，其特征在于，采用预设的计算方法计算得到的距离测度阈值，包括：任意选取与所述目标告警事件类型相同的第一日志样本和与所述目标告警事件类型不同的第二日志样本；解析所述第一日志样本对应的第一连续片段和所述第二日志样本对应的第二连续片段；将所述目标权重，所述第一连续片段，所述第二连续片段和所述目标告警事件连续片段传递到预设的第二优化函数中进行计算，令所述第二优化函数取最小值，所述最小值为距离测度阈值。6.一种日志的归类系统，其特征在于，包括：获取...

【专利技术属性】
技术研发人员：翟建军，钟金鑫，陈青民，齐志彬，刘震芸，杜婷婷，
申请(专利权)人：北京安信天行科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人