处理日志的方法、装置、计算设备及介质制造方法及图纸

技术编号:31229662 阅读:31 留言:0更新日期:2021-12-08 09:58
本公开提供了一种处理日志的方法,包括:获取流量检测周期内接收到的多个待输出日志;在多个待输出日志的数量超过流量检测阈值的情况下,确定多个待输出日志彼此之间的语义相似度;根据多个待输出日志彼此之间的语义相似度,合并多个待输出日志,以得到至少一个目标日志;以及输出至少一个目标日志。本公开还提供了一种处理日志的装置、计算设备、介质及计算机程序产品。算机程序产品。算机程序产品。

【技术实现步骤摘要】
处理日志的方法、装置、计算设备及介质


[0001]本公开涉及计算机
/互联网
/电子
,更具体地,涉及一种处理日志的方法、装置、计算设备、介质及计算机程序产品。

技术介绍

[0002]日志数据用于反映用户与计算机系统交互过程中产生的轨迹。日志系统用于收集和监控程序的运行情况,以实时监控应用程序产生的异常。日志系统可以有效地帮助研发人员了解系统运行的状态,排查系统异常等。因此,高效稳定的日志系统具有重要的意义。
[0003]Log4j是一种日志操作包,提供了日志记录和控制功能,灵活性较强。相关技术的日志库系统借鉴了Log4j的理念,通过Log4j异步打印日志到文件。
[0004]相关技术的日志库系统在设计上至少存在以下问题:
[0005]1)日志库控制台的输入输出(IO)操作会阻塞主线程的执行。更具体地,由于相关技术的日志库系统使用单线程设计,因此业务程序在执行时,需要等待日志数据的IO操作完成后才能继续执行,严重业务的实时性。
[0006]2)洪峰流量中包含大量重复的异常日志,针对这些大量重复的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种处理日志的方法,包括:获取流量检测周期内接收到的多个待输出日志;在所述多个待输出日志的数量超过流量检测阈值的情况下,确定所述多个待输出日志彼此之间的语义相似度;根据所述多个待输出日志彼此之间的语义相似度,合并所述多个待输出日志,以得到至少一个目标日志;以及输出所述至少一个目标日志。2.根据权利要求1所述的方法,其中,所述确定所述多个待输出日志彼此之间的语义相似度包括:分别确定所述多个待输出日志彼此之间的内容相似度和/或类型相似度;以及根据所述内容相似度和/或所述类型相似度,确定所述多个待输出日志彼此之间的语义相似度。3.根据权利要求2所述的方法,其中,所述确定所述多个待输出日志彼此之间的内容相似度,包括:确定所述多个待输出日志中的任意两个待输出日志包含的相同单词序列;确定所述相同单词序列中包含单词数最多的单词序列作为最长公共子序列;以及根据所述最长公共子序列和所述两个待输出日志各自包含的单词的数量,确定所述两个待输出日志的内容相似度。4.根据权利要求2或3所述的方法,其中,所述确定所述多个待输出日志彼此之间的类型相似度,包括:针对所述多个待输出日志中的任意两个待输出日志,确定所述两个待输出日志中每个待输出日志的类型特征集合,其中,所述类型特征集合包括至少一个类型特征;确定所述两个待输出日志的类型特征集合中包含的相同类型特征的数量;以及根据所述相同类型特征的数量,确定所述两个待输出日志之间的类型相似度。5.根据权利要求1所述的方法,其中,所述根据所...

【专利技术属性】
技术研发人员:胡珅健
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1