【技术实现步骤摘要】
本公开的实施例总体上涉及数据存储技术,更具体地涉及日志存储优化的方法和设备。
技术介绍
日志是指系统(例如,软件、应用)或设备(例如,服务器、终端设备)发生的事务或操作的记录。日志数据包含系统或设备的所有活动和行为的有序记录,一般为半结构化的数据,例如,单行日志、复杂的多行日志。技术人员通常对日志数据进行搜索、关联、可视化、分析以及记录,以标识和解决系统或设备的操作和安全问题。现代的软件定义数据中心(SDDC)架构能够不断地生成日志数据,其生成速度往往比技术人员能够处理的速度更快。由于活动和数据的数量呈现指数级的增长,生成的日志数量也在快速增长,例如,某些存储服务器每天能够生成高达几TB的日志数据。现代的SDDC架构具有针对多层应用的自动的且动态的部署能力,因此需要实时地对日志进行分析。日志的有效分析是系统或设备的复杂故障诊断、动态高性能以及更好安全性的关键保障。一般来说,对日志进行搜索分析的方法非常低效,此外,虽然现有的处理方法也会采取压缩和去重处理,但是日志的熵并没有得到减少。因此,如何对现有的海量日志进行处理,实现海量日志的优化存储并且提高日志分析效率,成为一个亟待解决的问题。
技术实现思路
有鉴于此,本公开的实施例提供一种日志存储优化方法和设备,能够减少日志的存储空间并且提高日志的分析效率。根据本公开的一个方面,公开了一种日志存储优化的方法,该方法包括接收日志数据;使用解析规则将日志数据转换为结构化数据;以及对结构化数据进行编码,以减少日志的存储空间。根据本公开的一个实施例,进一步包括:在接收到日志数据之后,遍历日志简档储存库,确定日志简档储存库中是 ...
【技术保护点】
一种日志存储优化方法,包括:接收日志数据;使用解析规则将所述日志数据转换为结构化数据;以及对所述结构化数据进行编码,以减少日志的存储空间。
【技术特征摘要】
1.一种日志存储优化方法,包括:接收日志数据;使用解析规则将所述日志数据转换为结构化数据;以及对所述结构化数据进行编码,以减少日志的存储空间。2.根据权利要求1所述的方法,进一步包括:在接收到所述日志数据之后,遍历日志简档储存库,确定所述日志简档储存库中是否存在对应于所述日志数据的结构化日志简档,以生成所述解析规则,其中所述结构化日志简档存储库用于存储经转换的所述结构化数据。3.根据权利要求2所述的方法,其中确定所述日志简档储存库中是否存在对应于所述日志数据的结构化日志简档,以生成所述解析规则包括:在所述日志简档储存库中存在对应于所述日志数据的结构化日志简档时,根据对应的所述结构化日志简档来生成对应的解析规则。4.根据权利要求2所述的方法,其中确定所述日志简档储存库中是否存在对应于所述日志数据的结构化日志简档,以生成所述解析规则包括:在所述日志简档储存库中不存在对应于所述日志数据的结构化日志简档时,通过自适应学习过程来获得对应于所述日志数据的结构化日志简档和解析规则、或者手动定义对应于所述日志数据的结构化日志简档和解析规则。5.根据权利要求2所述的方法,进一步包括:在遍历所述日志简档储存库之前,当用于生成所述日志数据的日志配置可访问时,根据所述日志配置来直接生成结构化日志简档和相应的解析规则。6.根据权利要求2-5中任一项所述的方法,其中所述结构化日志简档至少包括日志的时间戳和内容数据。7.根据权利要求2-5中任一项所述的方法,其中所述解析规则是正则表达式或者字符串模板。8.根据权利要求1所述的方法,其中使用解析规则将所述日志数据转换为结构化数据进一步包括:在使用所述解析规则将所述日志数据转换为结构化数据之后,设定基准时间,计算每条日志的时间戳与所述基准时间之间的时间差,并且利用所述时间差来替代所述结构化数据中的时间戳数据。9.根据权利要求8所述的方法,其中所述基准时间是第一条日志的时间戳或者是基于周期性的时间。10.根据权利要求1所述的方法,其中对所述结构化数据进行编码包括:对于所述结构化数据中的各种类型的值,计算相同类型的值中的每个值的出现概率,以生成所述编码规则。11.根据权利要求10所述的方法,其中生成所述编码规则包括:将所述出现概率较大的值编码为长度较短的值,其中所述出现概率与出现次数成正比。12.根据权利要求11所述的方法,其中将所述出现概率较大的值编码为长度较短的值包括:将所述出现概率最大的值编码为值“1”。13.根据权利要求10所述的方法,其中生成所述编码规则包括:根据编码规则自适应学习过程来自动生成所述编码规则。14.根据权利要求10-13中任一项所述的方法,其中所述编码规则是哈夫曼编码。15.根据权利要求1所述的方法,进一步包括:在使用编码规则对所述结构化数据进行编码之后,以日志向量的形式存储经编码的所述结构化数据。16.一种日志存储优化设备,包括:接收装置,用于接收日...
【专利技术属性】
技术研发人员:王天青,陆明刚,陈超,徐昊,包捷,马金龙,
申请(专利权)人:伊姆西公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。