一种日志数据自定义解析方法技术

技术编号：35821591 阅读：14 留言：0更新日期：2022-12-03 13:47

本发明专利技术提供了一种日志数据自定义解析方法，包括：获取原始日志；将原始日志通过logstash方式或者Agent采集方式将数据过滤之后，并转发给kafka端；获取redis缓存中的数据，将生成的日志利用XML配置文件直接映射成需要转化的map集合数据；将map集合的数据入库openTsdb时序性数据库，实现数据的实时转化和自定义配置。本发明专利技术在接入大批量的原始日志，可以通过分析日志的生成数据，自定义解析规则，通过上传解析规则，可以及时的获取情报数据，从而降低开发成本以及时间的消耗。从而降低开发成本以及时间的消耗。从而降低开发成本以及时间的消耗。

全部详细技术资料下载

【技术实现步骤摘要】
一种日志数据自定义解析方法

[0001]本专利技术涉及数据处理领域，尤其涉及一种日志数据自定义解析方法。

技术介绍

[0002]目前，大数据量日志处理方面的技术竞争越发复杂和激烈，越来越多的安全监控设备和技术的出现为网络安全提供安全保障，来自各种设备的网络日志数据采用不同格式和属性来记录网络行为各个方面。也因此程序处理的日志数据也逐渐增大，对程序的处理性能要求也越来越高，而匹配地址作为网络日志分析的一环，因为需要跟地址库数据做匹配，通常是日志中的ip地址跟百万级的数据做碰撞来获取国家地址、编码、经度纬度等信息，现有的日志解析系统通常会把地址库数据保存在pg mysql等传统数据库中，在通过查询匹配地址数据，但这样的方法再小量级的日志数据环境下才能考虑，在处理日志数据量大时会消耗过长的时间来处理数据，同时对数据库资源产生较大的压力。这种时候优化地址匹配代码的速度就能大幅提升日志分析系统的性能。

技术实现思路

[0003]有鉴于此，针对现有的匹配ip地址的算法，应用在大数据领域的spark任务的大数据量级ip地址匹配逻辑还不算完善，对内存和cpu要求较高的技术问题，本专利技术提出一种日志数据自定义解析方法。
[0004]一种日志数据自定义解析方法，其包括以下步骤：
[0005]S1、获取原始日志；
[0006]S2、将原始日志通过logstash方式或者Agent采集方式将数据过滤之后，并转发给kafka端；
[0007]S3、获取redis缓存中的数据，将生成的日志利用X...

【技术保护点】

【技术特征摘要】
1.一种日志数据自定义解析方法，其特征在于：包括：以下步骤：S1、获取原始日志；S2、将原始日志通过logstash方式或者Agent采集方式将数据过滤之后，并转发给kafka端；S3、获取redis缓存中的数据，将生成的日志利用XML配置文件直接映射成需要转化的map集合数据；S4、将map集合的数据入库openTsdb时序性数据库，实现数据的实时转化和自定义配置。2.如权利要求1所述的一种日志数据自定义解析方法，其特征在于：步骤S3中，所述XML配置文件包括三个部分，分别为解...

【专利技术属性】
技术研发人员：陈铭，朱琪，
申请(专利权)人：智网安云武汉信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人