The invention discloses a method and device for automatically generating log parsing rules, which comprises a log word segmentation step, a receiving device log and an automatic word segmentation for the newly added device log, a grammatical analysis step, a grammatical definition for the separated words, a regular generation step, and a generation step according to the grammatical definition. Resolve regular expressions for rules; and field mapping steps that automatically act the regular expressions for parsing rules to the server-side parsing engine. By the invention, users can automatically complete device log access without writing any code, greatly reducing the difficulty and complexity of log parsing, thereby improving the efficiency of developing log parsing rules.
【技术实现步骤摘要】
一种日志解析规则自动生成方法和装置
本专利技术涉及安全管理
,具体地,涉及一种日志解析规则自动生成方法和装置。
技术介绍
在现有技术中,通过编写代码来接入计算机中新增的设备日志,从而对日志解析难度较大、复杂度较高,从而对日志进行解析规则开发的效率极低。
技术实现思路
本专利技术的目的是为了解决对日志解析难度较大、复杂度较高,从而对日志进行解析规则开发的效率极低的技术问题。为了实现上述目的,本专利技术采用以下技术方案:本专利技术提供了一种日志解析规则自动生成方法,包括:日志分词步骤,接收新增设备日志,并对所述新增设备日志进行自动分词;语法分析步骤,对分出的词赋予语法定义;正则生成步骤,根据所述语法定义生成解析规则正则表达式;以及字段映射步骤,将所述解析规则正则表达式自动作用到服务端解析引擎。优选地,在所述日志分词步骤中,构建有穷状态自动机,通过所述有穷状态自动机对所述新增设备日志中的逐个字符进行分析,当遇到停止词字典中的停止词时,则退出所述有穷状态自动机并输出词法标记,然后返回所述有穷状态自动机继续分词,直到所述新增设备日志中的全部字符分析完成为止,从而将所述新增设备日志切分成词列表。优选地,在计算机系统中内置有或通过用户定义有语法分析规则,在所述语法分析步骤中,接收所述词法标记,并将所述语法分析规则与所述词法标记进行匹配,若具有与所述词法标记匹配的语法分析规则,则对切分出的词列表中的每个词赋予与所述词法标记匹配的语法分析规则中的语法定义,若没有与所述词法标记匹配的语法分析规则,则对所述词法标记赋予默认的语法分析规则。优选地,在所述语法分析步骤中,所述语法 ...
【技术保护点】
1.一种日志解析规则自动生成方法,包括:日志分词步骤,接收新增设备日志,并对所述新增设备日志进行自动分词;语法分析步骤,对分出的词赋予语法定义;正则生成步骤,根据所述语法定义生成解析规则正则表达式;以及字段映射步骤,将所述解析规则正则表达式自动作用到服务端解析引擎。
【技术特征摘要】
1.一种日志解析规则自动生成方法,包括:日志分词步骤,接收新增设备日志,并对所述新增设备日志进行自动分词;语法分析步骤,对分出的词赋予语法定义;正则生成步骤,根据所述语法定义生成解析规则正则表达式;以及字段映射步骤,将所述解析规则正则表达式自动作用到服务端解析引擎。2.根据权利要求1所述的日志解析规则自动生成方法,在所述日志分词步骤中,构建有穷状态自动机,通过所述有穷状态自动机对所述新增设备日志中的逐个字符进行分析,当遇到停止词字典中的停止词时,则退出所述有穷状态自动机并输出词法标记,然后返回所述有穷状态自动机继续分词,直到所述新增设备日志中的全部字符分析完成为止,从而将所述新增设备日志切分成词列表。3.根据权利要求2所述的日志解析规则自动生成方法,在计算机系统中内置有或通过用户定义有语法分析规则,在所述语法分析步骤中,接收所述词法标记,并将所述语法分析规则与所述词法标记进行匹配,若具有与所述词法标记匹配的语法分析规则,则对切分出的词列表中的每个词赋予与所述词法标记匹配的语法分析规则中的语法定义,若没有与所述词法标记匹配的语法分析规则,则对所述词法标记赋予默认的语法分析规则。4.根据权利要求3所述的日志解析规则自动生成方法,在所述语法分析步骤中,所述语法定义包括时间戳、IP地址、URL地址、用户代理、整数、浮点数、文件、用户名中的一个或多个。5.根据权利要求3所述的日志解析规则自动生成方法,在所述语法分析步骤中,多线程地将不同的词法标记分别与语法分析规则进行匹配,对于同一个词法标记,...
【专利技术属性】
技术研发人员:邸壮,
申请(专利权)人:北京仁和诚信科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。