一种跨语言场景下的日志收集方法技术

技术编号:39279061 阅读:10 留言:0更新日期:2023-11-07 10:54
本发明专利技术涉计算机技术领域,尤其涉及一种跨语言场景下的日志收集方法,包括,步骤S1,记录各应用服务器产生的日志代码;步骤S2,根据语言标准库中的语言种类数量确定针对该特征字符的标准等级,并根据各标准等级的特征字符的占比确定针对单段日志代码匹配语言种类并使用该种类语言将日志代码转化成日志文本;步骤S3,矫验并判定是否切换对应种类的语言进行重新转化;步骤S4,分类日志文本输送至对应的日志收集模块,步骤S5,完成日志文本的收集,解决了没有对系统产生的日志代码进行匹配语言种类的判定和修正,导致针对跨语言场景下的日志转化的正确率不足的问题。转化的正确率不足的问题。转化的正确率不足的问题。

【技术实现步骤摘要】
一种跨语言场景下的日志收集方法


[0001]本专利技术涉计算机
,尤其涉及一种跨语言场景下的日志收集方法。

技术介绍

[0002]日志是指系统所指定对象的某些操作和其操作结果按时间有序的集合。每个日志文件由日志记录组成,每条日志记录描述了一次单独的系统事件。通常情况下,系统日志是用户可以直接阅读的文本文件,日志文件中的记录可提供以下用途:监控系统资源;审计用户行为;对可疑行为进行告警;确定入侵行为的范围;为恢复系统提供帮助;生成调查报告;为打击计算机犯罪提供证据来源。
[0003]由于网络中不同的操作系统、应用软件、网络设备和服务产生不同语言的日志文件,即使相同的服务如IIS也可采用不同格式的日志文件记录日志信息。国际上还没有形成标准的日志格式,各系统开发商和网络设备生产商往往根据各自的需要制定自己的日志格式,使得计算机系统针对跨语言形成的日志的格式和存储方式千差万别,因此,针对跨语言场景下的日志的处理技术的开发尤为迫切。
[0004]公开号为CN103714179A的中国专利申请,一种系统日志的多语言支持方法和系统从接收的系统日志中提取日志格式以及日志格式参数;根据当前系统的语言环境,在存储的日志格式在每种语言环境下的格式化字符串中找到与接收日志格式对应的格式化字符串;将与接收日志格式对应的格式化字符串与所述日志格式参数进行组合,得到当前系统语言环境支持的系统日志,可见,所述存在问题如下:没有对系统产生的日志代码进行匹配语言种类的判定和修正,导致针对跨语言场景下的日志转化的正确率不足。
>
技术实现思路

[0005]有鉴于此,本专利技术提供一种跨语言场景下的日志收集方法,用以克服现有技术中没有对系统产生的日志代码进行匹配语言种类的判定和修正,导致针对跨语言场景下的日志转化的正确率不足的问题。
[0006]为实现上述目的,本专利技术提供一种跨语言场景下的日志收集方法,包括:步骤S1,用户的操作行为触发中控模块中设置的日志点后,开始记录各应用服务器产生的日志代码;步骤S2,对于所述中控模块记录的单段所述日志代码,提取该段日志代码中的特征字符,中控模块根据与单个特征字符匹配的语言标准库中的语言种类数量确定针对该特征字符的标准等级,并根据各标准等级的特征字符的占比确定针对单段日志代码匹配语言种类并使用匹配的语言种类将所述日志代码转化成日志文本;步骤S3,所述中控模块验证所述日志文本并根据验证结果判定是否切换对应种类的语言以针对与该日志文本对应的日志代码进行重新转化;步骤S4,所述中控模块在所述日志文本验证成功后根据日志文本的内容对其进行分类并将分类后的日志文本输送至对应的日志收集模块;
步骤S5,所述日志收集模块根据预设采集频率收集所述分类后的日志文本。
[0007]进一步地,在所述步骤S2中,所述中控模块将单段所述日志代码中提取的各特征字符依次与所述语言标准库中的第i类语言的标准字符进行比对,设定i=1...n,n为语言标准库中语言种类的总数,对于单个特征字符,中控模块根据该特征字符匹配语言标准库中语言种类数量确定针对该特征字符标准等级的判定方式,其中,第一特征字符判定方式为所述中控模块判定所述特征字符为针对第i类语言的一级特征字符;所述第一特征字符判定方式满足所述特征字符仅与所述第i类语言匹配;第二特征字符判定方式为所述中控模块判定所述特征字符为针对第i类语言的二级特征字符;所述第二特征字符判定方式满足所述特征字符与包括所述第i类语言的多个种类语言匹配;第三特征字符判定方式为所述中控模块判定所述特征字符为三级特征字符;所述第三特征字符判定方式满足所述特征字符与所述语言标准库中的全部种类语言匹配。
[0008]进一步地,所述中控模块在第一预设条件下根据各特征字符占比确定与单段所述日志代码匹配的语言种类的判定方式,其中:第一判定方式为所述中控模块判定单段所述日志代码无匹配语言,并根据第一预设一级特征字符占比与一级特征字符占比的差值将该段日志代码分割成字符串的长度降低至对应值;所述第一判定方式满足单段所述日志代码中属于所述语言标准库中各类语言的所述一级特征字符占比均小于第一预设一级特征字符占比,且该段日志代码中的三级特征字符占比大于等于预设三级特征字符占比;第二判定方式为所述中控模块判定单段所述日志代码匹配多种语言,中控模块统计该段日志代码中属于对应种类语言的二级特征字符数量,并根据各二级特征字符的占比确定针对该段日志代码匹配的语言种类的判定方式;所述第二判定方式满足所述语言标准库中存在多个种类语言,单段所述日志代码中属于上述各类语言的所述一级特征字符占比均大于等于所述第一预设一级特征字符占比并均小于第二预设一级特征字符占比,且该段日志代码中的三级特征字符占比小于预设三级特征字符占比;第三判定方式为所述中控模块判定单段所述日志代码匹配单种语言,中控模块分别统计该段日志代码的语言中能够应用于对应种类语言的一级特征字符的数量并将数量最多的一级特征字符所属种类的语言作为用于该段日志代码的语言;所述第三判定方式满足所述语言标准库中存在若干种类语言,单段所述日志代码中属于上述语言的所述一级特征字符占比均大于等于所述第二预设一级特征字符占比,且该段日志代码中的三级特征字符占比小于预设三级特征字符占比;所述第一预设条件满足所述中控模块完成对单段所述日志代码中全部特征字符标准等级的判定。
[0009]进一步地,在所述步骤S2中,所述中控模块将所述单段日志代码分割成多个具有预设长度的字符串,分别解析分割后的字符串,并滤除解析后的符号以及信号码元以完成该段日志代码中特征字符的提取,中控模块根据提取的特征字符生成针对该段日志代码的日志文本。
[0010]进一步地,所述中控模块在所述第二判定方式下根据所述第i类语言的二级特征字符与总特征字符的占比确定针对该段日志代码匹配语言的种类的判定方式,其中,
第一语言判定方式为所述中控模块判定选取对应的一级特征字符数量最高的语言将该单段日志代码转化成第一日志文本;所述第一语言判定方式满足单段所述日志代码中属于所述第i类语言的所述二级特征字符的占比小于预设二级特征字符占比;第二语言判定方式为所述中控模块判定使用第i类语言将单段日志字符转化成第二日志文本;所述第二语言判定方式满足单段所述日志代码中属于所述第i类语言的所述二级特征字符的占比大于等于预设二级特征字符占比。
[0011]进一步地,所述中控模块设置有在第一判定方式下缩短所述单段日志代码分割的字符串的长度的若干长度的调节方式,其中,每种调节方式对缩短字符串的长度的调节大小不同。
[0012]进一步地,所述中控模块在所述第三判定方式下根据转化后的所述日志文本的准确率判定选用的语言种类与所述单段日志代码的匹配是否符合预设标准并在判定该类语言与该段日志代码的匹配不符合预设标准时重新统计该段日志代码中的二级特征字符并使用包含对应二级特征字符数量最多的语言将该段日志字符转化成第三日志文本,或,重新选取对应的一级特征字符数量次高的语言将该段日志字符转化成第四日志文本。
[0013]进一步地,所述中控本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种跨语言场景下的日志收集方法,其特征在于,包括:步骤S1,用户的操作行为触发中控模块中设置的日志点后,开始记录各应用服务器产生的日志代码;步骤S2,对于所述中控模块记录的单段所述日志代码,提取该段日志代码中的特征字符,中控模块根据与单个特征字符匹配的语言标准库中的语言种类数量确定针对该特征字符的标准等级,并根据各标准等级的特征字符的占比确定针对单段日志代码匹配语言种类并使用匹配的语言种类将所述日志代码转化成日志文本;步骤S3,所述中控模块验证所述日志文本并根据验证结果判定是否切换对应种类的语言以针对与该日志文本对应的日志代码进行重新转化;步骤S4,所述中控模块在所述日志文本验证成功后根据日志文本的内容对其进行分类并将分类后的日志文本输送至对应的日志收集模块;步骤S5,所述日志收集模块根据预设采集频率收集所述分类后的日志文本。2.根据权利要求1所述的跨语言场景下的日志收集方法,其特征在于,在所述步骤S2中,所述中控模块将单段所述日志代码中提取的各特征字符依次与所述语言标准库中的第i类语言的标准字符进行比对,设定i=1...n,n为语言标准库中语言种类的总数,对于单个特征字符,中控模块根据该特征字符匹配语言标准库中语言种类数量确定针对该特征字符标准等级的判定方式,其中,第一特征字符判定方式为所述中控模块判定所述特征字符为针对第i类语言的一级特征字符;所述第一特征字符判定方式满足所述特征字符仅与所述第i类语言匹配;第二特征字符判定方式为所述中控模块判定所述特征字符为针对第i类语言的二级特征字符;所述第二特征字符判定方式满足所述特征字符与包括所述第i类语言的多个种类语言匹配;第三特征字符判定方式为所述中控模块判定所述特征字符为三级特征字符;所述第三特征字符判定方式满足所述特征字符与所述语言标准库中的全部种类语言匹配。3.根据权利要求2所述的跨语言场景下的日志收集方法,其特征在于,所述中控模块在第一预设条件下根据各特征字符占比确定与单段所述日志代码匹配的语言种类的判定方式,其中:第一判定方式为所述中控模块判定单段所述日志代码无匹配语言,并根据第一预设一级特征字符占比与一级特征字符占比的差值将该段日志代码分割成字符串的长度降低至对应值;所述第一判定方式满足单段所述日志代码中属于所述语言标准库中各类语言的所述一级特征字符占比均小于第一预设一级特征字符占比,且该段日志代码中的三级特征字符占比大于等于预设三级特征字符占比;第二判定方式为所述中控模块判定单段所述日志代码匹配多种语言,中控模块统计该段日志代码中属于对应种类语言的二级特征字符数量,并根据各二级特征字符的占比确定针对该段日志代码匹配的语言种类的判定方式;所述第二判定方式满足所述语言标准库中存在多个种类语言,单段所述日志代码中属于上述各类语言的所述一级特征字符占比均大于等于所述第一预设一级特征字符占比并均小于第二预设一级特征字符占比,且该段日志代码中的三级特征字符占比小于预设三级特征字符占比;第三判定方式为所述中控模块判定单段所述日志代码匹配单种语言,中控模块分别统
计该段日志代码的语言中能够应用于对应种类语言的一级...

【专利技术属性】
技术研发人员:杨良邓日晓王武杰阳城聂璇杨志
申请(专利权)人:湖南三湘银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1