一种日志脱敏方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37846710 阅读:18 留言:0更新日期:2023-06-14 22:31
本发明专利技术公开了一种日志脱敏方法、装置、电子设备及存储介质。方法包括:获取待处理日志信息,将待处理日志信息在日志模板库中进行匹配,确定匹配成功的日志模板;基于日志模板的敏感位置确定待处理日志信息中的敏感内容,以及根据日志模板的敏感类型确定敏感内容的敏感类型;对待处理日志信息中的敏感内容进行脱敏处理,得到脱敏日志信息。本发明专利技术方法包含离线训练阶段和实时检测阶段,离线训练阶段根据Drain聚类算法对训练日志聚类获得模板,通过正则表达式和自然语言处理算法进行变量敏感内容的敏感类型的识别,实时检测阶段根据模板中保存的变量敏感类型实现快速脱敏,实现了可重复使用日志模板达到日志信息脱敏的功能,提高了日志信息脱敏的效率。高了日志信息脱敏的效率。高了日志信息脱敏的效率。

【技术实现步骤摘要】
一种日志脱敏方法、装置、电子设备及存储介质


[0001]本专利技术涉及信息处理
,尤其涉及一种日志脱敏方法、装置、电子设备及存储介质。

技术介绍

[0002]金融行业的数据库中储存着大量用户的信息,这些敏感数据在银行、保险、证券等金融行业的众多业务场景中被加以使用,例如业务分析、开发测试、审计监管以及各类外包业务等。为保证用户信息需要对敏感信息进行脱敏处理。对于敏感信息的脱敏处理多采用添加注解或者是采用一些脱敏插件等方式。
[0003]基于上述采用的技术方案,容易产生该添加注解的地方没有添加注解,导致遍历的过程中查找不准确,从而使得漏敏感信息;另外,对于采用脱敏插件的方式,需要根据不同类型的敏感信息进行替换,降低了日志脱敏的效率。

技术实现思路

[0004]本专利技术提供了一种日志脱敏方法、装置、电子设备及存储介质,以解决对敏感信息进行脱敏的过程中产生的信息遗漏问题以及脱敏效率低的问题。
[0005]根据本专利技术的一方面,提供了一种日志脱敏方法,包括:
[0006]获取待处理日志信息,将待处理日志本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种日志脱敏方法,其特征在于,包括:获取待处理日志信息,将所述待处理日志信息在日志模板库中进行匹配,确定匹配成功的日志模板;基于所述日志模板的敏感位置确定所述待处理日志信息中的敏感内容,以及根据所述日志模板的敏感类型确定所述敏感内容的敏感类型;对所述待处理日志信息中的敏感内容进行脱敏处理,得到脱敏日志信息。2.根据权利要求1所述的方法,其特征在于,所述日志模板库中包括多个日志模板,各所述日志模板分别对应设置有敏感位置和敏感类型。3.根据权利要求2所述的方法,其特征在于,所述日志模板库的构建过程包括:获取多个训练日志信息,对所述训练日志信息进行聚类处理,得到各类日志信息集合;对于任一类日志信息集合,确定所述日志信息集合对应的日志模板;基于各类日志信息集合对应的日志模板,形成日志模板库。4.根据权利要求2所述的方法,其特征在于,所述日志模板库的构建过程包括:获取训练日志信息,将所述训练日志信息在当前的日志模板库中进行匹配;若匹配成功,则将所述训练日志信息的变量内容存储至匹配成功的日志模板对应的数据集;若匹配失败,则将所述训练日志信息作为日志模板,更新到日志模板库中。5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:所述识别日志模板库中各所述日志模板中敏感内容的敏感类型和所述敏感内容的敏感位置,其中,所述敏感内容的敏感类型的内容识别规则包括正则表达式、自然语言处理的词性标注一项或多项。6.根据权利要求1所述的方法,其特征在于,所述对所述待处...

【专利技术属性】
技术研发人员:公娟杨辰葛晓波
申请(专利权)人:上海擎创信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1