敏感信息处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34776034 阅读:12 留言:0更新日期:2022-08-31 19:48
本公开实施例公开了一种敏感信息处理方法、装置、电子设备及存储介质。其中,敏感信息处理方法,包括:扫描文件得到文本数据;基于预配置的关键字对所述文本数据进行查询,得到所述文本数据中匹配的关键字及该敏感文本的存储路径,所述敏感文本为匹配到关键字的文本;判断所述敏感文本的类型,并根据所述类型对所述敏感文本进行结构解析,得到解析数据;根据预配置的敏感信息处理规则对解析数据中的关键字进行处理。不用对包含敏感信息的整个文件加密,而只是对敏感信息的关键字进行处理,避免了对整个文件的修改,从而达到避免文件损坏的目的。的目的。的目的。

【技术实现步骤摘要】
敏感信息处理方法、装置、电子设备及存储介质


[0001]本公开涉及信息处理领域,尤其涉及一种敏感信息处理方法、装置、电子设备及存储介质。

技术介绍

[0002]目前在市场使用的文档敏感关键字处理技术中,有的技术是将整个带敏感关键字或段落的整个文件加密,这种技术不仅处理时间长且占用操作系统资源大,文件损坏后导致整个电子文件无法打开也无法修复;有的技术调用专用软件的API对电子文件进行标注或脱敏处理,软件更新后无法进行处理,兼容性差,如不安装专有软件电子文件敏感信息也无法标注;有的技术对电子文本数据敏感字进行脱敏后,文件无法恢复原有内容;有的技术通过注入系统驱动当电子文件通过默认程序打开时,拦截打开操作对文件进行处理,容易导致软件卡死,兼容性差。

技术实现思路

[0003]有鉴于此,本公开实施例提供了一种敏感信息处理方法、装置及电子设备,至少部分的解决现有技术中存在的损坏文件的问题。
[0004]第一方面,本公开实施例提供了一种敏感信息处理方法,包括:
[0005]扫描文件得到文本数据;
[0006]基于预配置的关键字对所述文本数据进行查询,得到所述文本数据中匹配的关键字及该敏感文本的存储路径,所述敏感文本为匹配到关键字的文本;
[0007]判断所述敏感文本的类型,并根据所述类型对所述敏感文本进行结构解析,得到解析数据;
[0008]根据预配置的敏感信息处理规则对解析数据中的关键字进行处理。
[0009]可选的,所述扫描文件得到文本数据,包括:
[0010]对文件进行预处理,得到所述文件中的文本数据。
[0011]可选的,所述扫描文件得到文本数据,包括:
[0012]查询扫描设备的剩余资源;
[0013]基于所述剩余资源开启相应数量用于扫描文件的线程。
[0014]可选的,所述基于所述剩余资源开启相应数量用于扫描文件的线程,包括:
[0015]判断所述剩余资源与总资源的占比,当所述占比每达到设定比例时,开启一个线程;
[0016]当所述占比达到设定阈值时,停止为扫描文件开启新线程,并发送提示信息。
[0017]可选的,所述预配置的敏感信息处理规则,包括标注规则、涂改规则和恢复规则。
[0018]可选的,所述涂改规则,包括:
[0019]将涂改前的信息保存到扩展字段中。涂改前的信息可以为关键字所在的段落或章节等。
[0020]可选的,所述恢复规则包括:
[0021]自动恢复规则、标注恢复规则、涂改恢复规则和/或从扩展字段恢复规则;
[0022]所述自动恢复规则,包括用户身份验证,所述身份验证包括以下步骤:
[0023]接收用户发送的认证数据,基于用户名在预配置的文件中查找用户对应的密码,预配置的文件中存储密码、消息验证码和序列号;
[0024]基于所述密码对认证数据进行解密得到第一消息验证码;
[0025]基于用户名在预配置的文件查找消息验证码,得到与该用户对应的第二消息验证码,对比第一消息验证码和第二消息验证码是否相同;
[0026]当第一消息验证码和第二消息验证码相同时,该用户通过身份认证,并将预配置的文件中的序列号加1,得到更新序列号;
[0027]基于更新序列号对预配置的文件中存储的消息验证码进行计算得到更新消息验证码;
[0028]将所述预配置的文件中存储的消息验证码使用更新消息验证码替换。
[0029]第二方面,本公开实施例还提供了一种敏感信息处理装置,包括:
[0030]文档扫描模块,用于扫描文件得到文本数据;
[0031]匹配模块,用于基于预配置的关键字对所述文本数据进行查询,得到所述文本数据中匹配的关键字及该敏感文本的存储路径,所述敏感文本为匹配到关键字的文本;
[0032]结构解析模块,用于判断所述敏感文本的类型,并根据所述类型对所述敏感文本进行结构解析,得到解析数据;
[0033]敏感信息处理模块,用于根据预配置的敏感信息处理规则对解析数据中的关键字进行处理。
[0034]第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:
[0035]至少一个处理器;以及,
[0036]与所述至少一个处理器通信连接的存储器;其中,
[0037]所述存储器存储有能被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面任一所述的敏感信息处理方法。
[0038]第四方面,本公开实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行第一方面任一所述的敏感信息处理方法。
[0039]本公开实施例提供的敏感信息处理方法、装置、电子设备及计算机可读存储介质,其中该敏感信息处理方法,通过预配置的关键字匹配关键字和敏感文本,并对敏感文本进行结构解析后,对解析数据的关键字进行相应处理,因不用对包含敏感信息的整个文件加密,而只是对敏感信息的关键字进行处理,避免了对整个文件的修改,从而达到避免文件损坏的目的。
[0040]而预配置的敏感信息处理规则包括恢复规则,并将涂改前的信息保存到扩展字段中,达到准确恢复敏感信息的目的。通过关键词匹配的方法,可以适用不同的文件,达到兼容性强的目的。该方法不用嵌入到系统驱动中,避免了软件卡死的问题。
[0041]上述说明仅是本公开技术方案的概述,为了能更清楚了解本公开的技术手段,而
可依照说明书的内容予以实施,并且为让本公开的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
[0042]为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0043]图1为本公开实施例提供的一种敏感信息处理方法的流程图;
[0044]图2为本公开实施例提供的一种敏感信息处理装置的原理框图;
[0045]图3为本公开实施例提供的一种电子设备的原理框图。
具体实施方式
[0046]下面结合附图对本公开实施例进行详细描述。
[0047]应当明确,以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种敏感信息处理方法,其特征在于,包括:扫描文件得到文本数据;基于预配置的关键字对所述文本数据进行查询,得到所述文本数据中匹配的关键字及该敏感文本的存储路径,所述敏感文本为匹配到关键字的文本;判断所述敏感文本的类型,并根据所述类型对所述敏感文本进行结构解析,得到解析数据;根据预配置的敏感信息处理规则对解析数据中的关键字进行处理。2.根据权利要求1所述的敏感信息处理方法,其特征在于,所述扫描文件得到文本数据,包括:对文件进行预处理,得到所述文件中的文本数据。3.根据权利要求1或2所述的敏感信息处理方法,其特征在于,所述扫描文件得到文本数据,包括:查询扫描设备的剩余资源;基于所述剩余资源开启相应数量用于扫描文件的线程。4.根据权利要求3所述的敏感信息处理方法,其特征在于,所述基于所述剩余资源开启相应数量用于扫描文件的线程,包括:判断所述剩余资源与总资源的占比,当所述占比每达到设定比例时,开启一个线程;当所述占比达到设定阈值时,停止为扫描文件开启新线程,并发送提示信息。5.根据权利要求1所述的敏感信息处理方法,其特征在于,所述预配置的敏感信息处理规则,包括标注规则、涂改规则和恢复规则。6.根据权利要求5所述的敏感信息处理方法,其特征在于,所述涂改规则,包括:将涂改前的信息保存到扩展字段中。7.根据权利要求6所述的敏感信息处理方法,其特征在于,所述恢复规则包括:自动恢复规则、标注恢复规则、涂改恢复规则和/或从扩展字段恢复规则;所述自动恢复规则,包括用户身份验证,所述身份验证包括以下步骤:接收用户发送的认证数据,基于用户名在预配置的文件中查找用户对应的...

【专利技术属性】
技术研发人员:林皓田红峰杨泳王君
申请(专利权)人:北京北信源软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1