敏感信息检测方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:34034575 阅读:8 留言:0更新日期:2022-07-06 11:58
本申请提供一种敏感信息检测方法、装置、电子设备及计算机可读存储介质。本申请通过获取待检测信息,并对所述待检测信息进行敏感信息类型匹配,之后,针对匹配到的目标敏感信息类型,基于所述目标敏感信息类型对应的精度匹配规则,对所述待检测信息中所述目标敏感信息类型对应的目标数据进行精度匹配;进而,响应于精度匹配通过,基于所述目标敏感信息类型对应的校验规则,对所述目标数据进行数据校验;响应于数据校验通过,确定所述目标数据为敏感信息,这样,可以提高敏感信息检测的性能和精度。度。度。

Sensitive information detection method, device, electronic device and computer readable storage medium

【技术实现步骤摘要】
敏感信息检测方法、装置、电子设备及计算机可读存储介质


[0001]本申请涉及信息安全
,尤其涉及一种敏感信息检测方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]随着互联网技术的发展,通过互联网存储和传输的数据越来越多。在互联网存储和传输的数据中,可能涉及个人隐私、财产安全或信息安全的敏感信息,敏感信息的泄露将对相关个人、企业或组织机构造成严重的损失。
[0003]相关技术中,通常采用正则表达式匹配的方式,来实现对敏感信息的检测。正则表达式匹配的特点,就是只有一层匹配机制,采用正则表达式对待检测内容按字符一个一个匹配,而且是贪婪匹配(即最大长度匹配),对任何待检测内容都需要消耗同样的计算量。要实现对敏感信息的全面检测,又要实现一定的检测精度,就不可避免的需要添加更多、更为复杂的正则表达式。而正则表达式匹配的规则越多、规则越复杂,检测的性能就越差。
[0004]因此,相关技术采用正则表达式匹配对敏感信息检测的方式,在检测性能和精度上都存在一定的问题,无法兼顾检测性能和精度,尤其在对比较复杂的内容进行敏感信息检测时,检测性能和精度都较差。

技术实现思路

[0005]本申请的多个方面提供一种敏感信息检测方法、装置、电子设备及计算机可读存储介质,用以提高敏感信息检测的性能和精度。
[0006]本申请的一方面,提供一种敏感信息检测方法,包括:
[0007]获取待检测信息;
[0008]对所述待检测信息进行敏感信息类型匹配;
[0009]针对匹配到的目标敏感信息类型,基于所述目标敏感信息类型对应的精度匹配规则,对所述待检测信息中所述目标敏感信息类型对应的目标数据进行精度匹配;
[0010]响应于精度匹配通过,基于所述目标敏感信息类型对应的校验规则,对所述目标数据进行数据校验;
[0011]响应于数据校验通过,确定所述目标数据为敏感信息。
[0012]本申请的另一方面,提供一种敏感信息检测装置,包括:
[0013]获取模块,用于获取待检测信息;
[0014]类型匹配模块,用于对所述待检测信息进行敏感信息类型匹配;
[0015]精度匹配模块,用于针对匹配到的目标敏感信息类型,基于所述目标敏感信息类型对应的精度匹配规则,对所述待检测信息中所述目标敏感信息类型对应的目标数据进行精度匹配;
[0016]数据校验模块,用于响应于精度匹配通过,基于所述目标敏感信息类型对应的校验规则,对所述目标数据进行数据校验;
[0017]确定模块,用于响应于数据校验通过,确定所述目标数据为敏感信息。
[0018]本申请的又一方面,提供一种电子设备,所述电子设备包括:
[0019]一个或多个处理器;
[0020]存储装置,用于存储一个或多个程序,
[0021]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述一方面所提供的敏感信息检测方法。
[0022]本申请的再一方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述一方面所提供的敏感信息检测方法。
[0023]由上述技术方案可知,在本申请一些实施例中,提供了一种对敏感信息进行分层检测处理的方法,通过获取待检测信息,并对该待检测信息进行敏感信息类型匹配,针对匹配到的目标敏感信息类型,基于该目标敏感信息类型对应的精度匹配规则,对待检测信息中该目标敏感信息类型对应的目标数据进行精度匹配,响应于精度匹配通过,基于目标敏感信息类型对应的校验规则,对所述目标数据进行数据校验,响应于数据校验通过,确定所述目标数据为敏感信息。由此,本申请实现了对敏感信息的分层检测处理,首先对待检测信息进行敏感信息类型匹配,匹配到的敏感信息类型后,再基于匹配到的目标敏感信息类型对应的精度匹配规则和校验规则,对目标敏感信息类型对应的目标数据进行精度匹配和数据校验,可以实现对敏感信息快速、准确、全面的检测,能够全面兼顾检测性能、精度和敏感信息类型的需求,有效提升敏感信息检测的精度、性能和全面性,避免了相关技术采用正则表达式匹配对敏感信息检测的方式存在的性能及精度的限制。
[0024]另外,采用本申请所提供的技术方案,无需将待检测信息与繁多、复杂的正则表达式逐一进行匹配,相关技术采用正则表达式匹配对敏感信息检测的方式,能够在实现对敏感信息的全面检测的基础上,减少匹配的计算量,从而节省计算资源,提高敏感信息的检测效率。
[0025]另外,采用本申请所提供的技术方案,针对涉及多种敏感信息类型、内容复杂的内容进行敏感信息检测时,能够针对涉及的敏感信息类型进行并行精度匹配和数据校验,从而进一步提高了敏感信息的检测效率和检测效果。
【附图说明】
[0026]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
[0027]图1为本申请一实施例提供的敏感信息检测方法的流程示意图;
[0028]图2为本申请另一实施例提供的敏感信息检测方法的流程示意图;
[0029]图3为本申请一实施例提供的敏感信息检测装置的结构示意图;
[0030]图4为本申请另一实施例提供的敏感信息检测装置的结构示意图;
[0031]图5为适于用来实现本申请实施方式的示例性计算机系统/服务器12的框图。
【具体实施方式】
[0032]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其它实施例,都属于本申请保护的范围。
[0033]需要说明的是,本申请实施例中所涉及的终端可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)、个人电脑(Personal Computer,PC)、MP3播放器、MP4播放器、可穿戴设备(例如,智能眼镜、智能手表、智能手环等)等。
[0034]另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0035]如
技术介绍
中所述,相关技术采用正则表达式匹配对敏感信息检测的方式,在检测性能和精度上都存在一定的问题,无法兼顾检测性能和精度,尤其在对比较复杂的内容进行敏感信息检测时,检测性能和精度都较差。
[0036]因此,亟需提供一种敏本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种敏感信息检测方法,其特征在于,包括:获取待检测信息;对所述待检测信息进行敏感信息类型匹配;针对匹配到的目标敏感信息类型,基于所述目标敏感信息类型对应的精度匹配规则,对所述待检测信息中所述目标敏感信息类型对应的目标数据进行精度匹配;响应于精度匹配通过,基于所述目标敏感信息类型对应的校验规则,对所述目标数据进行数据校验;响应于数据校验通过,确定所述目标数据为敏感信息。2.根据权利要求1所述的方法,其特征在于,所述对所述待检测信息进行敏感信息类型匹配,包括:对所述待检测信息进行类型标签提取;将提取到的类型标签和在所述待检测信息中对应的数据格式与预设敏感信息类型的数据特征进行匹配。3.根据权利要求2所述的方法,其特征在于,所述预设敏感信息类型包括以下任意一项或多项:身份证号,手机号,银行卡号,车架号,出生日期,病案号,护照号,电子邮箱,地址。4.根据权利要求1~3任一所述的方法,其特征在于,所述确定所述目标数据为敏感信息之后,还包括:根据所述目标敏感信息类型所对应的脱敏规则,对所述目标数据进行脱敏处理。5.根据权利要求1~4任一所述的方法,其特征在于,还包括:响应于未匹配到敏感信息类型,或者精度匹配未通过,或者数据校验未通过,确定所述待检测信息中不存在敏感信息。6.一种敏感信息检测装置,其特征在于,包括:获取模块,用于获取待检测信息;类型匹配模块,用于对所述待检测信息进行敏感信息类型匹配;精度匹配模块,用于针对匹配到的目标敏感信息类型,基于所述目标敏感信息类型对应的精度匹配...

【专利技术属性】
技术研发人员:李华君祝君姜帆胡康
申请(专利权)人:瑞数信息技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1