The invention provides a data desensitization platform sensitive data identification method, device, equipment and medium. Among them, the method includes: establishing the recognition rule set of sensitive data and the field set to be scanned. The recognition rule set includes one or more sensitive data types and their recognition rules; scanning the field set to be scanned according to the recognition rule set; and scanning the field set of sensitive data types when the number of fields scanned from the field set to be scanned exceeds the number of fields. When the preset threshold is over, the sensitive data types and their recognition rules are deleted from the recognition rule set, and the field set to be scanned is scanned according to the remaining sensitive data types and their recognition rules in the recognition rule set until the recognition rule set is empty or all the fields to be scanned in the field set to be scanned are scanned. . The invention solves the problem of large system overhead of the sensitive data identification method in the related technology, and reduces the system overhead of the sensitive data identification.
【技术实现步骤摘要】
数据脱敏平台敏感数据识别方法、装置、设备及介质
本专利技术涉及数据脱敏领域,具体而言,涉及一种数据脱敏平台敏感数据识别方法、装置、设备及介质。
技术介绍
随着各行业向信息化转型,信息安全成为社会各界关注的焦点。机票短信诈骗对民航业务链上的单位也产生了非常大负面影响,旅客信息安全已经被推到了风口浪尖上。中国民航信息网络股份有限公司所运营的信息系统中既包含旅客身份信息、支付信息、联系方式等旅客敏感数据,也包含航空公司票价、折扣、航线等商业机密信息,且数量巨大。生产系统中,这些信息通过严格的权限管理保障数据的安全。信息系统的开发、测试等环节中,同样需要使用到这些信息,但信息接触的人群范围比生产系统要大很多,权限限制相对于生产系统也较为宽松。因此,对于信息系统中巨量的数据中敏感数据的识别是数据脱敏的重要环节。相关技术中敏感数据识别一般采用关键字匹配的方式,这种方式采用固定的关键字数据库对待扫描字段全文进行扫描,以识别待扫描字段中是否存在敏感数据。采用这种方式扫描敏感数据,由于采用了固定的关键字数据库,因此即使已经扫描到某一类型字段中存在了大量的同种类型的敏感数据,在对该类型字段的其他数据进行下一次扫描时仍然会采用固定的关键字数据库再次扫描,从而占用了大量的系统开销。综上所述,针对相关技术中的敏感数据识别方法系统开销大的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术提供了一种数据脱敏平台敏感数据识别方法、装置、设备及介质,以至少解决相关技术中的敏感数据识别方法系统开销大的问题。第一方面,本专利技术实施例提供了一种数据脱敏平台敏感数据识别方法,所述方法包括: ...
【技术保护点】
1.一种数据脱敏平台敏感数据识别方法,其特征在于,所述方法包括:建立敏感数据的识别规则集和待扫描字段集,所述识别规则集包括:一种或者多种敏感数据类型及其识别规则;根据所述识别规则集,扫描所述待扫描字段集;当从所述待扫描字段集中扫描出来的敏感数据类型的字段数量超过预设阈值的情况下,将所述敏感数据类型及其识别规则从所述识别规则集中删除,并继续根据所述识别规则集中剩下的敏感数据类型及其识别规则扫描所述待扫描字段集,直至所述识别规则集为空或者所述待扫描字段集中需要扫描的字段全部扫描完毕。
【技术特征摘要】
1.一种数据脱敏平台敏感数据识别方法,其特征在于,所述方法包括:建立敏感数据的识别规则集和待扫描字段集,所述识别规则集包括:一种或者多种敏感数据类型及其识别规则;根据所述识别规则集,扫描所述待扫描字段集;当从所述待扫描字段集中扫描出来的敏感数据类型的字段数量超过预设阈值的情况下,将所述敏感数据类型及其识别规则从所述识别规则集中删除,并继续根据所述识别规则集中剩下的敏感数据类型及其识别规则扫描所述待扫描字段集,直至所述识别规则集为空或者所述待扫描字段集中需要扫描的字段全部扫描完毕。2.根据权利要求1所述的方法,其特征在于,在所述识别规则集为空或者所述待扫描字段集全部扫描完毕之后,所述方法还包括:输出所述待扫描字段集的敏感数据识别结果。3.根据权利要求1所述的方法,其特征在于,所述敏感数据类型包括以下至少之一:身份证号码、护照号码、军官证号码、银行卡号码、常客卡号码、手机号码、电话号码、邮箱、联系地址。4.根据权利要求1所述的方法,其特征在于,根据所述识别规则集,扫描所述待扫描字段集包括:将所述识别规则集与所述待扫描字段集中的一个或者多个字段分别绑定;使用所述识别规则集分别扫描所述待扫描字段集中与所述识别规则集绑定的一个或者多个字段。5.根据权利要求1所述的方法,其特征在于,根据所述识别规则集,扫描所述待扫描字段集包括:根据所述识别规则集和所述待扫描字段集,生成扫描任务;执行所述扫描任务。6.根据权利要求5所述的方法,其特征在于,执行所述扫描任务包括...
【专利技术属性】
技术研发人员:李鹏,王明,付征,
申请(专利权)人:中国民航信息网络股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。