【技术实现步骤摘要】
敏感数据扫描方法和系统
本专利技术实施例涉及数据库
,尤其涉及一种敏感数据扫描方法和系统。
技术介绍
数据库是按照数据结构来组织、存储和管理数据的仓库。在数据库中,有些数据属于敏感数据,例如,身份证号、姓名、企业客户名称、地址、电话等。这些敏感数据需要扫描出来进行数据迁移,达到防止敏感数据泄露的目的。目前,普遍采用集中式架构,如浏览器/服务器模式,将扫描任务实现的核心部分集中到一台服务器上。由于数据库的数量多,存储数据量巨大,集中式架构已不能满足扫描任务的高效要求。
技术实现思路
本专利技术实施例提供了一种敏感数据扫描方法和系统,以高效地从数据库中识别敏感数据,从而保证评估数据迁移过程的安全性,达到防止敏感信息泄露的技术效果。第一方面,本专利技术实施例提供了一种敏感数据扫描方法,包括:数据采样模块读取目标数据库中的数据样本,并将所述数据样本发送到消息中间件;所述消息中间件将所述数据样本进行存储;扫描节点集群中的每个扫描节点从所述消息中间件中读取所述数据样本,并 ...
【技术保护点】
1.一种敏感数据扫描方法,其特征在于,包括:/n数据采样模块读取目标数据库中的数据样本,并将所述数据样本发送到消息中间件;/n所述消息中间件将所述数据样本进行存储;/n扫描节点集群中的每个扫描节点从所述消息中间件中读取所述数据样本,并对所述数据样本进行扫描,得到敏感数据。/n
【技术特征摘要】 【专利技术属性】
1.一种敏感数据扫描方法,其特征在于,包括:
数据采样模块读取目标数据库中的数据样本,并将所述数据样本发送到消息中间件;
所述消息中间件将所述数据样本进行存储;
扫描节点集群中的每个扫描节点从所述消息中间件中读取所述数据样本,并对所述数据样本进行扫描,得到敏感数据。
2.根据权利要求1所述的方法,其特征在于,所述数据采样模块读取目标数据库中的数据样本,包括:
数据采样模块读取目标数据库的元数据;
所述数据采集模块根据所述元数据确定读取范围,并读取所述读取范围内的数据样本。
3.根据权利要求2所述的方法,其特征在于,在所述数据采集模块读取所述读取范围内的数据样本之后,还包括:
所述数据采集模块对所述读取范围内的数据样本进行设定处理,得到所述数据样本;
其中,所述设定处理包括设定类型字段的过滤处理、空数据样本过滤处理和去重处理中的至少一项。
4.根据权利要求1所述的方法,其特征在于,所述扫描节点集群中的每个扫描节点对所述数据样本进行扫描,得到敏感数据,包括:
扫描节点集群中的每个扫描节点确定所述数据样本的长度;
如果所述数据样本的长度超过设定长度阈值,所述每个扫描节点采用文本分类器对所述数据样本进行敏感数据分类。
5.根据权利要求4所述的方法,其特征在于,在所述确扫描节点集群中的每个扫描节点定所述数据样本的长度之后,还包括:
如果所述数据样本的长度未超过设定长度阈值,所述每个扫描节点采用至少一个正则表达式分别对所述数据样本进行敏感数据筛选;
其中,所述至少一个正则表达式分别为不同种类敏感数据的筛选逻辑公式。
6.根据权利要求1所述的方法,其特征在于,在所述数据采样模块读取目标数据库中的数据样本之前,还包括:
技术研发人员:王若曾,
申请(专利权)人:中国建设银行股份有限公司,建信金融科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。