数据库敏感信息探测方法及系统技术方案

技术编号:10599386 阅读:123 留言:0更新日期:2014-10-30 13:06
本发明专利技术涉及信息安全技术领域,旨在提供数据库敏感信息探测方法及系统。该数据库敏感信息探测方法包括步骤:扫描数据库的系统视图,获取所有的用户表,对每一个用户表每个字段抽取一部分数据做为样本,对样本进行分析匹配,判断是否是敏感信息;该数据库敏感信息探测系统包括系统表、扫描模块、判断模块和显示模块,扫描模块和数据库连接,判断模块分别与敏感信息特征库、扫描模块相连,判断模块与显示模块连接。本发明专利技术基于正则表达特征库,通过特征库对数据库里的用户数据进行扫描探测,能够发现手机号、银行卡号、身份证号以及邮箱等敏感信息所在的位置,并提供详细的扫描报告,使数据库管理员能够重点防护和审计。

【技术实现步骤摘要】
【专利摘要】本专利技术涉及信息安全
,旨在提供数据库敏感信息探测方法及系统。该数据库敏感信息探测方法包括步骤:扫描数据库的系统视图,获取所有的用户表,对每一个用户表每个字段抽取一部分数据做为样本,对样本进行分析匹配,判断是否是敏感信息;该数据库敏感信息探测系统包括系统表、扫描模块、判断模块和显示模块,扫描模块和数据库连接,判断模块分别与敏感信息特征库、扫描模块相连,判断模块与显示模块连接。本专利技术基于正则表达特征库,通过特征库对数据库里的用户数据进行扫描探测,能够发现手机号、银行卡号、身份证号以及邮箱等敏感信息所在的位置,并提供详细的扫描报告,使数据库管理员能够重点防护和审计。【专利说明】数据库敏感信息探测方法及系统
本专利技术是关于信息安全
,特别涉及数据库敏感信息探测方法及系统。
技术介绍
当前各种敏感信息泄露的事件还是频繁发生,数据安全越来越受到人们的重视。 但目前数据库系统越来越庞大。大数据量给数据库的安全管理带来了新的问题。如果数据 库里只有几条数据管理起来很容易,但如果有几十个数据库,几千张表,不知道重要的信息 在哪里,防护和审计起来就会无从下手。因此必须有方法能快速全面地发现重要信息在数 据库里的位置,对这些重要的信息进行重点的防护和审计。 常见的数据库安全扫描软件主要检测数据库系统配置风险和数据库软件本身的 安全漏洞,分析的都是数据库系统的信息,没有探测敏感信息在哪里的功能。
技术实现思路
本专利技术的主要目的在于克服现有技术中的不足,提供一种能够发现敏感信息所在 位置的数据库探测方法及系统。为解决上述技术问题,本专利技术的解决方案是: 提供数据库敏感信息探测方法,具体包括下述步骤: (1)扫描数据库的系统视图,获取所有的用户表; (2)对每一个用户表每个字段抽取一部分数据做为样本; (3)对样本进行分析匹配,判断是否是敏感信息; 所述步骤(1)具体包括下述步骤: 步骤A :连接数据库; 步骤B :用SELECT语句获取数据库的系统视图里,数据库所有的表名,并排除系统 表,剩下用户表; 步骤C :将步骤B中获得的用户表列表返回; 所述步骤(2)具体包括下述步骤: 步骤D :在步骤C返回的用户表列表中,取一个用户表名; 步骤E :用SELECT语句和分页查询的方法,获取步骤D中选取的用户表中所有字 段的部分数据;所述部分数据是指取一个表开头的N条记录(比如一个表有1000条记录, 如果全部取出来就会对数据库造成影响,所以用分页查询的方法取开头的20条或30条判 断); 步骤F :将步骤E中获取的所有字段的部分数据,作为样本数据返回; 所述步骤(3)具体包括下述步骤: 步骤G :取步骤F返回的一个字段的样本数据; 步骤Η :对步骤G中选取的样本数据,采用正则表达式匹配的方法判断样本数据是 否属于敏感信息,判断方法为:如果样本数据全部跟敏感信息特征库中的敏感信息匹配,认 为样本数据是敏感数据字段,得出判断结果是;如果样本数据跟敏感信息特征库中的敏感 信息不低于80%的比例匹配,得出判断结果疑是;如果样本数据跟敏感信息特征库中的敏 感信息全部不匹配或者低于20%的比例匹配,则得出判断结果否; 步骤I :循环执行步骤D、步骤E、步骤F、步骤G、步骤H,直至完成对步骤C返回的 所有用户表进行判断,然后将步骤Η中得出的判断结果返回,并显示包含有判断结果的扫 描报告,且当判断结果为疑是或者是时,扫描报告中还包括敏感信息字段清单(即样本数 据中与敏感信息特征库匹配的部分,比如表Α的Β字段有敏感信息(手机号),返回就是表 名:A、字段:B、内容:138XXXXXXXX,让用户更直观的看到该敏感信息字段有什么样的敏感 信息)。 在本专利技术中,所述步骤Η中的敏感信息特征库是用于判断敏感信息的正则表达式 的一个集合(比如判断手机号有一个正则表达式,银行卡号是另一个正则表达式);敏感信 息是指需要防护和审计的数据,包括手机号、银行卡号、身份证号和邮箱。 在本专利技术中,所述敏感信息特征库中的正则表达式能进行自定义添加,用于敏感 信息的匹配判断(比如用户觉得员工编号是敏感信息,他们可以自定义一个匹配员工编号 的正则表达式,用来将包含员工编号的字段列出来);正则表达式是公开通用的字符串匹 配方法。 提供实现所述的数据库敏感信息探测方法的系统,包括系统表、扫描模块、判断模 块和显示模块,扫描模块和数据库连接,判断模块分别与敏感信息特征库、扫描模块相连, 判断模块与显示模块连接; 所述系统表用于对数据库进行扫描,并获取、返回数据库中的用户表; 所述扫描模块用于获取系统表返回的用户表里,各个字段的样本数据; 所述判断模块用于将扫描模块得到的样本数据,采用正则表达式匹配的方法进行 匹配判断是否为敏感信息,并得出是、否或者疑是中的一种判断结果; 所述显示模块用于反馈显示数据库中,被判断模块判断为敏感信息的字段。 本专利技术的实现原理是:首先正则表达特征库定义好敏感信息的特征,然后是对运 行使用期间的数据库进行扫描和探测。正则表达特征库收集了手机号、银行卡号、身份证号 以及邮箱等敏感信息的特征。扫描模块负责扫描数据库,并返回扫描到的用户样本数据;然 后,由判断模块根据正则表达特征库进行对比,判断被扫描的用户样本数据是否是敏感信 息。如是或疑是,就在扫描报告里列出敏感信息字段清单,供数据库管理员能够重点防护和 审计。 与现有技术相比,本专利技术的有益效果是: 本专利技术基于正则表达特征库,通过特征库对数据库里的用户数据进行扫描探测, 能够发现手机号、银行卡号、身份证号以及邮箱等敏感信息所在的位置,并提供详细的扫描 报告,使数据库管理员能够重点防护和审计。 【专利附图】【附图说明】 图1为本专利技术的数据库敏感信息探测系统工作原理图。 图2为本专利技术的数据库敏感信息探测方法工作流程图。 【具体实施方式】 首先需要说明的是,本专利技术涉及数据库技术,是计算机技术在信息安全
的一种应用。在本专利技术的实现过程中,会涉及到多个软件功能模块的应用。 申请人:认为,如 在仔细阅读申请文件、准确理解本专利技术的实现原理和专利技术目的以后,在结合现有公知技术 的情况下,本领域技术人员完全可以运用其掌握的软件编程技能实现本专利技术。前述软件功 能模块包括但不限于:正则表达特征库、扫描模块、判断模块、显示模块等,凡本专利技术申请文 件提及的均属此范畴, 申请人:不再一一列举。 下面结合附图与【具体实施方式】对本专利技术作进一步详细描述: 如图2所示,数据库敏感信息探测方法,具体包括下述步骤: (1)扫描数据库的系统视图,获取所有的用户表; (2)对每一个用户表每个字段抽取一部分数据做为样本; (3)对样本进行分析匹配,判断是否是敏感信息。 所述步骤(1)具体包括下述步骤: 步骤A :连接数据库; 步骤B :用SELECT语句获取数据库的系统视图里,数据库所有的表名,并排除系统 表,剩下用户表; 步骤C :将步骤B中获得的用户表列表返回。 所述步骤(2)具体包括下述步骤: 本文档来自技高网
...
数据库敏感信息探测方法及系统

【技术保护点】
数据库敏感信息探测方法,其特征在于,具体包括下述步骤:(1)扫描数据库的系统视图,获取所有的用户表;(2)对每一个用户表每个字段抽取一部分数据做为样本;(3)对样本进行分析匹配,判断是否是敏感信息;所述步骤(1)具体包括下述步骤:步骤A:连接数据库;步骤B:用SELECT语句获取数据库的系统视图里,数据库所有的表名,并排除系统表,剩下用户表;步骤C:将步骤B中获得的用户表列表返回;所述步骤(2)具体包括下述步骤:步骤D:在步骤C返回的用户表列表中,取一个用户表名;步骤E:用SELECT语句和分页查询的方法,获取步骤D中选取的用户表中所有字段的部分数据;所述部分数据是指取一个表开头的N条记录;步骤F:将步骤E中获取的所有字段的部分数据,作为样本数据返回;所述步骤(3)具体包括下述步骤:步骤G:取步骤F返回的一个字段的样本数据;步骤H:对步骤G中选取的样本数据,采用正则表达式匹配的方法判断样本数据是否属于敏感信息,判断方法为:如果样本数据全部跟敏感信息特征库中的敏感信息匹配,认为样本数据是敏感数据字段,得出判断结果是;如果样本数据跟敏感信息特征库中的敏感信息不低于80%的比例匹配,得出判断结果疑是;如果样本数据跟敏感信息特征库中的敏感信息全部不匹配或者低于20%的比例匹配,则得出判断结果否;步骤I:循环执行步骤D、步骤E、步骤F、步骤G、步骤H,直至完成对步骤C返回的所有用户表进行判断,然后将步骤H中得出的判断结果返回,并显示包含有判断结果的扫描报告,且当判断结果为疑是或者是时,扫描报告中还包括敏感信息字段清单。...

【技术特征摘要】

【专利技术属性】
技术研发人员:刘海卫范渊
申请(专利权)人:杭州安恒信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1