一种基于敏感数据库的自学习管理系统技术方案

技术编号:30048696 阅读:34 留言:0更新日期:2021-09-15 10:50
本发明专利技术提供一种基于敏感数据库的自学习管理系统,包括数据库更新模块、存储模块、自学习模块以及处理模块,所述存储模块内存储有初始敏感数据库,所述自学习模块用于根据初始敏感数据库进行敏感数据特征的构建,所述处理模块用于将接收到的数据进行归类处理,所述数据库更新模块用于将归类处理后的敏感数据存储至存储模块中;所述自学习模块包括第一学习单元以及第二学习单元,本发明专利技术能够通过自学习管理系统,根据新产生的敏感数据进行重新更新归类,能够提高对敏感数据归类的准确性,以解决现有的敏感数据的处理过程较为死板,处理效率和安全性较低的问题。和安全性较低的问题。和安全性较低的问题。

【技术实现步骤摘要】
一种基于敏感数据库的自学习管理系统


[0001]本专利技术涉及数据处理
,尤其涉及一种基于敏感数据库的自学习管理系统。

技术介绍

[0002]敏感数据是指泄漏后可能会给社会或个人带来严重危害的数据。包括个人隐私数据,如姓名、身份证号码、住址、电话、银行账号、邮箱、密码、医疗信息、教育背景等;也包括企业或社会机构不适合公布的数据,如企业的经营情况,企业的网络结构、IP地址列表等。特别是目前智能电网系统的普及,对信息收集的粒度提高,同时也就提高了用电信息的泄漏风险。
[0003]现有的技术中,在对敏感数据进行处理的过程中,通常都是根据人工提前设定的评判准则进行划分,然后再将敏感数据进行归类,这种敏感数据的管理方法已经不适用于数据泛滥的时代,现在的数据处理领域,数据的更新速度快,不同数据的组合类型也在发生变化,使用原有的敏感数据管理系统已经不能满足现有的识别场景,很容易对一些新型的敏感数据漏判,导致数据处理过程的安全性和效率降低。

技术实现思路

[0004]针对现有技术存在的不足,本专利技术目的是提供一种基于敏感数据库的自学习管理系统,能够通过自学习管理系统,根据新产生的敏感数据进行重新更新归类,能够提高对敏感数据归类的准确性,以解决现有的敏感数据的处理过程较为死板,处理效率和安全性较低的问题。
[0005]为了实现上述目的,本专利技术是通过如下的技术方案来实现:一种基于敏感数据库的自学习管理系统,包括数据库更新模块、存储模块、自学习模块以及处理模块,所述存储模块内存储有初始敏感数据库,所述自学习模块用于根据初始敏感数据库进行敏感数据特征的构建,所述处理模块用于将接收到的数据进行归类处理,所述数据库更新模块用于将归类处理后的敏感数据存储至存储模块中;
[0006]所述自学习模块包括第一学习单元以及第二学习单元;所述第一学习单元用于根据初始敏感数据库进行敏感数据特征的构建,所述第二学习单元用于根据更新后的敏感数据库进行敏感数据特征的构建;
[0007]所述第一学习单元包括敏感数据分类子单元以及第一特征构建子单元;所述敏感数据分类子单元配置有敏感数据分类策略,所述敏感数据分类策略包括:将初始敏感数据库中的敏感数据进行分类,分类级别为高度敏感数据、中度敏感数据以及轻度敏感数据;
[0008]再将高度敏感数据、中度敏感数据以及轻度敏感数据进行数据标签分类,数据标签分为数据来源区域、数字数据、组合数据、体征数据、支付记录数据以及登录记录数据;
[0009]所述第一特征构建子单元包括第一特征构建策略,所述第一特征构建策略包括:将高度敏感数据中的数据来源区域进行提取,并标记为高度区域特征;
[0010]将高度敏感数据中的数字数据和支付记录数据进行提取,并将同时标记支付记录数据和数字数据的组合标记为高度支付密码特征;
[0011]将高度敏感数据中的组合数据和登录记录数据进行提取,并将同时标记组合数据和登录记录数据的组合标记为高度登录密码特征;
[0012]将高度敏感数据中的数字数据和登录记录数据进行提取,并将同时标记数字数据和登录记录数据的组合标记为高度登录账号特征;
[0013]将高度敏感数据中的体征数据和支付记录数据进行提取,并将同时标记体征数据和支付记录数据的组合标记为高度支付体征特征;
[0014]将高度敏感数据中的体征数据和登录记录数据进行提取,并将同时标记体征数据和登录记录数据的组合标记为高度登录体征特征;
[0015]所述处理模块包括敏感数据划分单元,所述敏感数据划分单元配置有比对策略,所述比对策略包括:将接收到的数据进行数据标签分类,然后将接收到的数据分别与高度区域特征、高度支付密码特征、高度登录密码特征、高度登录账号特征、高度支付体征特征以及高度登录体征特征进行比对,比对符合上述特征时,将数据归为一级高度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类;
[0016]所述数据库更新模块包括缓存单元,所述缓存单元用于存储第一时间内新归类的一级高度敏感数据;
[0017]所述存储模块包括高度敏感数据存储单元,所述高度敏感数据存储单元配置有移存策略,所述移存策略包括:每隔第一时间将缓存单元中的存储数据移存进高度敏感数据存储单元内。
[0018]进一步地,所述第二学习单元包括第二特征构建子单元,所述第二特征构建子单元配置有第二特征构建策略,所述第二特征构建策略包括:将具有高度区域特征和高度支付密码特征的数据进行提取,并将同时具备高度区域特征和高度支付密码特征的数据标记为高度集中支付区域特征。
[0019]进一步地,所述第二特征构建策略还包括:将具有高度登录账号特征和高度区域特征的数据进行提取,并将同时具备高度登录账号特征和高度区域特征的数据标记为高度集中登录区域特征。
[0020]进一步地,所述第二特征构建策略还包括:将具有高度支付密码特征的数据和高度登录密码特征的数据进行提取,并将同时具备高度支付密码特征和高度登录密码特征的数据标记为高度密码使用特征。
[0021]进一步地,所述第二特征构建策略还包括:将具有高度支付体征特征和高度登录体征特征的数据进行提取,并将同时具备高度支付体征特征和高度登录体征特征的数据标记为高度体征特征。
[0022]进一步地,所述比对策略还包括:将接收到的数据进行数据标签分类,然后将接收到的数据分别与高度集中支付区域特征、高度集中登录区域特征、高度密码使用特征以及高度体征特征进行比对,比对符合上述特征时,将数据归为二级高度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。
[0023]进一步地,所述第二学习单元还包括特征细分子单元,所述特征细分子单元配置有特征细分策略,所述特征细分策略包括:将高度密码使用特征进行拆分,记录高度密码使
用特征的位数以及使用组合符号的类型数,并将不同位数对应的组合符号的类型数进行归类,并选取不同位数下组合符号类型数出现次数最多的为相互匹配的组合,并标记为位数对应类型数特征。
[0024]进一步地,所述比对策略还包括:将接收到的数据进行数据标签分类,然后将接收到的数据与位数对应类型数特征进行比对,比对符合上述特征时,将数据归为细分敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。
[0025]进一步地,所述数据标签还包括视频数据、图片数据以及手机拍摄来源数据;
[0026]所述第一特征构建策略还包括:将高度敏感数据中的视频数据和手机拍摄来源数据进行提取,并将同时标记视频数据和手机拍摄来源数据的组合标记为高度视频特征;
[0027]将高度敏感数据中的图片数据和手机拍摄来源数据进行提取,并将同时标记图片数据和手机拍摄来源数据的组合标记为高度图片特征。
[0028]进一步地,所述比对策略还包括:将接收到的数据进行数据标签分类,然后将接收到的数据与高度视频特征和高度图片特征进行比对,比对符合上述特征时,将数据归为高度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于敏感数据库的自学习管理系统,其特征在于,包括数据库更新模块(13)、存储模块(14)、自学习模块(11)以及处理模块(12),所述存储模块(14)内存储有初始敏感数据库,所述自学习模块(11)用于根据初始敏感数据库进行敏感数据特征的构建,所述处理模块(12)用于将接收到的数据进行归类处理,所述数据库更新模块(13)用于将归类处理后的敏感数据存储至存储模块(14)中;所述自学习模块(11)包括第一学习单元(111)以及第二学习单元(112);所述第一学习单元(111)用于根据初始敏感数据库进行敏感数据特征的构建,所述第二学习单元(112)用于根据更新后的敏感数据库进行敏感数据特征的构建;所述第一学习单元(111)包括敏感数据分类子单元(1111)以及第一特征构建子单元(1112);所述敏感数据分类子单元(1111)配置有敏感数据分类策略,所述敏感数据分类策略包括:将初始敏感数据库中的敏感数据进行分类,分类级别为高度敏感数据、中度敏感数据以及轻度敏感数据;再将高度敏感数据、中度敏感数据以及轻度敏感数据进行数据标签分类,数据标签分为数据来源区域、数字数据、组合数据、体征数据、支付记录数据以及登录记录数据;所述第一特征构建子单元(1112)包括第一特征构建策略,所述第一特征构建策略包括:将高度敏感数据中的数据来源区域进行提取,并标记为高度区域特征;将高度敏感数据中的数字数据和支付记录数据进行提取,并将同时标记支付记录数据和数字数据的组合标记为高度支付密码特征;将高度敏感数据中的组合数据和登录记录数据进行提取,并将同时标记组合数据和登录记录数据的组合标记为高度登录密码特征;将高度敏感数据中的数字数据和登录记录数据进行提取,并将同时标记数字数据和登录记录数据的组合标记为高度登录账号特征;将高度敏感数据中的体征数据和支付记录数据进行提取,并将同时标记体征数据和支付记录数据的组合标记为高度支付体征特征;将高度敏感数据中的体征数据和登录记录数据进行提取,并将同时标记体征数据和登录记录数据的组合标记为高度登录体征特征;所述处理模块(12)包括敏感数据划分单元(121),所述敏感数据划分单元(121)配置有比对策略,所述比对策略包括:将接收到的数据进行数据标签分类,然后将接收到的数据分别与高度区域特征、高度支付密码特征、高度登录密码特征、高度登录账号特征、高度支付体征特征以及高度登录体征特征进行比对,比对符合上述特征时,将数据归为一级高度敏感数据,并将比对相符的特征的标签添加到该数据中进行归类;所述数据库更新模块(13)包括缓存单元(131),所述缓存单元(131)用于存储第一时间内新归类的一级高度敏感数据;所述存储模块(14)包括高度敏感数据存储单元(141),所述高度敏感数据存储单元(141)配置有移存策略,所述移存策略包括:每隔第一时间将缓存单元(131)中的存储数据移存进高度敏感数据存储单元(141)内。2.根据权利要求1所述的一种基于敏感数据库的自学习管理系统,其特征在于,所述第二学习单元(112)包括第二特征构建子单元(1121),所述第二特征构建...

【专利技术属性】
技术研发人员:林德威高董英方志坚黄芳芳潘建笠刘积娟黄鹏陈强谢妙红李建平曾驰
申请(专利权)人:国网信通亿力科技有限责任公司国网信息通信产业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1