一种公有云用户敏感数据管理方法技术

技术编号:33205137 阅读:11 留言:0更新日期:2022-04-24 00:49
本发明专利技术提供了一种公有云用户敏感数据管理方法包括:步骤1:解析数据库中的涉敏数据,并提取含有姓名的第一疑似敏感数据段,步骤2:利用预设敏感词语对所述数据库中的涉敏数据进行扫描,筛选含有敏感词语的第二疑似敏感数据段,分别对第一疑似敏感数据段和第二疑似敏感数据段进行加密,将加密后的数据段放置在对应原位置中,并替换原数据段,用以防止用户个人信息泄露,保护网络环境,创造绿色健康的网络言论平台。络言论平台。络言论平台。

【技术实现步骤摘要】
一种公有云用户敏感数据管理方法


[0001]本专利技术涉及数据管理方法
,特别涉及一种公有云用户敏感数据管理方法。

技术介绍

[0002]随着互联网的迅速发展,数据安全问题引发了全民的广泛关注,个人信息及敏感信息泄露的安全事件,可能引发严重的网络犯罪。而传统敏感数据发现技术对于不规范敏感数据的识别率特别低,容易出现遗漏导致敏感数据泄露风险。
[0003]现今互联网系统中,敏感数据通常在各自业务链中由业务方提供加密保护。对于小型系统来说,由于业务不复杂,系统维护人员通常比较容易掌控各个涉及敏感数据的访问点。而随着业务逐渐复杂,敏感数据可能在业务链中互相渗透,导致敏感数据在多处存放多次,甚至出现敏感数据因业务责任人经验不足采取了较弱加密措施而出现容易被攻破的脆弱点的问题,可见,用户在互联网中的数据存在风险,故本专利技术提高了一种公有云用户敏感数据管理方法,用以代替人工筛选敏感数据,避免数据被攻破造成信息泄露的问题。

技术实现思路

[0004]本专利技术提供一种公有云用户敏感数据管理方法,用以代替人工筛选敏感数据,避免数据被攻破造成信息泄露的问题。
[0005]本专利技术提供的一种公有云用户敏感数据管理方法,包括:
[0006]步骤1:解析数据库中的涉敏数据,并提取含有姓名的第一疑似敏感数据段;
[0007]步骤2:利用预设敏感词语对所述数据库中的涉敏数据进行扫描,筛选含有敏感词语的第二疑似敏感数据段;
[0008]步骤3:分别对第一疑似敏感数据段和第二疑似敏感数据段进行加密;
[0009]步骤4:将加密后的数据段放置在对应原位置中,并替换原数据段。
[0010]在一种可实施的方式中,
[0011]步骤1:解析数据库中的涉敏数据,并提取含有姓名的第一疑似敏感数据段之前,包括:
[0012]在所述数据库中提取用户手动加密的初始敏感数据段;
[0013]获取所述初始敏感数据段对应的加密信息;
[0014]在所述数据库中获取与所述加密信息一致的第三疑似敏感数据段,并将所述加密信息复制到所述第三疑似敏感数据段所在的位置,进行加密。
[0015]在一种可实施的方式中,
[0016]步骤1:解析数据库中的涉敏数据,并提取含有姓名的第一疑似敏感数据段,包括:
[0017]基于预设姓氏对比库和预设关键字数据库提取所述涉敏数据中含姓氏的第一待检验数据段;
[0018]获取所述第一待检数据段中包含的名词,并对所述第一待检数据段进行分段,提
取属于姓名的第一子待检数据段;
[0019]获取所有所述第一子待检数据段视为所述第一疑似敏感数据段。
[0020]在一种可实施的方式中,
[0021]步骤2:利用预设敏感词语对所述数据库中的涉敏数据进行扫描,筛选含有敏感词语的第二疑似敏感数据段,包括:
[0022]在所述涉敏数据中提取包含所述预设敏感词语的第二待检数据段;
[0023]根据所述敏感词语在所述第二待检数据段的位置,判断所述第二待检数据段上是否存在关联敏感词;
[0024]汇集所有敏感词语和所述关联敏感词视为所述第二疑似敏感数据段。
[0025]在一种可实施的方式中,
[0026]步骤3:分别对第一疑似敏感数据段和第二疑似敏感数据段进行加密,包括:
[0027]在敏感数据段中标记对应的敏感数据,并为所述敏感数据段匹配对应的敏感类型;
[0028]基于不同的敏感类型,将对应敏感数据段中对应的部分转换为指定符号。
[0029]在一种可实施的方式中,
[0030]获取所有所述第一子待检数据段视为所述第一疑似敏感数据段之后,包括:
[0031]分别解析所述第一疑似敏感数据段,在对应的所述第一疑似敏感数据段上标记第一疑似敏感文字;
[0032]同时获取所述第一疑似敏感数据段对应的第一云用户,提取所示第一云用户的历史加密信息,利用所示历史加密信息遍历所示第一疑似敏感数据段,获取第二疑似敏感文字;
[0033]将所述第一疑似敏感文字和第二疑似敏感文字视为疑似敏感文字;
[0034]根据所述疑似敏感文字为映射元素构建文字集;
[0035]分别获取所述文字集中每一映射元素对应的词义;
[0036]在所述文字集中提取属于姓名的第一映射元素;
[0037]将所述第一映射元素划分为若干字符;
[0038]根据预设姓氏数据为所述若干字符中的第一字符匹配对应的待加密姓氏;
[0039]以所述待加密姓氏为根节点,建立初始二叉树,并根据所述若干字符中的剩余字符建立所述初始二叉树的叶子节点;
[0040]分别对每一剩余字符添加扰码,建立加密字符,并将所述加密字符输入到所述初始二叉树对应的叶子节点上;
[0041]复制所述初始二叉树的叶子节点,建立转换二叉树;
[0042]在所述转换二叉树上随机选取分叉树以及对应的加密字符;
[0043]调节所述加密字符的顺序,生成对应的加密姓名;
[0044]根据所述历史加密姓名更新所述历史加密信息;
[0045]将所述第一疑似敏感数据中对应的姓名字符并转换为对应的加密姓名。
[0046]在一种可实施的方式中,
[0047]步骤3:分别对第一疑似敏感数据段和第二疑似敏感数据段进行加密,包括:
[0048]将所述第一疑似敏感数据段和所述第二疑似敏感数据段视为未脱敏数据;
[0049]分别判断每一所述未脱敏数据对应的敏感程度;
[0050]基于不同未脱敏数据对应的敏感程度,建立脱敏模型,对所述未脱敏数据进行脱敏工作。
[0051]在一种可实施的方式中,
[0052]基于不同未脱敏数据对应的敏感程度,建立脱敏模型,对所述未脱敏数据进行脱敏工作,包括:
[0053]根据所述预设敏感词语,获取每一敏感词对应的描述信息以及扩展信息,建立敏感词索引;
[0054]将所述未脱敏数据转换为未脱敏字符串;
[0055]对所述未脱敏字符串进行词义划分,并将词义相同的字符视为一类,建立若干字符数组,并分别解析每一字符数组对应的组义;
[0056]获取所述组义的敏感程度,根据所述敏感程度在预设多模型库中获取对应的雏形脱敏模型,且对应的雏形脱敏模型包括与字符数组的数量相一致的脱敏层;
[0057]根据所述组义将字符数组输入到对应的脱敏层中,利用所述敏感词索引在所述脱敏层中进行检索,提取含有敏感词的待脱敏字符数组;
[0058]在所述待脱敏字符数组中标记待脱敏字符,并基于所述待脱敏字符与所述敏感词索引的关系,在预设敏感词索引

脱敏粒子列表中为所述待脱敏字符匹配相应的脱敏粒子;
[0059]利用所述脱敏粒子对对应的脱敏层进行脱敏工作并获取脱敏后的新字符;
[0060]利用所述新字符代替所述未脱敏字符串中对应的所述待脱敏字符,获本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种公有云用户敏感数据管理方法,其特征在于,包括:步骤1:解析数据库中的涉敏数据,并提取含有姓名的第一疑似敏感数据段;步骤2:利用预设敏感词语对所述数据库中的涉敏数据进行扫描,筛选含有敏感词语的第二疑似敏感数据段;步骤3:分别对第一疑似敏感数据段和第二疑似敏感数据段进行加密;步骤4:将加密后的数据段放置在对应原位置中,并替换原数据段。2.根据权利要求1所述的一种公有云用户敏感数据管理方法,其特征在于,步骤1:解析数据库中的涉敏数据,并提取含有姓名的第一疑似敏感数据段之前,包括:在所述数据库中提取用户手动加密的初始敏感数据段;获取所述初始敏感数据段对应的加密信息;在所述数据库中获取与所述加密信息一致的第三疑似敏感数据段,并将所述加密信息复制到所述第三疑似敏感数据段所在的位置,进行加密。3.根据权利要求1所述的一种公有云用户敏感数据管理方法,其特征在于,步骤1:解析数据库中的涉敏数据,并提取含有姓名的第一疑似敏感数据段,包括:基于预设姓氏对比库和预设关键字数据库提取所述涉敏数据中含姓氏的第一待检验数据段;获取所述第一待检数据段中包含的名词,并对所述第一待检数据段进行分段,提取属于姓名的第一子待检数据段;获取所有所述第一子待检数据段视为所述第一疑似敏感数据段。4.根据权利要求1所述的一种公有云用户敏感数据管理方法,其特征在于,步骤2:利用预设敏感词语对所述数据库中的涉敏数据进行扫描,筛选含有敏感词语的第二疑似敏感数据段,包括:在所述涉敏数据中提取包含所述预设敏感词语的第二待检数据段;根据所述敏感词语在所述第二待检数据段的位置,判断所述第二待检数据段上是否存在关联敏感词;汇集所有敏感词语和所述关联敏感词视为所述第二疑似敏感数据段。5.根据权利要求1所述的一种公有云用户敏感数据管理方法,其特征在于,步骤3:分别对第一疑似敏感数据段和第二疑似敏感数据段进行加密,包括:在敏感数据段中标记对应的敏感数据,并为所述敏感数据段匹配对应的敏感类型;基于不同的敏感类型,将对应敏感数据段中对应的部分转换为指定符号。6.根据权利要求3所述的一种公有云用户敏感数据管理方法,其特征在于,获取所有所述第一子待检数据段视为所述第一疑似敏感数据段之后,包括:分别解析所述第一疑似敏感数据段,在对应的所述第一疑似敏感数据段上标记第一疑似敏感文字;同时获取所述第一疑似敏感数据段对应的第一云用户,提取所示第一云用户的历史加密信息,利用所示历史加密信息遍历所示第一疑似敏感数据段,获取第二疑似敏感文字;将所述第一疑似敏感文字和第二疑似敏感文字视为疑似敏感文字;根据所述疑似敏感文字为映射元素构建文字集;分别获取所述文字集中每一映射元素对应的词义;
在所述文字集中提取属于姓名的第一映射元素;将所述第一映射元素划分为若干字符;根据预设姓氏数据为所述若干字符中的第一字符匹配对应的待加密姓氏;以所述待加密姓氏为根节点,建立初始二叉树,并根据所述若干字符中的剩余字符建立所述初始二叉树的叶子节点;分别对每一剩余字符添加扰码,建立加密字符,并将所述加密字符输入到所述...

【专利技术属性】
技术研发人员:霍玉璨吕翔梅宝林
申请(专利权)人:信阳农林学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1