一种基于大数据平台的数据安全存储方法技术

技术编号:37668431 阅读:14 留言:0更新日期:2023-05-26 04:28
本发明专利技术公开了一种基于大数据平台的数据安全存储方法,涉及数据安全存储技术领域,通过获取到所有的目标数据;之后获取到目标数据的文件属性,建立伪目标数据,之后对伪目标数据进行内容填充,根据目标数据的标题和具体内容的属性自动匹配相关的内容,将其填充到伪目标数据内;再之后添加到暗文件地址到伪目标数据中,通过对伪目标数据进行重新分段处理,将唯一数值与对应的伪目标数据内的段落特性保持一致之后,建立唯一数值与暗文件地址内的标的字符的映射数据关系,并将伪目标数据中的多余段落内容赋予废弃标识,得到更新处理后的伪目标数据、映射数据关系和废弃标识。映射数据关系和废弃标识。

【技术实现步骤摘要】
一种基于大数据平台的数据安全存储方法


[0001]本专利技术属于数据安全存储
,具体是一种基于大数据平台的数据安全存储方法。

技术介绍

[0002]专利号为CN107122685A的专利公开了一种大数据安全存储方法,包括:对表征存储设备存储安全的预设监控指标进行监测,其中,所述预设监控指标包括:工作环境指标;响应于监测到所述存储设备的工作环境指标的指标值发生异常,按照指标值发生异常的工作环境指标对应的预设处理策略,对所存储数据的存储方式进行调整。本专利技术还提供了一种大数据安全存储设备。本专利技术提供的大数据安全存储方法和设备通过传感器对存储设备所处的工作环境进行探测,并在工作环境发生异常时进行相应的处理,避免了环境异常对所存储数据造成的破坏,实现了大数据的安全存储。
[0003]但是,针对于该专利来说,针对目标数据的存储缺乏一种迷惑性内容来针对环境被破译访问后的数据内容被其他人所窥视,从而造成损失的问题,基于此,提供一种解决方案。

技术实现思路

[0004]本专利技术旨在至少解决现有技术中存在的技术问题之一;为此,本专利技术提出了一种基于大数据平台的数据安全存储方法。
[0005]为实现上述目的,根据本专利技术的第一方面的实施例提出一种基于大数据平台的数据安全存储方法,该方法具体包括下述步骤:
[0006]步骤一:获取到所有的待存储数据,将其标记为目标数据;
[0007]步骤二:获取到目标数据的文件属性,建立伪目标数据,伪目标数据保持属性、标题一致,之后对伪目标数据进行内容填充,根据目标数据的标题和具体内容的属性自动匹配相关的内容,将其填充到伪目标数据内;
[0008]步骤三:添加到暗文件地址到伪目标数据中,通过对伪目标数据进行重新分段处理,将唯一数值与对应的伪目标数据内的段落特性保持一致之后,建立唯一数值与暗文件地址内的标的字符的映射数据关系,并将伪目标数据中的多余段落内容赋予废弃标识,得到更新处理后的伪目标数据、映射数据关系和废弃标识;
[0009]步骤四:将伪目标数据的地址标记为文件明文地址,之后将映射数据关系和废弃标识存储在钥匙盘,钥匙盘为一移动硬盘,由对应有权限用户随身携带。
[0010]进一步地,步骤二中的内容填充具体方式为:
[0011]S1:获取到目标数据的标题,对其进行分词处理,得到若干个分词,之后去除通用词,剩余的分词标记为关键词;
[0012]S2:获取到目标数据内的所有内容,对所有内容进行分词处理,将目标数据划分为若干个分词,去除通用词之后剩余的分词标记为单项分词;
[0013]S3:之后对所有的单项分词进行归类,将相同的划分为一个单项分词,并统计每一个单项分词的出现次数,将其标记为单项出次;
[0014]S4:之后获取到单项出次最高的数值,将该数值标记为上限次,之后将上限次乘以X1之后得到的数值标记为准线次;
[0015]S5:将单项出次中大于等于准线次的对应单项分词标记为标的分词,同样将与关键词一致的单项分词标记为标的分词;得到所有的标的分词;
[0016]S6:之后对目标数据进行按照间隔符进行划分,将目标划分为若干个间隔段,间隔符为预设的分隔符号;
[0017]S7:将间隔段内出现两个以上的标的分词标记为关键隔段,其余标记为常规隔段;
[0018]S8:之后将目标数据内的所有内容复制一份,复制内容标记为待填充内容;
[0019]S9:将待填充内容内的关键隔段删除,删除完成之后,顺序不变,保留常规隔段;
[0020]S10:获取到目标数据的标题,从已公开的文件内寻找到与该标题相似度最高的数据,将该数据标记为替换数据,从替换数据内找出与待填充内容中关键隔段所在顺序数一致的内容段,将内容段按照顺序填充在删除的关键隔段中,形成新的待填充内容,将其标记为伪目标数据;
[0021]此处,替换数据中的内容段也是按照间隔符进行划分,划分为若干个内容段,从第一个到最后一个,赋予一个数字,该数字即为顺序;
[0022]S11:得到伪目标数据。
[0023]进一步地,步骤S1中的通用词为管理员预先设置的通用词语。
[0024]进一步地,步骤S4中的X1为预设数值,当然准线次不能小于等于2,若准线次小于等于2,则自动将其标记为3。
[0025]进一步地,步骤三中的添加暗文件地址到伪目标数据的具体方式为:
[0026]SS1:构建暗文件地址,暗文件地址所在目标数据内容仅能通过暗文件地址访问并查看;
[0027]SS2:将暗文件地址划分为分割为一个个字符,每个字符标记为标的字符,将字符的数字标记为地址数;
[0028]SS3:之后给每一个标的字符分配一个唯一数值,该唯一数值随机分配且互相不同,且保证该唯一数值大于50;给每一个标的字符分配完唯一数值后,构建映射数据关系;
[0029]SS4:之后获取到第一个标的字符,同步获取到伪目标数据,对伪目标数据内容进行第一段落划分,第一段落保证除标点符号和空格外其余字符的个数与对应的第一个标的字符的唯一数值一致,若第一个段落最后没有标点符号自动为其添加一个句号;
[0030]SS5:之后获取到第二个标的字符,对伪目标数据按照步骤SS4的相同方式进行处理,得到第二个段落;
[0031]SS6:依次获取到下一个标的字符,进行步骤SS5相同处理后,得到对应标的字符个段落,剩余的内容放置在同一个段落,并在段落初始位置打上废弃标识,该废弃标识由管理人员预设;
[0032]SS7:得到更新处理后的伪目标数据、映射数据关系和废弃标识。
[0033]进一步地,在用户需要访问目标文件的时候必须通过明文地址访问伪目标数据,之后通过钥匙盘,通过钥匙盘内的映射数据关系寻找到暗文件地址,通过暗文件地址方可
打开对应的目标数据进行访问,其余所有访问方式将被拒绝。
[0034]与现有技术相比,本专利技术的有益效果是:
[0035]本专利技术通过获取到所有的目标数据;之后获取到目标数据的文件属性,建立伪目标数据,之后对伪目标数据进行内容填充,根据目标数据的标题和具体内容的属性自动匹配相关的内容,将其填充到伪目标数据内;再之后添加到暗文件地址到伪目标数据中,通过对伪目标数据进行重新分段处理,将唯一数值与对应的伪目标数据内的段落特性保持一致之后,建立唯一数值与暗文件地址内的标的字符的映射数据关系,并将伪目标数据中的多余段落内容赋予废弃标识,得到更新处理后的伪目标数据、映射数据关系和废弃标识;
[0036]通过伪目标数据能够让破译进入访问环境的用户,访问到错误的伪目标数据,且伪目标数据与正常的目标数据属性类似,避免轻易被识破,继续追踪正确内容,本专利技术简单有效,且易于实用。
具体实施方式
[0037]下面将结合实施例对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据平台的数据安全存储方法,其特征在于,该方法具体包括下述步骤:步骤一:获取到所有的待存储数据,将其标记为目标数据;步骤二:获取到目标数据的文件属性,建立伪目标数据,伪目标数据保持属性、标题一致,之后对伪目标数据进行内容填充,根据目标数据的标题和具体内容的属性自动匹配相关的内容,将其填充到伪目标数据内;步骤三:添加到暗文件地址到伪目标数据中,通过对伪目标数据进行重新分段处理,将唯一数值与对应的伪目标数据内的段落特性保持一致之后,建立唯一数值与暗文件地址内的标的字符的映射数据关系,并将伪目标数据中的多余段落内容赋予废弃标识,得到更新处理后的伪目标数据、映射数据关系和废弃标识;步骤四:将伪目标数据的地址标记为文件明文地址,之后将映射数据关系和废弃标识存储在钥匙盘,钥匙盘为一移动硬盘,由对应有权限用户随身携带。2.根据权利要求1所述的一种基于大数据平台的数据安全存储方法,其特征在于,步骤二中的内容填充具体方式为:S1:获取到目标数据的标题,对其进行分词处理,得到若干个分词,之后去除通用词,剩余的分词标记为关键词;S2:获取到目标数据内的所有内容,对所有内容进行分词处理,将目标数据划分为若干个分词,去除通用词之后剩余的分词标记为单项分词;S3:之后对所有的单项分词进行归类,将相同的划分为一个单项分词,并统计每一个单项分词的出现次数,将其标记为单项出次;S4:之后获取到单项出次最高的数值,将该数值标记为上限次,之后将上限次乘以X1之后得到的数值标记为准线次;S5:将单项出次中大于等于准线次的对应单项分词标记为标的分词,同样将与关键词一致的单项分词标记为标的分词;得到所有的标的分词;S6:之后对目标数据进行按照间隔符进行划分,将目标划分为若干个间隔段,间隔符为预设的分隔符号;S7:将间隔段内出现两个以上的标的分词标记为关键隔段,其余标记为常规隔段;S8:之后将目标数据内的所有内容复制一份,复制内容标记为待填充内容;S9:将待填充内容内的关键隔段删除,删除完成之后,顺序不变,保留常规隔段;S10:获取到目标数据的标题,从已公开的文件内寻找到与该标题相似度最高的数据,将该数据标记为替换数据,从替换数据内找出与待填...

【专利技术属性】
技术研发人员:赵惊勇
申请(专利权)人:广州中外万世网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1