一种基于大数据的数据加密方法技术

技术编号:36935937 阅读:53 留言:0更新日期:2023-03-22 18:57
本发明专利技术涉及数据处理技术领域,具体涉及一种基于大数据的数据加密方法。该方法获取每个数据的目标二进制编码和对应的十进制数,将每个目标二进制编码作为一个子块;基于十进制数和出现频次构建频次直方图;筛选出频次直方图中的正常突变十进制数;基于正常突变十进制数分割频次直方图得到多个局部直方图;对局部直方图均衡化,基于均衡化前后的频次直方图增补子块得到增补子块序列;生成混沌序列,基于混沌序列对增补子块序列进行置乱处理得到置乱子块序列,置乱子块序列中各子块对应的二值化编码作为加密密文。本发明专利技术根据数据的频次变化情况自适应划分局部直方图,以针对性的进行均衡化操作,从而增加数据的隐私性。从而增加数据的隐私性。从而增加数据的隐私性。

【技术实现步骤摘要】
一种基于大数据的数据加密方法


[0001]本专利技术涉及数据处理
,具体涉及一种基于大数据的数据加密方法。

技术介绍

[0002]大数据最大的特征就是其具有庞大的数据规模;并且能够从海量的数据中高效精确的分析数据创造出价值;但人们在享受大数据带来极大便利的同时,个人信息数据同样也遭受着巨大的泄漏风险;因此需要对数据进行必要的加密处理,增加数据的隐私性,降低数据被攻击窃取的风险。传统的数据加密主要是以熵编码加密为主,通过分析数据的频率信息进行加密,而该类加密算法同样可以通过频率信息的规律性进行破解,其存在保密性较低的问题。

技术实现思路

[0003]为了解决保密性较低的问题技术问题,本专利技术的目的在于提供一种基于大数据的数据加密方法,所采用的技术方案具体如下:获取每个数据的初始二进制编码;对所述初始二进制编码进行补位操作得到目标二进制编码,将每个目标二进制编码作为一个子块;转换所述目标二进制编码为十进制数;基于各子块对应的十进制数和十进制数的出现频次构建频次直方图;根据十进制数和相邻的十进制数的出现频次的差异得到频次突变程度,基于所述频次突变程度筛选出频次直方图上的突变十进制数;根据所述突变十进制数和相邻的十进制数的出现频次的差异、所述突变十进制数和相邻的十进制数的差异,筛选出正常突变十进制数;基于所述正常突变十进制数,分割所述频次直方图得到至少两个局部直方图;对各局部直方图进行均衡化,基于均衡化前后的频次直方图增补子块,得到增补子块序列;生成混沌序列,基于所述混沌序列对增补子块序列进行置乱处理得到置乱子块序列,将所述置乱子块序列中各子块对应的二值化编码作为加密密文。
[0004]优选的,所述根据十进制数和相邻的十进制数的出现频次的差异得到频次突变程度,包括:基于频次直方图,选取任意十进制数作为目标十进制数,计算所述目标十进制数的出现频次和前一个十进制数的出现频次的差值的绝对值,作为第一差值;计算目标十进制数对应的后一个十进制数的出现频次和所述目标十进制数的出现频次的差值的绝对值,作为第二差值;以自然常数为底数,以负的第二差值和第一差值的比值为指数的指数函数值作为参考突变程度,一减去所述参考突变程度得到所述频次突变程度。
[0005]优选的,所述基于所述频次突变程度筛选出频次直方图上的突变十进制数,包括:获取频次突变程度大于预设突变阈值的十进制数作为突变十进制数。
[0006]优选的,所述根据所述突变十进制数和相邻的十进制数的出现频次的差异、所述突变十进制数和相邻的十进制数的差异,筛选出正常突变十进制数,包括:
计算所述突变十进制数的出现频次和前一个十进制数的出现频次的差值,作为第三差值;计算突变十进制数对应的后一个十进制数的出现频次和所述突变十进制数的出现频次的出现频次的差值,作为第四差值;计算所述突变十进制数和前一个十进制数的数值差值,作为第五差值;计算突变十进制数对应的后一个十进制数和突变十进制数的数值差值,作为第六差值;所述第四差值和所述第六差值的比值,作为第一比值;所述第三差值和所述第五差值的比值,作为第二比值;所述第一比值和所述第二比值的差值的绝对值作为参考值;以自然常数为底数,以负的参考值为指数的指数函数值,作为频次斜率稳定值;根据所述频次斜率稳定值筛选出正常突变十进制数。
[0007]优选的,所述根据所述频次斜率稳定值筛选出正常突变十进制数,包括:获取频次斜率稳定值大于预设稳定阈值的突变十进制数,作为正常突变十进制数。
[0008]优选的,所述基于均衡化前后的频次直方图增补子块,得到增补子块序列,包括:获取均衡化前子块对应的十进制数的出现频次和均衡化后子块对应的十进制数的出现频次的差值,作为均衡差值;当所述均衡差值大于0时,在十进制数对应的最后一个子块的后面补上均衡差值个子块;当所述均衡差值小于0时,将十进制数对应的最后的负的均衡差值个子块进行删除;当均衡差值等于0时子块数量不变;对每个十进制数对应的子块均进行增补子块,得到增补后的增补子块序列。
[0009]优选的,混沌序列的生成方法为:利用Logistic混沌映射生成混沌序列。
[0010]优选的,所述对所述初始二进制编码进行补位操作得到目标二进制编码,包括:对于长度小于七的初始二进制编码,在首位前补零,补至长度为七,将补零后的二进制编码作为中间二进制编码;对于长度为七的中间二进制编码,在末位后补一,得到目标二进制编码。
[0011]优选的,所述基于各子块对应的十进制数和十进制数的出现频次构建频次直方图,包括:以所述子块对应的十进制数作为频次直方图的横轴,以十进制数的出现频次作为频次直方图的纵轴。
[0012]本专利技术实施例至少具有如下有益效果:该方法首先获取每个数据的目标二进制编码和对应的十进制数,将每个目标二进制编码作为一个子块;基于各子块对应的十进制数和十进制数的出现频次构建频次直方图;根据十进制数和相邻的十进制数的出现频次的差异得到频次突变程度、十进制数和相邻的十进制数的差异,筛选出正常突变十进制数,该正常突变十进制数是在频次直方图上发生频次突变的十进制数,排除掉不符合曲线起伏趋势的非正常突变十进制,相邻的正常突变十进制数之间的区域相应的频次程度较为缓和,适合后续的局部化处理;基于正常突变十进制数,分割频次直方图得到至少两个局部直方图,基于正常突变十进制数进行划分,使得频次发生突变的十进制数不处于同一个区域内;对局部直方图进行均衡化,实现自适应分区域均衡化使得均衡化后的频次直方图中所有十进制数的频次差异较小,且分区域均衡化后的频次直方图相对于常规的直方图均衡化,其保密性更高;基于均衡化前后的频次直方图增补子块,得到增补子块序列,以实现数据的加密,进一步提高数据的保密性;生成
混沌序列,基于混沌序列对增补子块序列进行置乱处理得到置乱子块序列,将置乱子块序列中各子块对应的二值化编码作为加密密文,置乱子块序列通过混沌序列的置乱处理,相对于增补子块序列更好的实现了数据的加密,提高了数据的保密性。本专利技术通过对数据进行二进制转换,将数据映射到构建的频次直方图中;并根据数据在频次直方图中的频次变化情况自适应分局部区域,以针对性的进行均衡化操作;使其加密得到的密文不具备熵编码的频率规律;从而增加数据的隐私性,提高数据的保密性。
附图说明
[0013]为了更清楚地说明本专利技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0014]图1为本专利技术一个实施例所提供的一种基于大数据的数据加密方法的方法流程图;图2为本专利技术一个实施例所提供的频次直方图的示意图;图3为本专利技术一个实施例所提供的对直方图进行常规的直方图均衡化后的示意图;图4为本专利技术一个实施例所提供的频次直方图中正常频次突变点和非正常频次突变点的示意图。
具体实施方式
[0015]为了更进一步阐述本专利技术为达成预定本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的数据加密方法,其特征在于,该方法包括以下步骤:获取每个数据的初始二进制编码;对所述初始二进制编码进行补位操作得到目标二进制编码,将每个目标二进制编码作为一个子块;转换所述目标二进制编码为十进制数;基于各子块对应的十进制数和十进制数的出现频次构建频次直方图;根据十进制数和相邻的十进制数的出现频次的差异得到频次突变程度,基于所述频次突变程度筛选出频次直方图上的突变十进制数;根据所述突变十进制数和相邻的十进制数的出现频次的差异、所述突变十进制数和相邻的十进制数的差异,筛选出正常突变十进制数;基于所述正常突变十进制数,分割所述频次直方图得到至少两个局部直方图;对各局部直方图进行均衡化,基于均衡化前后的频次直方图增补子块,得到增补子块序列;生成混沌序列,基于所述混沌序列对增补子块序列进行置乱处理得到置乱子块序列,将所述置乱子块序列中各子块对应的二值化编码作为加密密文。2.根据权利要求1所述的一种基于大数据的数据加密方法,其特征在于,所述根据十进制数和相邻的十进制数的出现频次的差异得到频次突变程度,包括:基于频次直方图,选取任意十进制数作为目标十进制数,计算所述目标十进制数的出现频次和前一个十进制数的出现频次的差值的绝对值,作为第一差值;计算目标十进制数对应的后一个十进制数的出现频次和所述目标十进制数的出现频次的差值的绝对值,作为第二差值;以自然常数为底数,以负的第二差值和第一差值的比值为指数的指数函数值作为参考突变程度,一减去所述参考突变程度得到所述频次突变程度。3.根据权利要求1所述的一种基于大数据的数据加密方法,其特征在于,所述基于所述频次突变程度筛选出频次直方图上的突变十进制数,包括:获取频次突变程度大于预设突变阈值的十进制数作为突变十进制数。4.根据权利要求1所述的一种基于大数据的数据加密方法,其特征在于,所述根据所述突变十进制数和相邻的十进制数的出现频次的差异、所述突变十进制数和相邻的十进制数的差异,筛选出正常突变十进制数,包括:计算所述突变十进制数的出现频次和前一个十进制数的出现频次的差值,作为第三差值;计算突变十进制数对应的后一个十进制数的出现频次和所...

【专利技术属性】
技术研发人员:李金稳董磊李勇李永冠柴丽彬王丽孙国庆
申请(专利权)人:山东水发紫光大数据有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1