基于数据编码的数据库安全加密方法及系统技术方案

技术编号:38681815 阅读:13 留言:0更新日期:2023-09-02 22:54
本发明专利技术涉及数据处理技术领域,提出了基于数据编码的数据库安全加密方法及系统,包括:采集数据库中的地理信息数据作为原始数据;对原始数据进行LZW编码,得到第一编码结果,根据第一编码结果获取原始数据中的若干连续段,得到每个连续段的高频字符集合;根据每个连续段的高频字符集合获取若干择一序列,根据择一序列中不同字符在不同连续段中的字符频率,获取每个择一序列的优选程度,进而得到原始数据的初始列表;根据初始列表进行MTF编码,再进行LZW压缩得到压缩后数据,对压缩后数据进行AES加密,完成数据库中地理信息数据的加密存储。本发明专利技术旨在解决数据库中大量数据压缩后加密得到的密文能够反映部分原数据明文信息的问题。题。题。

【技术实现步骤摘要】
基于数据编码的数据库安全加密方法及系统


[0001]本专利技术涉及数据处理
,具体涉及基于数据编码的数据库安全加密方法及系统。

技术介绍

[0002]在测绘地理信息领域中,有大量的矢量及点位信息存储在数据库中,实现地理信息数据的统一管理;然而随着更新频率的加快使得数据量成倍增长,因此需要对原始数据先进行压缩,再通过对压缩后的数据进行加密,实现对数据库中地理信息数据的安全管理。
[0003]现有技术中LZW算法由于编码效果较好,通常采用LZW算法对地理信息数据进行压缩,而后利用现有加密算法实现加密,然而现有加密算法容易在密文中获取部分明文分布信息,同时LZW压缩后数据也容易从编码后数据中体现编码前数据的分布信息,因此现有方法会导致数据库中的地理信息数据的加密安全性较低;因此可以通过对LZW算法的编码结果进行分析,根据编码结果中容易被暴露的明文信息,获取MTF算法的初始列表进而重新编码,从而破坏原始数据的明文分布信息,再进行LZW压缩及加密,避免了明文分布信息的保留,提高数据库中地理信息数据的加密安全性。

技术实现思路

[0004]本专利技术提供基于数据编码的数据库安全加密方法及系统,以解决现有的数据库中大量数据压缩后加密得到的密文能够反映部分原数据明文信息的问题,所采用的技术方案具体如下:第一方面,本专利技术一个实施例提供了基于数据编码的数据库安全加密方法,该方法包括以下步骤:采集数据库中的地理信息数据作为原始数据;根据原始数据的第一编码结果,获取原始数据的若干连续段;根据每个连续段中字符的字符频次,得到每个连续段的高频字符集合;根据所有高频字符集合获取的若干择一序列中,每个择一序列中元素在不同连续段中的字符频率,获取每个择一序列的优选程度,将优选程度最大的择一序列作为原始数据的初始列表;对原始数据根据初始列表进行MTF编码得到第二编码结果,对第二编码结果进行LZW压缩得到压缩后数据,对压缩后数据进行AES加密,完成数据库中地理信息数据的加密存储。
[0005]进一步的,所述原始数据的若干连续段,具体的获取方法为:根据原始数据的第一编码结果,得到第一编码结果的若干段连续区域;获取每段连续区域在原始数据对应的一段数据,将每段数据记为原始数据的一个连续段,得到原始数据的若干连续段。
[0006]进一步的,所述得到第一编码结果的若干段连续区域,包括的具体方法为:
对原始数据进行LZW编码,得到原始数据的第一编码结果,将第一编码结果中每个元素都减去相邻前一个元素得到一个差值,按照第一编码结果中元素顺序对得到的差值进行排序,得到第一编码结果的差值序列;对差值序列中所有值为1的元素进行标记,记为差值序列中的标记元素,将标记元素连续分布的数量大于等于标记数量的部分,记为一段标记区域,对差值序列得到若干段标记区域;获取每段标记区域在第一编码结果中对应的区域,记为第一编码结果中的连续区域。
[0007]进一步的,所述得到每个连续段的高频字符集合,包括的具体方法为:以任意一个连续段为目标连续段,对目标连续段进行字符频次统计,根据每个字符对应的字符频次,通过OTSU多阈值分割,将目标连续段中字符划分为多个类别;对每个类别中所有字符对应的字符频次求均值,将均值作为每个类别的类别频次,将类别频次最大的类别作为目标连续段的高频字符集合;获取每个连续段的高频字符集合。
[0008]进一步的,所述每个择一序列的优选程度,具体的获取方法为:从每个连续段的高频字符集合中任意选择一个高频字符,将选择的所有高频字符按照对应连续段在原始数据中的顺序进行排列,得到若干择一序列;以任意一个择一序列为目标择一序列,目标择一序列的优选程度的计算方法为:,其中,表示目标择一序列中元素数量,表示目标择一序列中出现重复的元素数量,表示目标择一序列中第个元素在对应连续段的字符频率,表示目标择一序列中第个元素在其他连续段的字符频率均值,表示以自然常数为底的指数函数;所述目标择一序列中第个元素在其他连续段的字符频率均值的获取方法为:获取除第个元素对应连续段之外的其他连续段中,存在第个元素对应字符的连续段,对这些连续段中第个元素对应的字符在连续段中的字符频率求均值,得到。
[0009]第二方面,本专利技术另一个实施例提供了基于数据编码的数据库安全加密系统,该系统包括:数据库采集模块,采集数据库中的地理信息数据作为原始数据;数据处理分析模块:根据原始数据的第一编码结果,获取原始数据的若干连续段;根据每个连续段中字符的字符频次,得到每个连续段的高频字符集合;根据所有高频字符集合获取的若干择一序列中,每个择一序列中元素在不同连续段中的字符频率,获取每个择一序列的优选程度,将优选程度最大的择一序列作为原始数据的初始列表;数据编码加密模块,对原始数据根据初始列表进行MTF编码得到第二编码结果,对第二编码结果进行LZW压缩得到压缩后数据,对压缩后数据进行AES加密,完成数据库中地理信息数据的加密存储。
[0010]本专利技术的有益效果是:本专利技术通过对测绘地理信息领域的数据库中的地理信息数
据分批次进行加密存储,每批次作为一份原始数据,通过对原始数据获取初始列表,根据MTF编码得到第二编码结果,再进行LZW编码压缩及AES加密,通过初始列表的获取提高第二编码结果与原始数据的字符分布信息的差异,进而保证压缩及加密后的数据不会呈现过多原始数据的字符分布信息,提高数据库的加密安全性;其中初始列表获取过程中,首先对原始数据通过LZW编码结果进行分析,得到若干连续段,根据连续段中高频字符得到择一序列,通过对每个择一序列的元素不重复性以及元素的字符频率仅在对应连续段较高的特性进行分析,得到作为初始列表的择一序列,保证根据初始列表进行MTF编码可以最大程度破坏原始数据的字符分布信息,提高最终的加密效果。
附图说明
[0011]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0012]图1为本专利技术一个实施例所提供的基于数据编码的数据库安全加密方法流程示意图;图2为本专利技术另一个实施例所提供的基于数据编码的数据库安全加密系统结构框图。
具体实施方式
[0013]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0014]请参阅图1,其示出了本专利技术一个实施例所提供的基于数据编码的数据库安全加密方法流程图,该方法包括以下步骤:步骤S001、采集数据库中的地理信息数据作为原始数据。
[0015]本实施例的目的是对数据库中的大量地理信息数据进行安全加密,因此首先需要获取数据库中的地理信息数据,由于测绘地理信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于数据编码的数据库安全加密方法,其特征在于,该方法包括以下步骤:采集数据库中的地理信息数据作为原始数据;根据原始数据的第一编码结果,获取原始数据的若干连续段;根据每个连续段中字符的字符频次,得到每个连续段的高频字符集合;根据所有高频字符集合获取的若干择一序列中,每个择一序列中元素在不同连续段中的字符频率,获取每个择一序列的优选程度,将优选程度最大的择一序列作为原始数据的初始列表;对原始数据根据初始列表进行MTF编码得到第二编码结果,对第二编码结果进行LZW压缩得到压缩后数据,对压缩后数据进行AES加密,完成数据库中地理信息数据的加密存储。2.根据权利要求1所述的基于数据编码的数据库安全加密方法,其特征在于,所述原始数据的若干连续段,具体的获取方法为:根据原始数据的第一编码结果,得到第一编码结果的若干段连续区域;获取每段连续区域在原始数据对应的一段数据,将每段数据记为原始数据的一个连续段,得到原始数据的若干连续段。3.根据权利要求2所述的基于数据编码的数据库安全加密方法,其特征在于,所述得到第一编码结果的若干段连续区域,包括的具体方法为:对原始数据进行LZW编码,得到原始数据的第一编码结果,将第一编码结果中每个元素都减去相邻前一个元素得到一个差值,按照第一编码结果中元素顺序对得到的差值进行排序,得到第一编码结果的差值序列;对差值序列中所有值为1的元素进行标记,记为差值序列中的标记元素,将标记元素连续分布的数量大于等于标记数量的部分,记为一段标记区域,对差值序列得到若干段标记区域;获取每段标记区域在第一编码结果中对应的区域,记为第一编码结果中的连续区域。4.根据权利要求1所述的基于数据编码的数据库安全加密方法,其特征在于,所述得到每个连续段的高频字符集合,包括的具体方法为:以任意一个连续段为目标连续段,对目标连续段进行字符频次统计,根据每个字符对...

【专利技术属性】
技术研发人员:陈杰刘津高杨谷守周陈明剑李雪晴朱丽思焦锐
申请(专利权)人:北京启恒星科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1