当前位置: 首页 > 专利查询>东北大学专利>正文

一种用于大数据的进制转换方法技术

技术编号:19425948 阅读:23 留言:0更新日期:2018-11-14 10:44
本发明专利技术属于信息处理技术领域,公开了一种用于大数据的进制转换方法。分析大数进制转换操作对任意进制序列及向量字符位数之间相关复杂性的影响,通过估算内存空间得到按位权排列的完整的分段序列,基于分段除竖式长除运算法则利用迭代商及新进制数值得到新进制特征序列,有效进行大数的任意进制转换。本发明专利技术解决向量字符位溢出的问题,打破了内置转换的限制,克服转换进制值的局限,实现了转换的通用性。

【技术实现步骤摘要】
一种用于大数据的进制转换方法
本专利技术属于信息处理
,涉及一种用于大数据的进制转换方法。
技术介绍
基于信息安全的信息隐藏技术是将信息通过特定的方法隐藏于原始载体中,进而隐藏信息的“存在事实”,主要应用在银行系统、军事情报部门等保密通信中。目前常用的基于修改多方向编码技术(EMD,ExploitingModificationDirection)的信息隐写算法需要在秘密信息嵌入之前将原进制秘密信息转换为方法所需的其它进制序列,基于菱形编码的隐写算法需要将一个任意进制的秘密信息嵌入到像素中。可见,实现数据进制的正确和快速转换,是这一类信息隐写方法付诸实施的前提保障。在当今大数据的信息时代,秘密信息随隐写载体不同,可能大到PB、EB、ZB,甚至YB和BB。目前涉及的进制转换方法为经典长除法,该方法只能将整个数据对转换进制值进行相除求余(如图1所示)。受数据值域范围限制,这种方法只适用于原数据位数较少的情况,无法满足基于信息隐藏技术的大数据结构需求,因此,需要建立一种用于大数据的正确且快速的进制转换方法。大多数的进制转换方法都存在转换进制局限的问题,由于大数据具有的高速度(数据生成和使用的速度),高变化(数据类型和来源的范围)和高规模数据量特点,且大数之间任意进制转换的复杂性是包含在潜在变量之间的相关性中的,带来的问题就是计算复杂性呈非线性叠加,所以如何降低大数任意进制转换的复杂性是需要亟待解决的。
技术实现思路
本专利技术的目的是提供一种用于大数据进制转换的分段竖式长除方法,以解决现有技术存在的大数进制转换的“字符位数”溢出问题。为达到上述目的,本专利技术所采用的技术方案为:一种用于大数据进制转换分段竖式长除方法,分析大数进制转换操作对任意进制序列及向量字符位数之间相关复杂性的影响,通过估算内存空间得到按位权排列的完整的分段序列,基于分段除竖式长除运算法则利用迭代商及新进制数值得到新进制特征序列,有效进行大数的任意进制转换。本专利技术的特点在于:包括大数进制序列Xi,j,k:X为原始进制序列(x表示原始进制值);i表示迭代次数索引(i>0,i∈I,I为总迭代次数);j表示段号索引(j>0,j∈J,J为总分段数目);k表示每段序列位号索引(k>0,k∈K,K为每段序列总位数)。Yi表示新进制大数序列(y表示新进制值),就是将每次迭代的最后一个余数动态保存的序列。以及进行大数任意进制转换时涉及的参数L、Sj、Qi、Rk。其中,L表示原始进制序列总长度、每段数据长度K及分段数目J是根据原始进制序列及向量字符位数之间相关复杂性获得的,当原始数据并不能进行完整分段处理时,最末尾段的数据长度t一定满足t≤K。Sj(j=1,…,J)为每段的商序列;Qi=[Si,1,…,Si,J]表示每次迭代的商序列,作为被除数继续运算;商与上一段最后位权对应的余数Ri,j*1是一对相关的值,当Ri,j-1·xk+Xi,j·x0≥y时,商Sj有值;当计算的商为0时结束运算,动态倒序保留余数,得到新进制序列Yi。具体技术方案如下:(1)初始数据预处理利用随机序列产生函数生成均匀分布的伪随机整数序列X,根据需求设定要转换的进制值y,并基于原始进制序列长度采用自适应向量字符位分段的方法生成相应的特征段序列集,其中每段序列位数K固定,最末尾段的数据长度t满足t≤K;(2)通过模拟除法获得循环迭代数据;将步骤(1)得到原始数据序列按段滚动截取得到相应的段特征序列,应用分段按位除法算法计算出每段的商序列Sj(j=1,…,J)及相应位权上的余数,此时记录每段最后位权对应的余数Ri,j-1;将Ri,j-1传到下一段数据,利用位权及新进制值y衔接段与段,保证在进行下一段数据运算时的完整性及正确性,通过公式Ri,j-1·xK+Xi,j·x0-Sj·y=Ri,j获得商Sj和余数Ri,j;(3)动态存储迭代运算结果在迭代运算的同时通过动态向量连接方式将每段的商序列存储到每次迭代的商序列Qi=[Si,1,…,Si,J](J表示当次迭代的总段数)中,构造新的完整的商序列集作为下一次迭代的被除数,并对被除数做与原始数据相同的步骤(2)处理,得到每次迭代的商及余数;(4)输出进制转换结果将每次迭代的最后一段的最后一位余数Ri,J动态存储到Y序列中,直到Qi=[Si,1,…,Si,J]为0表示转换结束,保存结果,逆序输出Y序列中的余数,即为所求;否则继续用商除以进制值y,重复步骤(2)-(4)操作。本专利技术具有以下有益效果:(1)本专利技术转换方法首次专用于大数进制转换。目前涉及的进制转换方法为经典长除法,该方法只能将整个数据对转换进制值进行相除求余(如图1所示),受数据值域范围的限制会出现“字符位数”溢出问题,所以此方法只适用于原数据位数较少的情况。而本专利技术将大数原始数据进行按段顺序排列,利用分段思想将受“字符位数”溢出无法实现的大数除法问题分解成简单的分段竖式运算,解决向量字符位溢出的问题。(2)本专利技术提供的分段竖式长除方法,充分利用存储空间,采用分段存储机制对原始数据进行迭代运算,降低大数叠加运算带来的空间复杂性的同时,实现大数的任意进制转换,打破了内置转换的限制,克服转换进制值的局限,实现了转换的通用性。附图说明图1原始数据位数较少时整数的进制转换示意图。图2为本专利技术基于大数进制转换方法流程图。图3为本专利技术基于大数进制转换方法分段实施图。具体实施方式本专利技术提供一种用于大数据进制转换方法,其在基于修改多方向编码技术隐写算法及基于菱形编码的隐写算法等信息隐藏技术的实施方法包括以下步骤,本方法实施流程图如图2所示:(1)初始数据预处理;利用大数进制转换要求随机产生均匀分布的伪随机原始数据序列X,对产生的随机大数序列做预处理,即利用X长度采用自适应向量字符串分段的方法得到相应的特征段序列集。此外,定义新进制数值y。这样可以得到原始数据序列X,长度L、分段总数J及每段的总位数K。(2)通过模拟除法获得循环迭代数据;已知第一次迭代运算的原始数据为X,对其进行K位按序截取,通过模拟除法算法,按段遍历原始进制序列,获得每段商序列Sj(j=1,…,J)及Ri,j(第i次迭代、第j段最后的位权对应的余数),将Ri,j传递到下一段数据中作为计算第二段商序列的依据,依次利用余数及新进制数值x、y重复按段除法操作得到每段的商序列及最后位权的余数。获得商和余的公式可描述为:Ri,j·xK+Xi,j+1·x0-Sj+1·y=Ri,j+1(3)通过得到迭代运算结果;将每段商序列进行动态向量连接得到的每次迭代的商序列Qi=[Si,1,…,Si,J作为原始数据做模拟除法操作,且在动态存储的同时也保存本次迭代的最后一位余数RJ(表示当次迭代中的第j段、第k位余数)。(4)输出进制转换结果;根据竖式长除法性质,当商为0时表示运算结束,即当Qi=0时运算结束。将每次迭代的被除数的最后位权相应的余数动态存储到Y中,当Qi=0时逆序输出得到的余数,即Y=[RI,J,RI-1,J,…,R2,J,R1,J](I表示迭代次数,J表示当次迭代总段数,K表示每次迭代的每段的最后一位索引)。实例(参见图3),该实例是在基于修改多方向编码技术的二进制秘密信息转换到(2n+1)进制序列下对百位以上数据进行进制转换(n表示参与编码本文档来自技高网...

【技术保护点】
1.一种用于大数据的进制转换方法,其特征在于,包括如下步骤:(1)初始数据预处理利用随机序列产生函数生成均匀分布的伪随机整数序列X,根据需求设定要转换的进制值y,并基于原始进制序列长度采用自适应向量字符位分段的方法生成相应的特征段序列集,其中每段序列位数K固定,最末尾段的数据长度t满足t≤K;(2)通过模拟除法获得循环迭代数据;将步骤(1)得到原始数据序列按段滚动截取得到相应的段特征序列,应用分段按位除法算法计算出每段的商序列Sj(j=1,…,J)及相应位权上的余数,此时记录每段最后位权对应的余数Ri,j‑1;将Ri,j‑1传到下一段数据,利用位权及新进制值y衔接段与段,保证在进行下一段数据运算时的完整性及正确性,通过公式Ri,j‑1·xK+Xi,j·x0‑Sj·y=Ri,j获得商Sj和余数Ri,j;(3)动态存储迭代运算结果在迭代运算的同时通过动态向量连接方式将每段的商序列存储到每次迭代的商序列Qi=[Si,1,…,Si,J](J表示当次迭代的总段数)中,构造新的完整的商序列集作为下一次迭代的被除数,并对被除数做与原始数据相同的步骤(2)处理,得到每次迭代的商及余数;(4)输出进制转换结果将每次迭代的最后一段的最后一位余数Ri,J动态存储到Y序列中,直到Qi=[Si,1,…,Si,J]为0表示转换结束,保存结果,逆序输出Y序列中的余数,即为所求;否则继续用商除以进制值y,重复步骤(2)‑(4)操作。...

【技术特征摘要】
1.一种用于大数据的进制转换方法,其特征在于,包括如下步骤:(1)初始数据预处理利用随机序列产生函数生成均匀分布的伪随机整数序列X,根据需求设定要转换的进制值y,并基于原始进制序列长度采用自适应向量字符位分段的方法生成相应的特征段序列集,其中每段序列位数K固定,最末尾段的数据长度t满足t≤K;(2)通过模拟除法获得循环迭代数据;将步骤(1)得到原始数据序列按段滚动截取得到相应的段特征序列,应用分段按位除法算法计算出每段的商序列Sj(j=1,…,J)及相应位权上的余数,此时记录每段最后位权对应的余数Ri,j-1;将Ri,j-1传到下一段数据,利用位权及新进制值y衔接段与段,保证在进行下一段数据运算时的完整...

【专利技术属性】
技术研发人员:张华王蕊
申请(专利权)人:东北大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1