一种用于大数据的进制转换方法技术

技术编号：19425948 阅读：23 留言：0更新日期：2018-11-14 10:44

本发明专利技术属于信息处理技术领域，公开了一种用于大数据的进制转换方法。分析大数进制转换操作对任意进制序列及向量字符位数之间相关复杂性的影响，通过估算内存空间得到按位权排列的完整的分段序列，基于分段除竖式长除运算法则利用迭代商及新进制数值得到新进制特征序列，有效进行大数的任意进制转换。本发明专利技术解决向量字符位溢出的问题，打破了内置转换的限制，克服转换进制值的局限，实现了转换的通用性。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于大数据的进制转换方法
本专利技术属于信息处理
，涉及一种用于大数据的进制转换方法。
技术介绍
基于信息安全的信息隐藏技术是将信息通过特定的方法隐藏于原始载体中，进而隐藏信息的“存在事实”，主要应用在银行系统、军事情报部门等保密通信中。目前常用的基于修改多方向编码技术(EMD，ExploitingModificationDirection)的信息隐写算法需要在秘密信息嵌入之前将原进制秘密信息转换为方法所需的其它进制序列，基于菱形编码的隐写算法需要将一个任意进制的秘密信息嵌入到像素中。可见，实现数据进制的正确和快速转换，是这一类信息隐写方法付诸实施的前提保障。在当今大数据的信息时代，秘密信息随隐写载体不同，可能大到PB、EB、ZB，甚至YB和BB。目前涉及的进制转换方法为经典长除法，该方法只能将整个数据对转换进制值进行相除求余(如图1所示)。受数据值域范围限制，这种方法只适用于原数据位数较少的情况，无法满足基于信息隐藏技术的大数据结构需求，因此，需要建立一种用于大数据的正确且快速的进制转换方法。大多数的进制转换方法都存在转换进制局限的问题，由于大数据具有的高速度(数据生成和使用的速度)，高变化(数据类型和来源的范围)和高规模数据量特点，且大数之间任意进制转换的复杂性是包含在潜在变量之间的相关性中的，带来的问题就是计算复杂性呈非线性叠加，所以如何降低大数任意进制转换的复杂性是需要亟待解决的。
技术实现思路
本专利技术的目的是提供一种用于大数据进制转换的分段竖式长除方法，以解决现有技术存在的大数进制转换的“字符位数”溢出问题。为达到上述目的，本专利技术所...

【技术保护点】
1.一种用于大数据的进制转换方法，其特征在于，包括如下步骤：(1)初始数据预处理利用随机序列产生函数生成均匀分布的伪随机整数序列X，根据需求设定要转换的进制值y，并基于原始进制序列长度采用自适应向量字符位分段的方法生成相应的特征段序列集，其中每段序列位数K固定，最末尾段的数据长度t满足t≤K；(2)通过模拟除法获得循环迭代数据；将步骤(1)得到原始数据序列按段滚动截取得到相应的段特征序列，应用分段按位除法算法计算出每段的商序列Sj(j＝1，…，J)及相应位权上的余数，此时记录每段最后位权对应的余数Ri，j‑1；将Ri，j‑1传到下一段数据，利用位权及新进制值y衔接段与段，保证在进行下一段数据运算时的完整性及正确性，通过公式Ri，j‑1·xK+Xi，j·x0‑Sj·y＝Ri，j获得商Sj和余数Ri，j；(3)动态存储迭代运算结果在迭代运算的同时通过动态向量连接方式将每段的商序列存储到每次迭代的商序列Qi＝[Si，1，…，Si，J](J表示当次迭代的总段数)中，构造新的完整的商序列集作为下一次迭代的被除数，并对被除数做与原始数据相同的步骤(2)处理，得到每次迭代的商及余数；(4)输出进制转...

【技术特征摘要】
1.一种用于大数据的进制转换方法，其特征在于，包括如下步骤：(1)初始数据预处理利用随机序列产生函数生成均匀分布的伪随机整数序列X，根据需求设定要转换的进制值y，并基于原始进制序列长度采用自适应向量字符位分段的方法生成相应的特征段序列集，其中每段序列位数K固定，最末尾段的数据长度t满足t≤K；(2)通过模拟除法获得循环迭代数据；将步骤(1)得到原始数据序列按段滚动截取得到相应的段特征序列，应用分段按位除法算法计算出每段的商序列Sj(j＝1，…，J)及相应位权上的余数，此时记录每段最后位权对应的余数Ri，j-1；将Ri，j-1传到下一段数据，利用位权及新进制值y衔接段与段，保证在进行下一段数据运算时的完整...

【专利技术属性】
技术研发人员：张华，王蕊，
申请(专利权)人：东北大学，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人