一种面向异构并行架构的高性能SM4比特切片优化方法技术

技术编号：34053047 阅读：23 留言：0更新日期：2022-07-06 16:18

本发明专利技术公开一种面向异构并行架构的高性能SM4比特切片优化方法，属于安全密码应用技术领域，本方法通过将SM4分组密码算法在1比特数据宽度下实现，可以在非向量指令集和向量指令集上实现多线程SM4，在向量指令集上可以支持更高的加密速度。持更高的加密速度。

A high performance SM4 bit slicing optimization method for heterogeneous parallel architecture

全部详细技术资料下载

【技术实现步骤摘要】
一种面向异构并行架构的高性能SM4比特切片优化方法

[0001]本专利技术属于安全密码应用
，涉及一种面向异构并行架构的高性能SM4比特切片优化方法。

技术介绍

[0002]SM4是我国无线局域网标准WAPI中所采用的分组密码标准，随后被我国商用密码标准采用。作为我国商用密码的分组密码标准，预计SM4在国内的敏感但非机密的应用领域会逐渐取代3DES、AES等国外分组密码标准，用于通信加密、数据加密等应用场合。SM4是密钥长度和分组长度均为128比特的对称密码算法，输出128比特作为密文。
[0003]下面给出采用的运算符号及相应的含义：mod：模运算；：32位比特与运算；：32位比特或运算；：32位比特非运算；：32位比特异或运算；：mod 比特算术加运算；：32位比特循环左移比特运算；：向左赋值运算符；：包含元素的有限域。
[0004]密钥扩展算法如下：标准算法的SM4的字长为32比特，加密密钥长度为128比特，表示为4个字；轮密钥表示为32个字；明文输入看作4个字，密文输出表示为；SM4密钥扩展算法：1）设4个字；2）轮密钥生成算法为；其中，是一个合成置换函数，包含了线性变换和非线性变换，都是常量。
[0005]加密算法如下：1）32次迭代运算；
2）输出；其中，是一个合成置换函数，包含了线性变换和非线性变换。
[0006]由于SM4设计时的预计应用领域为低功耗芯片（即WAPI芯片），因此SM4针对减少硬件电路数量进行了优化，带来的后果是SM4的软件实现效率较低...

【技术保护点】

【技术特征摘要】
1.一种面向异构并行架构的高性能SM4比特切片优化方法，其特征在于，包括如下步骤：1）将原始标准算法SM4的32比特字长的变量，按顺序分割成32个1比特字长的变量；2）将原始标准算法SM4的线性部分运算：32比特字的异或运算和32比特字的循环左移运算，按照步骤1）定义的变量，转化成在32个1比特字长之间进行异或和换位；3）将原始标准算法SM4的非线性部分运算S盒，分解成矩阵仿射变换和有限域求逆；4）对于有限域求逆，利用有限域塔式结构变换，将的有限域通过矩阵仿射变换，同构映射到复合域上，变换成的求逆和乘法，实现在1比特字长下计算；5）对于的求逆，利用有限域塔式结构变换，将有限域通过矩阵仿射变换，同构映射到有限域，变换成的求逆和乘法，实现在1比特字长下计算；6）对于的求逆，等价于高位比特不变，低位等于高位异或低位，实现在1比特字长下计算；7）按照上述步骤1）至6），实现整个SM4算法仅依赖1比特字长、异或以及与运算完成整个计算，由此将X位寄存器看作X向量寄存器使用，实现X组SM4算法多线程并行计算。2.如权利要求1所述的方法，步骤2）中的异或运算步骤包括：1）对于原始标准算法SM4存在的两个32比特状态字，计算；2）将SM4中的变量分割成32比特和；3）对位分别异或计算：，输出结果，该结果为32比特状态字按照1比特分割的形式。3.如权利要求1所述的方法，步骤2）中的换位的步骤包括：...

【专利技术属性】
技术研发人员：关志，陈钟，何逸飞，王珂，孙磊，齐向东，刘勇，孔坚，
申请(专利权)人：奇安信科技集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人