一种向量化密码运算加速方法技术

技术编号：32772799 阅读：59 留言：0更新日期：2022-03-23 19:28

本发明专利技术公开了信息安全技术领域的一种向量化密码运算加速方法，包括利用SIMD技术提供的指令集实现密码算法，使算法支持多通道的数据同步运算；数据块的向量化设计，根据密码运算规则和SIMD数据输入要求，对数据块进行向量化处理；基于向量化数据块的运算引擎接口设计；算法分路请求方法设计和实现和构建合成引擎，本方法不仅能够成倍提升SM3和SM4密码算法的组合运算性能，且通过算法分路请求设计了多通道数据流下数据保序处理，充分利用了CPU硬件的运算资源，满足实际使用需求。满足实际使用需求。满足实际使用需求。

全部详细技术资料下载

【技术实现步骤摘要】
一种向量化密码运算加速方法

[0001]本专利技术涉及信息安全
，具体为一种向量化密码运算加速方法。

技术介绍

[0002]随着互联网的飞速发展，网络流量的剧增，对网络安全的要求也越来越高，国产商用密码算法作为我国网络空间安全的“内在基因”，对国密算法的运算性能要求也越来越高。
[0003]现有发布的密码算法中，SM4和SM3是以标准的形式发布的。算法的实现方式包括硬件和软件，硬件方式实现方式主要有这几种形式：专用芯片，通过硬件描述语言编程FPGA实现，整合专用芯片和FPGA制作成专用加密卡；软件实现主要是根据发布的算法标准实现。
[0004]密码算法在开源项目实现现状：
[0005]1.openssl 1.1.1已将SM2、SM3和SM4加入源码，且对SM4进行了中表法优化，但不支持SIMD技术加速；
[0006]2.intel ipsec
‑
mb实现了AES、MD5、SHA系列算法的并行加速和串行化方法，但不支持SM3和SM4；
[0007]3.intel ipp
‑
crypto支持国际通用算法和国密SM2、SM3、SM4算法，且提供了一种SM4的SSE+AES指令集4路并行运算的基础运算方法，但不提供公开的调用接口和串行化方法，没有提供8路和16路运算的方法，且不支持SM3的SIMD指令加速方法，不具备实用性；
[0008]4.github上的sm4ni项目也提供了一种SM4的SSE+AES指令集4路并行运算的基础运算方法...

【技术保护点】

【技术特征摘要】
1.一种向量化密码运算加速方法，其特征在于，包括如下步骤：步骤一：利用SIMD技术提供的指令集实现密码算法，使算法支持多通道的数据同步运算；步骤二：数据块的向量化设计，根据密码运算规则和SIMD数据输入要求，对数据块进行向量化处理；步骤三：基于向量化数据块的运算引擎接口设计；步骤四：算法分路请求方法设计和实现；步骤五：构建合成引擎。2.根据权利要求1所述的一种向量化密码运算加速方法，其特征在于：所述步骤一中利用SIMD技术实现SM3、SM4算法，其中SM3和SM4算法中多采用32位的整形运算，运算操作主要包括加、移位、与、或、异或和大小端转换。3.根据权利要求1所述的一种向量化密码运算加速方法，其特征在于：所述步骤二中数据块的处理按照分组长度及通道进行了向量化处理，具体可采用256位SIMD向量指令，以字为单位运算，分为8个通道。4.根据权利要求1所述的一种向量化密码运算加速方法，其特征在于：所述步骤三中向量化的数据引擎接口设计通过galois field变换实现了国产密码运算，并通过AES加速指令完成运算的加速，其中依次包括SM3的向量化引擎接口设计和SM4CBC模式的向量化引擎接口设计。5.根据权利要...

【专利技术属性】
技术研发人员：姜伟，李儒，湛欢，陈昌勇，任浩，
申请(专利权)人：中物院成都科学技术发展中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人