【技术实现步骤摘要】
本专利技术属于计算,涉及一种寄存器内完成连续矩阵乘法的计算方法及装置。
技术介绍
1、得益于人工智能的发展,与之相关的应用越来越普及。为此,一些厂商研发了他们自己的ai处理器或者加速器,如google的tpu、英特尔的神经网络棒、特斯拉的无人驾驶汽车芯片,以及现在众多智能手机所带有的神经网络加速引擎等,为专门的业务提供强劲的性能处理能力。这些ai加速装置通常采用低精度、新颖数据流、内存内计算的架构,而且针对特定算法操作(如卷积操作)进行过优化,性能远高于一般的通用处理器,例如nvidiatesla v100的tensor core可以提供125tensor tflops的算力。随着技术的发展,此类强大的算力资源必然越来越常见,且更容易获得访问。如果能够将ai加速器的算力用于除人工智能应用外的其它领域,如密码计算,那一定也会大大提升该领域的计算效率。
2、另一方面,量子计算机给信息安全尤其是既有密码体制安全带来了巨大的挑战。格密码,作为一种抗量子密码,被广泛认为最有希望成为下一代的公钥密码标准的密码系统。在标准格中,环上多项式
...【技术保护点】
1.一种寄存器内完成连续矩阵乘法的计算方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对矩阵C进行置换处理,包括:
3.根据权利要求1所述的方法,其特征在于,所述通过调整warp中每个线程的寄存器顺序,得到矩阵A、矩阵B和矩阵C的连续乘法结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述调整warp中每个线程的寄存器顺序,以得到矩阵G对应的矩阵G′,包括:
5.根据权利要求1至4任一所述的方法,其特征在于,所述基于wmma.load变换分别将矩阵A、矩阵B和矩阵C′读入warp之
...【技术特征摘要】
1.一种寄存器内完成连续矩阵乘法的计算方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对矩阵c进行置换处理,包括:
3.根据权利要求1所述的方法,其特征在于,所述通过调整warp中每个线程的寄存器顺序,得到矩阵a、矩阵b和矩阵c的连续乘法结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述调整warp中每个线程的寄存器顺序,以得到矩阵g对应的矩阵g′,包括:
5.根据权利要求1至4任一所述的方法,其特征在于,所述基于wmma.load变换分别将矩阵a、矩阵b和矩阵c′读入warp之后,通...
【专利技术属性】
技术研发人员:郑昉昱,周天,荆继武,王跃武,林璟锵,孙思维,边毅,
申请(专利权)人:中国科学院大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。