一种寄存器内完成连续矩阵乘法的计算方法及装置制造方法及图纸

技术编号:41785489 阅读:29 留言:0更新日期:2024-06-24 20:13
本发明专利技术公开一种寄存器内完成连续矩阵乘法的计算方法及装置,属于计算机领域。所述方法包括:获取矩阵A、矩阵B和矩阵C′;其中,所述矩阵C′是通过对矩阵C进行置换处理得到;基于wmma.load变换分别将矩阵A、矩阵B和矩阵C′读入warp之后,通过调整warp中每个线程的寄存器顺序,得到矩阵A、矩阵B和矩阵C的连续乘法结果。本发明专利技术能够充分利用AI加速器的算力资源,大幅提升计算速度。

【技术实现步骤摘要】

本专利技术属于计算,涉及一种寄存器内完成连续矩阵乘法的计算方法及装置


技术介绍

1、得益于人工智能的发展,与之相关的应用越来越普及。为此,一些厂商研发了他们自己的ai处理器或者加速器,如google的tpu、英特尔的神经网络棒、特斯拉的无人驾驶汽车芯片,以及现在众多智能手机所带有的神经网络加速引擎等,为专门的业务提供强劲的性能处理能力。这些ai加速装置通常采用低精度、新颖数据流、内存内计算的架构,而且针对特定算法操作(如卷积操作)进行过优化,性能远高于一般的通用处理器,例如nvidiatesla v100的tensor core可以提供125tensor tflops的算力。随着技术的发展,此类强大的算力资源必然越来越常见,且更容易获得访问。如果能够将ai加速器的算力用于除人工智能应用外的其它领域,如密码计算,那一定也会大大提升该领域的计算效率。

2、另一方面,量子计算机给信息安全尤其是既有密码体制安全带来了巨大的挑战。格密码,作为一种抗量子密码,被广泛认为最有希望成为下一代的公钥密码标准的密码系统。在标准格中,环上多项式乘法计算是特别耗时间本文档来自技高网...

【技术保护点】

1.一种寄存器内完成连续矩阵乘法的计算方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对矩阵C进行置换处理,包括:

3.根据权利要求1所述的方法,其特征在于,所述通过调整warp中每个线程的寄存器顺序,得到矩阵A、矩阵B和矩阵C的连续乘法结果,包括:

4.根据权利要求3所述的方法,其特征在于,所述调整warp中每个线程的寄存器顺序,以得到矩阵G对应的矩阵G′,包括:

5.根据权利要求1至4任一所述的方法,其特征在于,所述基于wmma.load变换分别将矩阵A、矩阵B和矩阵C′读入warp之后,通过调整warp...

【技术特征摘要】

1.一种寄存器内完成连续矩阵乘法的计算方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对矩阵c进行置换处理,包括:

3.根据权利要求1所述的方法,其特征在于,所述通过调整warp中每个线程的寄存器顺序,得到矩阵a、矩阵b和矩阵c的连续乘法结果,包括:

4.根据权利要求3所述的方法,其特征在于,所述调整warp中每个线程的寄存器顺序,以得到矩阵g对应的矩阵g′,包括:

5.根据权利要求1至4任一所述的方法,其特征在于,所述基于wmma.load变换分别将矩阵a、矩阵b和矩阵c′读入warp之后,通...

【专利技术属性】
技术研发人员:郑昉昱周天荆继武王跃武林璟锵孙思维边毅
申请(专利权)人:中国科学院大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1