The calculation method of the invention discloses a method for symmetric matrix vector multiplication, the method for product of symmetric matrix calculation of N1 * N1 and N1 vector virje, first symmetric matrix on N1 * N1 and N1 vector virje block, and the N1 * N1 symmetric matrix block matrix to block at angle line trace data expansion, making symmetric matrix blocks, then N1 vectors are divided into blocks, according to the above matrix block calculation after an intermediate data block, and according to the intermediate data block calculation result vector. The method of symmetric matrix and vector multiplication applied to parallel processing of symmetric matrix can not only reduce the waste of symmetric matrix to storage space, but also improve the computation efficiency of symmetric matrix and vector multiplication.
【技术实现步骤摘要】
一种应用于对称矩阵与向量乘法的计算方法
本专利技术涉及计算机算法优化和计算机体系结构领域,具体来说,本专利技术涉及一种在保证可以对对称矩阵并行处理的前提下,不仅能够减少对称矩阵对存储空间的浪费,而且还能够提高对称矩阵与向量乘法的计算效率的应用于对称矩阵与向量乘法的计算方法。
技术介绍
矩阵与向量乘法在高性能数值计算领域(如过程控制、图像处理、数值分析、科学计算、求解动态规划问题、信号处理、理论物理、固态物理、编码理论、密码学、线性预测和计算机时序分析等)具有非常重要的作用,是具有计算和访存密集型特点的典型应用。据统计,在高性能计算中,90%以上的时间都消耗在矩阵向量乘法上。对称矩阵作为方形矩阵的一种,是稀疏矩阵的典型代表。上述应用中的矩阵大多是对称矩阵的形式,并且在BLAS库中,对称矩阵与向量乘法也是最核心的函数之一。它的性能对数值计算中大部分操作的性能都有影响,尤其是当对称矩阵阶数较高时,通常的计算过程需要占用较多的工作单元和较大的计算机内存,使得计算效率受到影响。因此,提高对称矩阵与向量乘法的计算效率,减少对称矩阵占用的内存空间,无论在理论上还是在实际应用上,对整个数值计算领域都有着重大而深远的意义。在已报道和所能查阅到的国内外相关研究中,关于矩阵与向量乘法的研究情况总结如下:目前,提高对称矩阵与向量乘法计算性能的方法包括硬件方法和软件方法,例如:引用信息为“薛永江,宋庆增,王瑞昆.浮点矩阵向量乘法的FPGA设计与优化[J].微电子学与计算机,2013(11):64-67.”的文献提出了一种基于IEEE-754的32bit、64bit浮点数格式,二叉树 ...
【技术保护点】
一种应用于对称矩阵与向量乘法的计算方法,该方法用于计算n1×n1的对称矩阵与n1维列向量的乘积,其特征在于,包括以下步骤:S1:读取n1×n1对称矩阵中的上三角矩阵中的数据;S2:以m为边长对上三角矩阵进行分块,分块后的数据块Aij排列成z行z列,1≤i≤j≤z,其中,若n1/m为整数,则z=n1/m,分块后得到z个m×m三角矩阵块以及n1(n1‑m)/2m
【技术特征摘要】
1.一种应用于对称矩阵与向量乘法的计算方法,该方法用于计算n1×n1的对称矩阵与n1维列向量的乘积,其特征在于,包括以下步骤:S1:读取n1×n1对称矩阵中的上三角矩阵中的数据;S2:以m为边长对上三角矩阵进行分块,分块后的数据块Aij排列成z行z列,1≤i≤j≤z,其中,若n1/m为整数,则z=n1/m,分块后得到z个m×m三角矩阵块以及n1(n1-m)/2m2个m×m的普通矩阵块,若n1/m不为整数,则z=[n1/m]+1,分块后得到z-1个m×m三角矩阵块、1个a×a三角矩阵块、z(z+1)/2个m×m普通矩阵块以及z-1个m×a矩阵块,其中a=n1-(z-1)×m;S3:分别对S2中得到的z-1个m×m三角矩阵块Aii进行微量数据扩展,使之成为对称矩阵块;S4:以m为边长对n1维列向量进行分块,分块后的数据块Bi1共z行,其中,若n1/m为整数,则z=n1/m,分块后得到z个m×m矩阵块,若n1/m不为整数,则z=[n1/m]+1分块后得到z-1...
【专利技术属性】
技术研发人员:薛瑞,张浩,范东睿,叶笑春,朱亚涛,
申请(专利权)人:北京中科睿芯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。