【技术实现步骤摘要】
基于GPU的异构大型矩阵求解方法
本专利技术涉及GPU矩阵求解
,尤其涉及基于GPU的异构大型矩阵求解方法。
技术介绍
随着计算机和集成电路技术的发展,图形硬件的更新速度越来越快,图形处理器GPU其多流水线结构、向量处理特性以及32位IEEE标准浮点精度的实现使得它对于计箅密集型的科学应用有非常大的吸引力,成为通用计算的一个有效并行平台,极大地提高了GPU的可编程性,使得个人计算机实现高性能并行计算变成可能,同时矩阵计算的普及非常重妥,很多工程问题最终都涉及矩阵运算,如数字图像处理、解微分方程求解、最小二乘法力学分析等。随着个人计算机应用的快速发展,在个人计算机上实现大型矩阵的快速计算问题变得越来越突出,其矩阵乘法的快速运算中,会导致乘法精度和运算速度出现偏差。现有的异构大型矩阵求解方法,均以高精度大型矩阵进行快速运算,但却对图形处理器GPU的计算速度造成阻碍,成为计算速度的瓶颈,并行计算是提高矩阵运算速度的最好方法。
技术实现思路
本专利技术的目的是提供基于GPU的异构大型矩阵求解 ...
【技术保护点】
1.基于GPU的异构大型矩阵求解方法,包括,其特征在于,所述;/n(1)将矩阵进行简单的分块,每个线程块负责计算乘积矩阵的一个子方阵(块内的每个线程负责计算子方矩阵的一个元素);/n(2)首先使用每个线程加载分块方阵对应元素,然后计算乘积方阵的一个元素;/n(3)每一线程将乘积的结果,累计到寄存器中,执行完毕后,将结构写入GPU内存中。/n
【技术特征摘要】 【专利技术属性】
1.基于GPU的异构大型矩阵求解方法,包括,其特征在于,所述;
(1)将矩阵进行简单的分块,每个线程块负责计算乘积矩阵的一个子方阵(块内的每个线程负责计算子方矩阵的一个元素);
(2)首先使用每个线程加载分块方阵对应元素,然后计算乘积方阵的一个元素;
(3)每一线程将乘积的结果,累计到寄存器中,执行完毕后,将结构写入GPU内存中。
2.根据权利要求1所述的基于GPU的异构大型矩阵求解方法,其特征在于,所述矩阵分解为多个16×16的方阵。
3.根据权利要求1所述的基于GPU的异构大型矩阵求解方法,其特征在于,所述每个线程块使用256个线程并行计算。
技术研发人员:万波,刘民庆,
申请(专利权)人:湖北九同方微电子有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。