一种定制阵列计算结构上复杂线性代数运算的实现方法技术

技术编号:28036007 阅读:32 留言:0更新日期:2021-04-09 23:18
本发明专利技术公开一种定制阵列计算结构上复杂线性代数运算的实现方法,包括以下步骤:步骤1:根据线性代数运算的类型,对输入矩阵A,B,C进行分块,分块粒度为

【技术实现步骤摘要】
一种定制阵列计算结构上复杂线性代数运算的实现方法
本专利技术涉及一种定制阵列计算结构上复杂线性代数运算的实现方法,属于计算机

技术介绍
BLAS库(BasicLinearAlgebraSubprograms,基本线性代数子程序库)是高性能计算领域最基本和最重要的软件库。实现BLAS库所定义的level-3运算或复杂线性代数运算在定制计算结构上的高效执行,对科学与工程仿真应用的计算加速至关重要。由于复杂线性代数运算均可转换为以矩阵乘为计算核心的运算,定制计算结构上矩阵乘的高效实现已有相关研究。以线性代数核心LAC(LinearAlgebraCore)为目标计算平台,Pedram等人研究了复杂线性代数运算至LAC结构的映射。由64个双精度浮点运算单元组成的LAC结构上,矩阵乘、三角线性方程组求解、矩阵秩-K更新等运算均获得了较高的计算效率。然而,当前针对定制计算结构实现的复杂线性代数运算,其运算规模较小,同时运算的类型有限。
技术实现思路
本专利技术的目的是提供一种定制阵列计算结构上复杂线性代数运算的实现方法,该方法可本文档来自技高网...

【技术保护点】
1.一种定制阵列计算结构上复杂线性代数运算的实现方法,其特征在于,包括以下步骤:/n步骤1:根据线性代数运算的类型,对输入矩阵A,B,C进行分块,分块粒度为

【技术特征摘要】
1.一种定制阵列计算结构上复杂线性代数运算的实现方法,其特征在于,包括以下步骤:
步骤1:根据线性代数运算的类型,对输入矩阵A,B,C进行分块,分块粒度为nb;
步骤2:将输入矩阵分解为多个小规模矩阵和剩余矩阵,从而将原线性代数运算分解为小规模矩阵的线性代数运算和若干个矩阵乘运算;
...

【专利技术属性】
技术研发人员:贾迅原昊钱磊张昆陆一峰朱剑文曾明勇
申请(专利权)人:无锡江南计算技术研究所
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1