一种基于向量处理器的QR分解后的向量乘法实现方法技术

技术编号:36852664 阅读:24 留言:0更新日期:2023-03-15 17:26
本发明专利技术涉及一种基于向量处理器的QR分解后的向量乘法实现方法,所针对的QR分解算法为VSIP库函数中的vsip_cqrd_f函数,VSIP库是GE智能平台推出的向量、信号和图像处理库,是专为需要使用强化型信号和图像处理的开发人员而提供的开放标准应用程序编程接口。本发明专利技术的技术方案主要包括如下步骤:步骤一、输入矩阵C;步骤二、对A矩阵进行预处理,运算得到向量;步骤三、根据数量大小采取不同处理方案,实现向量与向量的乘法运算,当数据量极小时,将直接在DDR内通过标量处理,当数据量未超过cache尺寸,将矩阵C与向量V通过DMA传输传入cache中进行乘法运算,当数据量超过cache尺寸时,采用传输和计算并行方式进行乘法运算;步骤四、向量cI与矩阵的每行做乘法运算,根据数量大小采取不同处理方案,更新输出矩阵。本发明专利技术针对向量处理器拥有较大存储空间、片内高速缓存、丰富指令集以及高效快捷的数据传输的优点,设计并实现了针对QR分解后的向量乘法,在进行相关运算中发挥出较大的优势。在进行相关运算中发挥出较大的优势。在进行相关运算中发挥出较大的优势。

【技术实现步骤摘要】
一种基于向量处理器的QR分解后的向量乘法实现方法


[0001]本专利技术涉及高性能数字信号处理器(Digital Signal Processor,DSP)芯片代码优化,更加具体的,涉及一种基于向量处理器的QR分解后的向量乘法实现方法。

技术介绍

[0002]VSIP库是GE智能平台推出的向量、信号和图像处理库,是专为需要使用强化型信号和图像处理的开发人员而提供的开放标准应用程序编程接口,若直接调用VSIP库中的原函数,则丧失了向量处理器优秀的硬件性能,想要发挥出高性能处理器的硬件优势,提高算法的并行性与效率,将VSIP库中的算法优化后适配不同的高性能处理器,是一种不错的选择。
[0003]在现代处理器中,拥有向量处理单元的VLIW体系结构日渐成为了高性能数字信号处理器的典型结构,国产高性能DSP发展迅速,出现了许多由不同公司生产的高性能处理器,这些处理器通常具有寄存器资源丰富,执行单元多的特点。向量处理器一般由多个处理单元组成,支持基于向量的数据加载、运算和存储。每个处理单元包含多个独立的多功能部件,一般包括加法部件、乘法部件、移位部本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于向量处理器的QR分解后的向量乘法实现方法,其特征在于:包括以下步骤,步骤1,判断输入矩阵C是否进行了转置共轭以及矩阵C在矩阵乘法的左边还是右边,以便进入不同的子函数处理;各子函数处理方式大同小异,本方案主要叙述共同的处理方法;步骤2,对A矩阵进行预处理,将A矩阵对角线上元素置1,对角线右上部分元素置0,对角线左下部分元素不变;变换后,将A矩阵按列分块,按次序把每一列分别命名为向量、 ,例如:向量包含矩阵A第1列的值,各分量的值命名为、,取矩阵C与向量做矩阵乘法运算,结果与beta向量第一个值相乘,得到向量;步骤3,向量与向量的转置做乘法运算得到矩阵,与矩阵做加法运算得到;通过DMA传输将矩阵C与向量V传入cache中,向量存储在DDR中,通过标量向量转换部件SVW将向量的第一个值复制并广播到向量运算部件中,向量与矩阵C每一行各取P个数传入向量运算部件中,同时执行P条乘法指令,乘法结果保存在向量运算部件中,与矩阵C第一行前P个数做加法运算,同时执行P条加法指令,将结果存入cache中覆盖矩阵C第一行对应的数据,再取第P+1~2P个数据,进行同样计算,直至更新完矩阵C的一行;接着进行第二行计算,直至所有行计算完成,将结果命名为矩阵;步骤4,向量cI与矩阵的每行做乘法运算,乘法运算方式和步骤3类似,此处不重复叙述;把更新n次的矩阵称为,重复n(n为矩阵C的列数)次步骤2(对A矩阵预处理不重复)与步骤3后,将cI向量通过DMA传输传入cache中,覆盖在原向量V的位置,矩阵存放在cache中,向量cI与矩阵C每一行各取P个数传入向量运算部件中,同时执行P条乘法指令,将乘法结果传回cache中,覆盖在矩阵第一行对应位置上,再取第P+1~2P个数据,进行同样计算,直至更新完矩阵的第一行;接着进行第二行计算,直至所有行计算完成,将结果命名为矩阵;所述步骤3的具体方式包括如下步骤,步骤3.1,根据原始数据大小判断下一步处理方案,当原始数据极小时,进入步骤3.2,当原始数据大小未超过cache尺寸时,进入步骤3.3,当原始数据大小超过cache尺寸时,进入步骤3.4;步骤3.2,当数据量极小时,将直接在DDR内通过标量处理;步骤3.3,当数据量未超过cache尺寸,将矩阵C与向量V通过DMA传输传入cache中,向量存储在DDR中,通过标量向量转换部件SVW将向量的第一个值复制并广播到向量运算部件中,向...

【专利技术属性】
技术研发人员:莫尚丰袁钰迪胡勇华
申请(专利权)人:湖南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1