一种基于LU分解算法的矩阵求逆SoC处理系统及方法技术方案

技术编号:41527681 阅读:21 留言:0更新日期:2024-06-03 23:02
本发明专利技术涉及计算机体系结构技术领域,公开了一种基于LU分解算法的矩阵求逆SoC处理系统及方法,包括:RISC‑V处理器,用于接收矩阵数据和采用LU分解算法生成矩阵求逆指令,并将矩阵数据和矩阵求逆指令传输给矩阵求逆加速协处理器;矩阵求逆加速协处理器,用于根据RISC‑V处理器传输的矩阵求逆指令读取自设计超长指令,根据自设计超长指令配置、调度计算资源用于处理矩阵数据;本发明专利技术所提出的一种基于LU分解算法的矩阵求逆SoC处理系统及方法,利用LU分解算法步骤的相似性,将计算公式提炼为同一种超长指令格式,同时利用矩阵求逆加速协处理器协助加速矩阵的求逆计算,提高了计算效率,减少使用通用处理器计算矩阵求逆时消耗的周期数,同时简化了计算单元的电路结构。

【技术实现步骤摘要】

本专利技术涉及计算机体系结构,具体涉及一种基于lu分解算法的矩阵求逆soc处理系统及方法。


技术介绍

1、矩阵求逆是一种基本的数学工具,在无线通信、电力系统、网络等不同的科学和工程应用中发挥着关键作用,但在硬件平台上执行矩阵求逆会消耗大量宝贵的运算资源,且在数值计算过程中稳定性较差。尽管研究人员经常修改应用中的算法或寻找新的方法来避免矩阵求逆,但在某些情况下,人们仍然无法绕过在硬件平台上执行矩阵求逆的问题。

2、目前,硬件设计领域主要研究和实现的是基于矩阵分解的矩阵求逆算法,包括qr分解、cholesky分解和lu分解。现有方法在rasp架构中实现矩阵求逆模块的硬件电路设计,可根据主处理器发送的配置信息对各个rpe内部或rpe之间进行重构,以完成不同类型的运算。但是,每个rpe内部包含较多运算单元,在低阶矩阵求逆场景下会产生资源浪费,同时指令设计复杂,配置信息的存储需要额外存储空间。现有方法在fpga平台上实现基于ldl分解算法的矩阵求逆硬件电路设计,通过对储存数据的合理划分,在矩阵分解步骤实现乘法的复用,降低了硬件资源的消耗。但是,在矩阵求逆本文档来自技高网...

【技术保护点】

1.一种基于LU分解算法的矩阵求逆SoC处理系统,其特征在于,包括:

2.根据权利要求1所述的一种基于LU分解算法的矩阵求逆SoC处理系统,其特征在于,矩阵求逆加速协处理器包括控制模块、执行模块以及储载模块;

3.根据权利要求2所述的一种基于LU分解算法的矩阵求逆SoC处理系统,其特征在于,控制模块包括译码单元与状态机单元;

4.根据权利要求2所述的一种基于LU分解算法的矩阵求逆SoC处理系统,其特征在于,执行模块包括指令只读储存器、调度单元、计算单元以及寄存器组;

5.根据权利要求4所述的一种基于LU分解算法的矩阵求逆SoC处理系统,其特...

【技术特征摘要】

1.一种基于lu分解算法的矩阵求逆soc处理系统,其特征在于,包括:

2.根据权利要求1所述的一种基于lu分解算法的矩阵求逆soc处理系统,其特征在于,矩阵求逆加速协处理器包括控制模块、执行模块以及储载模块;

3.根据权利要求2所述的一种基于lu分解算法的矩阵求逆soc处理系统,其特征在于,控制模块包括译码单元与状态机单元;

4.根据权利要求2所述的一种基于lu分解算法的矩阵求逆soc处理系统,其特征在于,执行模块包括指令只读储存器、调度单元、计算单元以及寄存器组;

5.根据权利要求4所述的一种基于lu分解算法的矩阵求逆soc处理系统,其特征在于,储载模块包括载入单元与储存单元;

6.根据权利要求1-5所述的一种基于l...

【专利技术属性】
技术研发人员:阎波马千里邓宇志陈宇史超凡
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1