一种规模可扩展的矩阵求逆方法和装置制造方法及图纸

技术编号：38431876 阅读：14 留言：0更新日期：2023-08-11 14:19

本发明专利技术公开了一种规模可扩展的矩阵求逆方法和装置，该方法采用LU分解(L代表上三角矩阵，U代表下三角矩阵)算法进行矩阵求逆。主要包括数据输入、矩阵初始化与LU分解、存储LU分解结果、线性方程组求解、逆矩阵计算与存储以及输出逆矩阵结果等阶段。该装置用于执行该方法。本发明专利技术通过适配矩阵求逆的阶数可配置性，设计了硬件数据结构，优化了迭代求解过程，并实现了分解结果数据存储，从而提高了矩阵求逆的效率和灵活性，适用于各种大小的矩阵求逆运算场景。算场景。算场景。

全部详细技术资料下载

【技术实现步骤摘要】
一种规模可扩展的矩阵求逆方法和装置

[0001]本专利技术涉及一种规模可扩展的矩阵求逆方法和装置。

技术介绍

[0002]矩阵求逆是计算机科学中重要的研究问题之一，应用广泛，例如信号处理、图像处理、通信系统等领域。在实际应用中，矩阵的大小及其精度需求往往是多样化的，因此，如何实现矩阵求逆的高效率、可配置性和精度控制成为了研究的难点之一。特别是对于基于深度神经网络的三维重建技术，其网络包含了矩阵求逆步骤，该步骤在计算场景中通常由中央处理器完成，缺乏并行处理，导致速度处理较慢，使矩阵求逆成为整个三维重建流程的瓶颈之一。
[0003]FPGA作为一种可编程逻辑器件，其硬件资源和并行计算能力使得它在矩阵计算中具有很大的优势。同时LU分解法因为其稳定性和高效性被广泛应用。因此，将LU分解算法应用于FPGA上实现矩阵求逆是一种具有实际意义的研究方向。但在硬件设计当中，并行度的调整灵活度较低，面对多变的矩阵规模，常规硬件设计会导致硬件利用率低、重新设计硬件工程量大等问题。

技术实现思路

[0004]专利技术目的：本专利技术旨在通过Chisel(Constructing Hardware In a Scala Embedded Language,基于Scala嵌入式语言构建硬件，其中Scala是一门多范式编程语言)语言构建可修改定点计算位宽以及可配置矩阵阶数的矩阵求逆模块，以满足不同应用场景下对高性能矩阵求逆计算的需求。特别是对于基于深度神经网络的三维重建技术其中的矩阵求逆计算步骤。
[0005]本专...

【技术保护点】

【技术特征摘要】
1.一种用于规模可扩展的矩阵求逆方法，其特征在于，对待处理的矩阵进行并行LU(上下三角矩阵)分解，获得L(上三角)矩阵，U(下三角)矩阵和P(换行信息)向量；对所述L矩阵，U矩阵，P向量进行存储；对所述LU矩阵进行并行的正向与反向迭代线性方程组求解；对求解之后的矩阵，根据P向量进行顺序的调整；对顺序调整后的矩阵，按列顺序存入最终逆矩阵结果存储模块。2.根据权利要求1所述的矩阵LU分解方法，其特征在于，基于并行设计的高斯消元迭代实现LU分解，所述实现方法包括：采用Chisel(ConstructingHardwareInaScalaEmbeddedLanguage,基于Scala嵌入式语言构建硬件)模块中的Bundle(打包，一种Chisel数据结构形式)类数据结构集成模块的输入输出端口；配置数据流动及搭建硬件逻辑运算方式以完成算法的功能需求；同时保证硬件迭代更新过程中矩阵运算中间结果的正确覆盖与缓存；所述LU分解的并行层级与矩阵阶数N相同。3.根据权利要求2所述的一种数据结构，其特征在于，通过模块内部例化的计数器实现输入行数的记录及状态跳转，以便于矩阵初始化、迭代求解和存储子步骤的执行。4.根据权利要求1所述的一种用于线性方程组求解的模块，其特征在于，设计正向与反向迭代求解模块，...

【专利技术属性】
技术研发人员：王中风，施禹伯，
申请(专利权)人：南京风兴科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人