一种双精度浮点矩阵运算处理器及方法技术

技术编号：23763466 阅读：44 留言：0更新日期：2020-04-11 18:37

本发明专利技术公开的一种双精度浮点矩阵运算处理器，矩阵运算处理器包括控制单元接口单元、存储单元及浮点运算单元；控制单元根据运算模式进行选择，通过对浮点运算单元输入输出进行运算和存储控制；接口单元用于与嵌入式处理器交互，对嵌入式处理器发出指令进行响应并回馈状态，获取矩阵运算所需矩阵数据及放回矩阵运算结果至嵌入式处理器指定地址；存储单元包括若干个单口RAM，用于存储矩阵数据；浮点运算单元包括双精度浮点加法模块、双精度浮点乘法模块和双精度浮点倒数运算模块，用于进行矩阵数据运算；本发明专利技术采用并行双精度浮点运算提升矩阵运算速度；同时采用不同矩阵运算模式共享运算单元与存储单元，降低矩阵协处理面积与功耗。

A double precision floating point matrix operation processor and method

全部详细技术资料下载

【技术实现步骤摘要】
一种双精度浮点矩阵运算处理器及方法
本专利技术涉及矩阵运算的研究领域，特别涉及一种双精度浮点矩阵运算处理器及方法。
技术介绍
随着GPS、GLONASS、GALILEO与BDS的建设，导航接收机开始逐步由单系统单频点定位解算向多系统多频点融合解算发展，其中相关器的个数也由早期的十几个相关器通道提升至几百个，涉及信号处理与定位解算的矩阵运算维度与矩阵运算次数也在不断攀升。因此，如何降低处理器运算复杂度与运算量并快速实现多种矩阵运算，成为目前导航接收机尤其是高精度导航接收机需要解决的问题。现有技术中，矩阵运算采用外界提供的软件封装库或自己编写代码实现，在嵌入式处理器中运行，如DSP芯片、ARM芯片等。存在以下问题：在嵌入式处理器中完成矩阵运算，由于FPU数目有限运算速度低、处理器占用率高，可能导致接收到的卫星信号失锁、无法实时完成信号处理与定位解算。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足，提供一种双精度浮点矩阵运算处理器,只需嵌入式处理器在设置运算模式、矩阵维度与输入输出矩阵基地址等信息后，启动双精度浮点矩阵运算处理器，双精度浮点矩阵运算处理器将自行通过DMA方式传输输入矩阵数据进行运算，并将矩阵运算结果通过DMA方式返回嵌入式处理器，为嵌入式处理器节约了大量的双精度浮点运算时间，嵌入式处理器可将更多运算资源投入流程控制、资源调度，有效降低嵌入式处理器占用率高的问题，同时双精度浮点矩阵运算处理器采取多路双精度浮点运算模块方式进行运算加速，不受嵌入式处理器FPU数目...

【技术保护点】
1.一种双精度浮点矩阵运算处理器，其特征在于，所述矩阵运算处理器包括控制单元和分别与控制单元连接的接口单元、存储单元及浮点运算单元；/n所述控制单元根据运算模式进行选择，通过对浮点运算单元输入输出进行运算和存储的控制，完成不同矩阵运算；控制单元根据接口单元接收的指令，启动对应运算模式的控制模块，并连接浮点运算单元与存储单元的输入输出信号，在各运算控制模块内部，使用若干个多路选择器连接浮点运算单元与存储单元的输入输出端口，通过控制浮点运算单元与存储单元的输入输出数据与时序，实现不同的运算模式；/n所述接口单元用于与嵌入式处理器交互，对嵌入式处理器发出指令进行响应并回馈状态，获取矩阵运算所需矩阵数据及放回矩阵运算结果至嵌入式处理器指定地址；/n所述存储单元包括若干个单口RAM，用于存储矩阵数据；/n所述浮点运算单元包括双精度浮点加法模块、双精度浮点乘法模块和双精度浮点倒数运算模块，用于进行矩阵数据运算。/n

【技术特征摘要】
1.一种双精度浮点矩阵运算处理器，其特征在于，所述矩阵运算处理器包括控制单元和分别与控制单元连接的接口单元、存储单元及浮点运算单元；
所述控制单元根据运算模式进行选择，通过对浮点运算单元输入输出进行运算和存储的控制，完成不同矩阵运算；控制单元根据接口单元接收的指令，启动对应运算模式的控制模块，并连接浮点运算单元与存储单元的输入输出信号，在各运算控制模块内部，使用若干个多路选择器连接浮点运算单元与存储单元的输入输出端口，通过控制浮点运算单元与存储单元的输入输出数据与时序，实现不同的运算模式；
所述接口单元用于与嵌入式处理器交互，对嵌入式处理器发出指令进行响应并回馈状态，获取矩阵运算所需矩阵数据及放回矩阵运算结果至嵌入式处理器指定地址；
所述存储单元包括若干个单口RAM，用于存储矩阵数据；
所述浮点运算单元包括双精度浮点加法模块、双精度浮点乘法模块和双精度浮点倒数运算模块，用于进行矩阵数据运算。

2.根据权利要求1所述的一种双精度浮点矩阵运算处理器，其特征在于，所述控制器的运算模式包括矩阵乘法运算模式、矩阵分解运算模式、矩阵求逆运算模式。

3.根据权利要求1所述的一种双精度浮点矩阵运算处理器，其特征在于，所述接口单元通过DMA方式获取矩阵运算所需要的输入数据。

4.根据权利要求1所述的一种双精度浮点矩阵运算处理器，其特征在于，所述存储单元由M个存储深度为K，数据位宽为64bit的单口RAM组成。

5.根据权利要求4所述的一种双精度浮点矩阵运算处理器，其特征在于，所述RAM个数M根据并行度的提升而提升；所述存储深度K根据支持矩阵运算维度可扩展。

6.根据权利要求1所述的一种双精度浮点矩阵运算处理器，其特征在于，所述浮点运算单元包括L个双精度浮点加法模块、N个双精度浮点乘法模块和P个双精度浮点倒数运算模块。

...

【专利技术属性】
技术研发人员：邹四，
申请(专利权)人：广州海格通信集团股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人