当前位置: 首页 > 专利查询>安徽大学专利>正文

一种矩阵制造技术

技术编号:39579508 阅读:9 留言:0更新日期:2023-12-03 19:30
本发明专利技术涉及信号处理,具体涉及一种矩阵

【技术实现步骤摘要】
一种矩阵Cholesky分解协处理器及其系统


[0001]本专利技术涉及信号处理,具体涉及一种矩阵
Cholesky
分解协处理器及其系统


技术介绍

[0002]随着信号处理技术的快速发展,矩阵运算在信号处理领域中的地位越来越重要

矩阵的乔列斯基分解
(Cholesky
分解
)
是一种常用的矩阵运算,它将一个正定对称矩阵分解为一个下三角矩阵和其转置的乘积

这种分解方法在各种领域都有广泛应用,比如在信号处理

运动控制

图像处理等领域

它使得许多复杂的数学问题能够通过分解后的矩阵进行简化处理,从而在很大程度上提升了计算的效率和精度

此外,由于分解后的矩阵具有较好的数学性质,因此
Cholesky
分解也常常被用于优化问题的求解,从而对人们的生活和工作产生了深远影响

[0003]在现有的计算机系统中,矩阵的
Cholesky
分解通常是通过软件实现的

当需要对一个矩阵进行
Cholesky
分解时,将原始矩阵分成大小相等的块矩阵,每个块矩阵都是一个子矩阵

然后,通过递归地应用
Cholesky
分解来计算每个子矩阵的
Cholesky
分解,充分利用计算机系统的并行性和矩阵的块结构,以提高计算效率

[0004]尽管现有的软件实现方法在许多情况下都能够满足需求,但是在对实时性和功耗有着严格要求的嵌入式系统应用中,这种方法的性能显然是不足的

由于需要执行大量的软件指令,现有的软件实现方法不仅会导致计算延迟,还会导致系统功耗的提高


技术实现思路

[0005]为解决上述问题,本专利技术提供一种矩阵
Cholesky
分解协处理器及其系统,
[0006]该矩阵
Cholesky
分解协处理器,将正定对称矩阵
A
分解为下三角矩阵
L

L
的倒置矩阵的乘积,包括:
[0007]加法器

除法器

乘法器

开方器

输入暂存区

输出暂存区

数据混合器

多路选择器

临时值存储模块;
[0008]所述加法器用于执行加法运算;所述除法器用于执行除法运算;所述乘法器用于执行乘法运算;所述开方器用于执行开方运算;
[0009]所述输入暂存区用于存储正定对称矩阵
A
;所述输出暂存区用于存储下三角矩阵
L

[0010]所述数据混合器将来自不同数据源的数据进行混合处理;
[0011]所述多路选择器根据控制信号选择一个数据源进行输出;
[0012]所述临时值存储模块用于存储临时数据及计算中间结果

[0013]进一步的,所述临时值存储模块包括先进先出队列及随机存取存储器

[0014]本专利技术提供的矩阵
Cholesky
分解系统,包括:
[0015]主处理器,用于执行计算和控制任务,并管理协处理器;
[0016]如上述矩阵
Cholesky
分解协处理器,用于接收来自主处理器的指令,执行正定对
称矩阵的分解计算;
[0017]协处理器接口,提供所述主处理器与所述矩阵
Cholesky
分解协处理器的通信路径;
[0018]扩展指令接口,用于解析和处理来自主处理器的特殊指令

[0019]进一步的,所述矩阵
Cholesky
分解协处理器中各模块输入输出数据均采用
IEEE

754
标准的单精度浮点类型

[0020]进一步的,所述主处理器判断一个指令为矩阵
Cholesky
分解协处理器指令时,所述主处理器通过所述扩展指令接口请求通道对矩阵
Cholesky
分解协处理器发起请求,同时通过扩展指令接口将源操作数送至矩阵
Cholesky
分解协处理器;
[0021]所述矩阵
Cholesky
分解协处理器接收到源操作数时,判断扩展指令接口握手成功是否成功,若成功,则开始矩阵分解运算,并将运算结果通过扩展指令接口反馈通道返回所述主处理器

[0022]进一步的,定义矩阵
Cholesky
分解任务中开方运算为任务1,任务1仅使用所述开方器;
[0023]定义矩阵
Cholesky
分解任务中求下三角矩阵
L
当前列计算为任务2,任务2仅使用所述除法器;
[0024]定义矩阵
Cholesky
分解任务中更新正定对称矩阵
A
为任务3,任务3仅使用所述减法器和所述乘法器;
[0025]定义正定对称矩阵
A
的阶数为
K
,对三角矩阵
L

k
列的计算由任务
1、
任务2和任务3组成,定义为第
k
列的分解任务组,分解任务组中任务1和任务2计算三角矩阵
L

k
列的元素,任务3更新正定对称矩阵
A
的第
k+1
至第
K
列元素,
k∈[1,K];每个分解任务组中任务
1、
任务2和任务3顺序执行;当
k>1
时,第
k
列的任务1的执行需要等到第
k
‑1列的任务3对正定对称矩阵
A
的第
k
列元素的更新结束;当
k>2
时,第
k
列的任务1的执行需要等到第
k
‑2列的任务3执行结束

[0026]进一步的,矩阵
Cholesky
分解任务包括以下状态:
[0027]C_IDLE
:空闲状态,此状态下未执行任何矩阵
Cholesky
分解任务;
[0028]C_SQRT_START
:开方开始状态,在此状态开方器被使能;
[0029]C_DIV_START
:除法开始状态,在此状态下使能列除法运算;
[0030]C_CAL
:模块运算状态,在此状态下表示至少正在进行一次开方

除法或者矩阵更新运算;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种矩阵
Cholesky
分解协处理器,将正定对称矩阵
a
分解为下三角矩阵
L

L
的倒置矩阵的乘积,包括:加法器

除法器

乘法器

开方器

输入暂存区

输出暂存区

数据混合器

多路选择器

临时值存储模块;所述加法器用于执行加法运算;所述除法器用于执行除法运算;所述乘法器用于执行乘法运算;所述开方器用于执行开方运算;所述输入暂存区用于存储正定对称矩阵
A
;所述输出暂存区用于存储下三角矩阵
L
;所述数据混合器将来自不同数据源的数据进行混合处理;所述多路选择器根据控制信号选择一个数据源进行输出;所述临时值存储模块用于存储临时数据及计算中间结果
。2.
根据权利要求所述一种矩阵
Cholesky
分解协处理器,其特征在于,所述临时值存储模块包括先进先出队列及随机存取存储器
。3.
一种矩阵
Cholesky
分解系统,包括:主处理器,用于执行计算和控制任务,并管理协处理器;如权利要求1或2所述矩阵
Cholesky
分解协处理器,用于接收来自主处理器的指令,执行正定对称矩阵的分解计算;协处理器接口,提供所述主处理器与所述矩阵
Cholesky
分解协处理器的通信路径;扩展指令接口,用于解析和处理来自主处理器的特殊指令
。4.
根据权利要求3所述一种矩阵
Cholesky
分解系统,其特征在于,所述矩阵
Cholesky
分解协处理器中各模块输入输出数据均采用
IEEE

754
标准的单精度浮点类型
。5.
根据权利要求3所述一种矩阵
Cholesky
分解系统,其特征在于,所述主处理器判断一个指令为矩阵
Cholesky
分解协处理器指令时,所述主处理器通过所述扩展指令接口请求通道对矩阵
Cholesky
分解协处理器发起请求,同时通过扩展指令接口将源操作数送至矩阵
Cholesky
分解协处理器;所述矩阵
Cholesky
分解协处理器接收到源操作数时,判断扩展指令接口握手成功是否成功,若成功,则开始矩阵分解运算,并将运算结果通过扩展指令接口反馈通道返回所述主处理器
。6.
根据权利要求3所述一种矩阵
Cholesky
分解系统,其特征在于,定义矩阵
Cholesky
分解任务中开方运算为任务1,任务1仅使用所述开方器;定义矩阵
Cholesky
分解任务中求下三角矩阵
L
当前列计算为任务2,任务2仅使用所述除法器;定义矩阵
Cholesky
分解任务中更新正定对称矩阵
A
为任务3,任务3仅使用所述减法器和所述乘法器;定义正定对称矩阵
A
的阶数为
K
,对三角矩阵
L

k
列的计算由任务
1、
任务2和任务3组成,定义为第
k
列的分解任务组,分解任务组中任务1和任务2计算三...

【专利技术属性】
技术研发人员:洪琪柳天琪唐国鹏尹志豪闫子豪张慧珊陈一诺邵宇鹏阎瑞珅董泓宇许耀华郭小辉
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1