【技术实现步骤摘要】
大规模矩阵QR分解并行计算结构
本专利技术涉及数字信号处理领域大规模阵列天线信号处理技术,尤其是大规模并行处理器在数值计算领域高性能并行计算大规模多核处理器集群并行结构QR分解方法。
技术介绍
在数字信号处理领域,大规模阵列天线信号处理、大规模多输入多输出(MIMO)技术等信号处理算法常涉及协方差矩阵求逆、信道矩阵估计、信道均衡等问题,QR分解在这些方面有着广泛应用。其中,MIMO是无线网络演进的标准。事实上,MIMO技术已经成为许多无线通信标准,如IEEE802.11n、3GPP-LTE等标准中最为关键的技术之一。设计出高效并且关键的QR分解运算单元可以使MIMO系统实现的复杂度降低,从而获得良好的计算性能。协方差矩阵求逆算法是一种最常用的空域干扰抑制算法。但是当干扰功率过大时,采样协方差矩阵为奇异矩阵,矩阵求逆引理失效,从而无法有效生成干扰抑制权值。由于QR分解可以有效改善矩阵条件数,提高数值稳定性,因此利用QR分解算法对采样协方差矩阵求逆可以有效的避免因干扰功率过强而无法获得有效的干扰抑制权值的情况。因此QR分解的计算 ...
【技术保护点】
1.一种大规模矩阵QR分解并行计算结构,包括:大规模并行计算平台上实现大规模矩阵QR并行分解的多处理器节点间并行、单处理器多核间并行和单核多数据并行三级并行结构,具有二叉树结构特点的第一层并行结构属于三层并行结构中的顶层架构,第二层并行架构属于三级并行结构中的中层架构,第三层并行架构属于三级并行结构中的底层架构,其特征在于:在采用多核处理器芯片构建具有大规模并行计算能力的处理器集群系统和QR分解并行计算结构中,顶层架构利用多核处理器集群特点,将待分解矩阵分割成多个数据分片,通过多核处理器节点间互联的通信网络分发到第一级各并行节点,第一级各节点并行地完成相应QR分解任务后通过 ...
【技术特征摘要】
1.一种大规模矩阵QR分解并行计算结构,包括:大规模并行计算平台上实现大规模矩阵QR并行分解的多处理器节点间并行、单处理器多核间并行和单核多数据并行三级并行结构,具有二叉树结构特点的第一层并行结构属于三层并行结构中的顶层架构,第二层并行架构属于三级并行结构中的中层架构,第三层并行架构属于三级并行结构中的底层架构,其特征在于:在采用多核处理器芯片构建具有大规模并行计算能力的处理器集群系统和QR分解并行计算结构中,顶层架构利用多核处理器集群特点,将待分解矩阵分割成多个数据分片,通过多核处理器节点间互联的通信网络分发到第一级各并行节点,第一级各节点并行地完成相应QR分解任务后通过网络发送上三角矩阵R到第二级节点,第二级节点完成R矩阵合并和QR分解后通过网络发送R矩阵到第三级节点,以此类推,各级节点根据二叉树完整结构依次逐级执行,同级节点并行执行,以此完成多处理器芯片节点间并行的计算流图;中层架构根据处理器节点输入的矩阵规模和处理器核心数量进行矩阵分块,每个分块矩阵均为统一矩阵规模的方阵,整个运算过程沿着对角子阵逐层进行,单层的子阵QR分解和矩阵数据更新操作由处理器片内的多核并行执行,底层架构利用具备单指令多数据操作SIMD的处理器指令集进行多数据并行的矢量计算,完成单核的QR分解或乘法操作;多核处理器集群采用逐层分解的方法,从多处理器芯片节点间并行、单处理器芯片多核间并行和单核多数据并行三级并行结构,实现大规模矩阵的QR并行分解。
2.如权利要求1所述的一种大规模矩阵QR分解并行计算结构,其特征在于:在大规模并行计算平台上至少设有8片多核处理器芯片,大小为至少行16N和列N的输入待分解矩阵A,输入待分解矩阵A的子阵分割可根据上述平台提供的最大并行度能力灵活裁剪,按列分割为多个大小为行2N和列N子矩阵块Ai,8片多核处理器芯片最大可分割为A1~A8个矩阵块,待分解矩阵A顶层架构,按二叉树8-4-2-1架构的结构进行级联,顶层并行架构以典型二叉树架构,完成处理器芯片节点间并行,并按至少17个处理器节点,最大每级8个多核处理器节点可同时并行执行,利用8-4-2-1架构构造至少四级流水线。
3.如权利要求3所述的一种大规模矩阵QR分解并行计算结构,其特征在于:按层递进方向,第一级流水线对8个处理器节点同时并行处理,节点1执行A1的QR分解,节点2执行A2的QR分解,节点i执行Ai的QR分解,每个节点Ai执行时间相同;第二级流水线对第一级流水线输出的矩阵大小为N*N的上三角矩阵R1,i进行两两数据合并,合并后新矩阵大小为2N*N;第三级流水线对第二级输出的矩阵大小为N*N的上三角矩阵R2,i进行两两数据合并,合并后新矩阵大小为2N*N;第四级流水线对第三级流水线输出的结果上矩阵大小为N*N的三角矩阵R3,i进行两两数据合并,合并后新矩阵大小为2N*N。
4.如权利要求5所述的一种大规模矩阵QR分解并行计算结构,其特征在于:第二级流水线单节点操作执行数据合并和QR分解;第三级流水线单节点操作执行数据合并和QR分解,第四级流水线1个处理器节点对新矩阵进行QR分解,输出结果即为QR分解的上三角R矩阵。
5.如权利要求1所述的一种大规模矩阵QR分解并行计算结构,其特征在于:中间层并行架构对行2N,列N子矩阵块进行QR分解,按层递进方向...
【专利技术属性】
技术研发人员:吴明钦,刘红伟,潘灵,贾明权,郝黎宏,林勤,张昊,
申请(专利权)人:西南电子技术研究所中国电子科技集团公司第十研究所,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。