一种基于SMP的足球机器人超大点数FFT算法制造技术

技术编号：15301653 阅读：122 留言：0更新日期：2017-05-12 19:00

本发明专利技术提供了一种基于SMP的足球机器人超大点数FFT算法。本发明专利技术通过分析SMP并行处理系统架构特点，得出一种适用于SMP的超大点数FFT算法。该算法采取限定一维序列划分规则最大限度降低复数乘加运算量，并改变乘铰链因子方法减少了对存储资源的依赖，同时优化数据分布和存储访问来隐藏显性转置。实测结果表明，该算法适用于SMP平台，能够解决单核处理器较难实现超大点数FFT的问题，并在FFT存储资源利用和执行性能上均有明显提升。

A super large number of FFT algorithms for soccer robot based on SMP

The invention provides an ultra large number of FFT algorithms for soccer robots based on SMP. By analyzing the architecture characteristics of SMP parallel processing system, the invention obtains a super large number FFT algorithm suitable for SMP. This algorithm defines a one-dimensional sequence division rule to minimize the complex multiplication operation, and change the twiddle factor multiplication method reduces the dependence of storage resources, and optimize the data distribution and storage access to hidden dominant transpose. The experimental results show that the algorithm is suitable for SMP platform, and can solve the problem that single core processor is difficult to implement super large number of FFT, and has obvious improvement in FFT storage resource utilization and execution performance.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种适合SMP的超大点数快速傅里叶变换算法。
技术介绍
快速傅里叶变换(FFT)是足球机器人雷达成像信号处理的关键技术，FFT的执行效率直接影响成像系统的性能。近年来高分辨、大测绘带宽的SAR成像系统的快速发展，使得FFT计算点数较大幅度的增加，带来了FFT计算面临处理器资源有限和执行效率降低两大问题，直接影响了SAR成像系统的研制进度。现有FFT算法大都基于单核处理器进行研究，很少有文献涉及针对适用于对称多处理器(SymmetricMultiprocessor，SMP)的超大点数FFT算法研究。可以搜索到的有以下方法：1)SingLeton算法，通过对蝶形进行重排，保证了处理器对内存的顺序操作，从而提升了处理速度，但是该重排的蝶形结构无法适用于SMP系统。2)基于GPU分块的FFT算法，解决了图像容量较大引起的内存溢出问题，对于SAR成像中采用SMP计算FFT具有一定借鉴意义，但该算法很难移植到其它多核处理器平台。3)将一维大点数FFT拆分成二维行列小点数来处理，在有限的资源下，为实现更大点数的FFT提供了解决方法，且在大点数时对性能有很大提升，但是该方法基于单核处理器来设计，并没有涉及多核处理器并行优化的研究。随着FFT处理点数的增加，单核处理器的FFT算法不仅存在处理器资源受限的问题，而且其性能也很难满足现有应用系统对强实时性的要求。目前芯片技术的发展已经不能够适应摩尔定律和突破功率墙的限定，单核处理器性能已接近极限值，为了追求更高的处理性能，各芯片厂商采取在相同的面积上集成更多的处理器核。SMP汇集了一组处理器，它是应用十分广泛的并...
一种基于SMP的足球机器人超大点数FFT算法

【技术保护点】
一种基于SMP的足球机器人超大点数FFT算法，设SMP的核处理个数为Q，待处理的一维大点数序列的长度为L＝2n，其特征在于，所述算法包括以下步骤：步骤1、将一维大点数序列L拆分成M×N的二维矩阵，且行方向顺序存储在片外存储空间，M与N的值根据式(1)得到：步骤2、由SMP的主核读取片外存储空间中Q列M长度的数据到片内共享空间，并转置成列方向连续；步骤3、SMP的每个核分别计算一列M点FFT，FFT结果乘以铰链因子，其值Z(n0，k0)如式(2)所示，并将结果存储到片内共享空间，由SMP的主核原位写回片外存储空间：Z(n0,k0)=e-j2πn0k0L---(2)]]>式(2)中，n0＝0，1，…，M‑1，k0＝0，1，…，N‑1；步骤4、重复步骤1～步骤3，完成列FFT和乘铰链因子计算，铰链因子只存储第1行数据，其他行的铰链因子由第1行的铰链因子重复计算得出；步骤5、由SMP的主核读取片外存储空间中Q行N长度的数据到片内共享空间；步骤6、SMP每个核分别计算一行N点FFT，并将结果转置存储到片内共享空间，由SMP的主核按照列顺序写回片外存储空间；步骤7、重复步骤5～步骤6，完成行FFT计算，得到FFT计算结果。...

【技术特征摘要】
1.一种基于SMP的足球机器人超大点数FFT算法，设SMP的核处理个数为Q，待处理的一维大点数序列的长度为L＝2n，其特征在于，所述算法包括以下步骤：步骤1、将一维大点数序列L拆分成M×N的二维矩阵，且行方向顺序存储在片外存储空间，M与N的值根据式(1)得到：步骤2、由SMP的主核读取片外存储空间中Q列M长度的数据到片内共享空间，并转置成列方向连续；步骤3、SMP的每个核分别计算一列M点FFT，FFT结果乘以铰链因子，其值Z(n0，k0)如式(2)所示，并将结果存储到片内共享空间，由SMP的主核原位写回片外存储空...

【专利技术属性】
技术研发人员：孙以泽，钱炳锋，马西沛，汪烨，
申请(专利权)人：东华大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人