面向向量处理器的浮点复数块FIR的向量化实现方法技术

技术编号：6806095 阅读：273 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种面向向量处理器的浮点复数块FIR的向量化实现方法，包括以下步骤：(1)输入向量数据x，系数数据h；将向量数据x的虚部和实部分别连续存放，将系数数据h的虚部和实部分别连续存放；向量处理器包括p个处理单元；(2)将向量数据x的实部和虚部、系数数据h的实部和虚部并行加载到向量处理器的同一个处理单元的不同局部寄存器中；(3)p个处理单元中的每个处理单元在本单元内执行向量数据x和系数数据h的复数乘法并将乘法的结果进行累加；(4)p个处理单元的计算完成，输出p个结果。本发明专利技术具有原理简单、操作方便、能够高效计算并能缩短整个算法的运算时间、能提高处理器计算资源使用效率等优点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及FIR滤波器向量化领域，特指一种浮点复数块FIR向量化实现方法。
技术介绍
随着4G无线通信、雷达信号处理、高清视频和数字图像处理等计算密集型应用的计算需求越来越高，单芯片难以满足应用需求，多核处理器尤其是其中的向量处理器得到了广泛的应用。如图1所示，是向量处理器的一般结构示意图，向量处理器一般由P个处理单元(PE)组成，通常支持基于向量的数据加载和存储。每个PE包含独立的多个功能部件，一般包括移位部件(BP)、算术部件(ALU)、乘法部件(MUL)等，每个PE包行一组局部寄存器，所有PE的同一编号的局部寄存器在逻辑上又组成一个向量寄存器。例如图1所示 PEO-PV1的RO寄存器在逻辑上组成了向量寄存器VR0，每个PE所对应的RO称为向量寄存器的一个元素。向量处理器采用SIMD的方式，在同一条向量指令的控制下，ρ个PE同时对各自的局部寄存器进行相同操作，用以开发应用程序的数据级并行性。每个PE对应多个存储体(bankO，bankl, bank2, bank3)，数据映射到不同的存储体能够避免存储冲突。向量处理器包含大量功能单元，适合处理包含大量高密集运算的任务，如矩阵分解、FFT运算、HR(Finite Impulse Response)滤波运算等。然而，很多高密集运算的任务由于算法本身的特性，向量化处理困难，如何将这些算法高效的映射到向量处理器，即这些算法的向量化方法，是提高向量处理器使用效率的关键。例如，浮点复数块FIR的向量化，浮点复数的实部与虚部都是32位，如果按照通常的实部与虚部相间隔的方法放置数据，那么，一个复数的实部与虚部...

【技术保护点】
１．一种面向向量处理器的浮点复数块ＦＩＲ的向量化实现方法，其特征在于包括以下步骤：（１）输入向量数据ｘ、系数数据ｈ；将所述向量数据ｘ的虚部和实部分别连续存放，将所述系数数据ｈ的虚部和实部分别连续存放；所述向量处理器包括ｐ个处理单元；（２）将向量数据ｘ的实部和虚部、系数数据ｈ的实部和虚部并行加载到向量处理器的同一个处理单元的不同局部寄存器中；（３）所述ｐ个处理单元中的每个处理单元在本单元内执行向量数据ｘ和系数数据ｈ的复数乘法并将乘法的结果进行累加；（４）ｐ个处理单元的计算完成，输出ｐ个结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：刘仲，陈书明，郭阳，陈跃跃，陈海燕，龚国辉，万江华，孙海燕，阳柳，陈胜刚，
申请(专利权)人：中国人民解放军国防科学技术大学，
类型：发明
国别省市：43

全部详细技术资料下载我是这个专利的主人