【技术实现步骤摘要】
本专利技术属于计算机处理器设计
,特别涉及一种支持快速傅里叶变换运算的方法。
技术介绍
= k = 0 , 1 ,■ ^^ 2冗 2 『w = ew = cos(-) — sin(-),w 、 # 、 #:c() = /餅[Z则=:ZX,Z nN-l,…- O,l,...,N-l(公式l)其中,W/k为旋转因子。从公式1可知,直接计算N个样本点的DFT需要0(N2)次对于公式1,若N二2M,M为正整数。可以将x(n)按奇、偶分成两组,对于偶数可表 :2r,奇数可以表示为n二2r+l,1^0, 1,…,|-1 ,于是可以将DFT化为h eve w otic/W/2—l W/2—lW/2-l W/2-l=J>々)(^ + ^ |>2(攀,(公式2)由于旋转因子WNnk具有公式3所显示的可约性,可以将公式2转换为公式4t『/=^;^ ,Fr^f=『wl,(公式3)W/2-1 W/2—1义W = X,- +『力|>2(0</2 (公式4)/■=0 /■=() _ . 2;r式中,, 一 p一,(W/2)—-户4,/WW/2-l W/2-1 AA令雄)=£> 2= J>(2,F,,k=o, 1,…,^ —1(公式5)r=0 /=0 25(= J>2(^/2= J>(21FT k=0, 1,…,1(公式6)!■=(> o , 25 那么 <formula>formula see original document page 6</formula> 由此可以将一个N点DFT分成两个N/ ...
【技术保护点】
一种包含四条指令的支持快速傅里叶变换运算的方法,其特征在于包括: 第一组合指令步骤(21)和第二指令组合步骤(22),所述第一组合指令步骤(21)和第二指令组合步骤(22)分别包括两条先后执行的指令步骤,每条所述指令步骤均包括有操作数定义、寄存器内数据的运算关系和存储顺序;每条组合指令步骤中的前一条指令步骤的操作结果为后一条指令步骤的源操作数,执行一次两条指令组合步骤完成快速傅里叶变换的一级蝶形运算,之后将一级碟形运算的输出寄存器折叠,使用同样的该两条组合指令步骤进行下一级的蝶形运算,直到快速傅里叶变换运算结束。
【技术特征摘要】
一种包含四条指令的支持快速傅里叶变换运算的方法,其特征在于包括第一组合指令步骤(21)和第二指令组合步骤(22),所述第一组合指令步骤(21)和第二指令组合步骤(22)分别包括两条先后执行的指令步骤,每条所述指令步骤均包括有操作数定义、寄存器内数据的运算关系和存储顺序;每条组合指令步骤中的前一条指令步骤的操作结果为后一条指令步骤的源操作数,执行一次两条指令组合步骤完成快速傅里叶变换的一级蝶形运算,之后将一级碟形运算的输出寄存器折叠,使用同样的该两条组合指令步骤进行下一级的蝶形运算,直到快速傅里叶变换运算结束。2. 根据权利要求1所述的包含四条指令的支持快速傅里叶变换运算的方法,其特征在于所述第一组合指令步骤(21)和第二组合指令步骤(22)均采用第一寄存器(61)、第二寄存器(62)、第三寄存器(63)和目的结果寄存器(65)进行蝶形运算,使用中间结果操作数寄存器(64)保存中间结果。3. 根据权利要求2所述的包含四条指令的支持快速傅里叶变换运算的方法,其特征在于所述第一寄存器(61)、第二寄存器(62)、第三寄存器(63)、中间结果操作数寄存器(64)和目的结果寄存器(65)均为N位的寄存器;所述第一组合指令步骤(21)采用所述第一寄存器(61)、第二寄存器(62)、第三寄存器(63)和目的结果寄存器(65)的高N/2位或低N/2位进行蝶形运算;相应地,所述第二组合指令步骤(22)采用所述第一寄存器(61)、第二寄存器(62)、第三寄存器(63)和目的结果寄存器(65)的低N/2位或高N/2位进行蝶形运算。4. 根据权利要求3所述的包含四条指令的支持快速傅里叶变换运算的方法,其特征在于所述N的值为256,所述第一组合指令步骤(21)和第二组合指令步骤(22)分别得到4个复数点数据。5. 根据权利要求4所述的包含四条指令的支持快速傅里叶变换运算的方法,其特征在于所述第一组合指令步骤(21)包括依次执行的以下两步骤第一指令步骤(10):使用中间结果操作数寄存器(64)的0-255位来保存指令结果,使用第一寄存器(61)、第二寄存器(62)、第三寄存器(63)的0-127位来参与运算;第三指令步骤(30):使用目的结果寄存器的0-255位来保存指令结果,使用中间结果操作数寄存器(64)的0-255位、第二寄存器(62)和第三寄存器(63)的0-127位来参与运算;所述第二组合指令步骤(22)包括依次执行的以下两步骤第二指令步骤(20):使用中间结果操作数寄存器(64)的0-255位来保存指令结果,使用第一寄存器(61)、第二寄存器(62)、第三寄存器(63)的128-255位来参与运算;第四指令步骤(40):使用目的结果寄存器的0-255位来保存指令结果,使用中间结果操作数寄存器(64)的0-255位、第二寄存器(62)和第三寄存器(63)的128-255位来参与运算。6. 根据权利要求5所述的包含四条指令的支持快速傅里叶变换运算的方法,其特征在于所述第一指令步骤(10)依次包括步骤(11)M:0:31] 〈-c:0:31] +D[32:63] *E步骤(12)M:32:63]〈-c:32:63] +D[32:63] *E[32:63]步骤(13)M!64:95]〈-c:0:31] -D[32:63] *E步骤(14)M:96:127]〈-c:32:63] -D[32:63] *E[32:63]步骤(15)M:128:159]〈-c:64:95] +D[96:127]*E[64:95]步骤(16)M:160:191]〈-c!96:127]+D[96:127]*E[96:127]步骤(17)M:192:223]〈-c:64:95] -D[96:127...
【专利技术属性】
技术研发人员:陈云霁,钱诚,
申请(专利权)人:北京天童芯源科技有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。