用于IIR滤波器的滤波处理的处理器、组件、设备和方法技术

技术编号:37133023 阅读:9 留言:0更新日期:2023-04-06 21:31
本申请涉及一种用于IIR滤波器的滤波处理的处理器、组件、设备和方法。该处理器包括第一配置寄存器、第二配置寄存器、通用寄存器和矩阵乘法累加单元。通用寄存器对于IIR滤波器的各阶的系数矩阵的各行系数,依序读取并存储该行系数。矩阵乘法累加单元在第一配置寄存器配置广播模式时,获取存储的当前行系数对应的同个输入元素;在第一配置寄存器配置复制模式时,复制所存储的当前行系数;将当前行系数并行与对应的输入元素相乘得到对应乘积;对各行系数的乘积结果逐次累加以得到最终的输出值,使得每次得出至少4个顺序采样时刻的输出变量。如此,能够显著缩短IIR滤波运算的耗时,提供充分的加速效果。供充分的加速效果。供充分的加速效果。

【技术实现步骤摘要】
用于IIR滤波器的滤波处理的处理器、组件、设备和方法


[0001]本申请涉及无线通信领域的滤波器和滤波处理,更具体地,涉及用于IIR滤波器的滤波处理的处理器、组件、设备和方法。

技术介绍

[0002]在数字信号处理领域,IIR滤波器与FIR滤波器相比,具有相位特性差的缺点,但它的结构简单、运算量小,具有经济、高效的特点,并且可以用较少的阶数获得很高的选择性,因此得到了广泛应用。IIR滤波器差分方程的一般表达式如下公式(a)所示:
[0003][0004]其中,x(n)为输入序列,y(n)为输出序列,a
i
和b
i
表示滤波系数,N为IIR滤波器的阶数。IIR滤波器具有无限长度的单位脉冲响应,在结果上存在反馈回路,具有递归性,即IIR滤波器的输出序列不仅与过去时刻的输入有关,而且与过去时刻的输出有关,从如上公式(a)中也可以看到,这会导致信号滤波的计算效率不高。
[0005]业内一般通过CMSIS(即ARM Cortex
TM
微控制器软件接口标准)中的如arm_biquad_cascade_df1_fast_q15函数来进行IIR滤波器的滤波处理运算,该函数利用二阶单元(Biquad)的级联实现。具体说来,arm_biquad_cascade_df1_fast_q15函数将滤波器的系数按照一定方式排序,按照顺序计算两个系数对应的乘法并进行累加,加速效果不足。尤其在需要处理视频、图像类的海量多媒体数据的应用场景下,加速效果不明显,计算效率存在改进空间。<br/>
技术实现思路

[0006]提供了本申请以解决现有技术中存在的上述缺陷。需要一种用于IIR滤波器的滤波处理的处理器、组件、设备和方法,其能够在需要处理视频、图像类的海量多媒体数据的应用场景下,相较CMSIS及其现有的IIR滤波计算方式能够显著缩短IIR滤波运算的耗时,提供充分的加速效果。
[0007]根据本申请的第一方案,提供了一种用于IIR滤波器的滤波处理的处理器。该处理器包括第一配置寄存器、第二配置寄存器、至少一个通用寄存器和矩阵乘法累加单元。第二配置寄存器用于配置输出数据的读出方式。所述第一配置寄存器用于配置包括矩阵乘法累加单元在内的算术逻辑单元的数据类型,以及配置输入数据到所述矩阵乘法累加单元的输入模式为复制模式或广播模式。所述至少一个通用寄存器配置为:对于IIR滤波器的各阶的系数矩阵的各行系数,依序读取并存储该行系数。所述矩阵乘法累加单元配置为,对于同个输入向量:以各行系数分别作为当前行系数,在所述第一配置寄存器配置输入模式为广播模式的情况下,获取所述当前行系数对应的所述输入向量中对应的单个输入元素;在所述第一配置寄存器配置输入模式为复制模式的情况下,复制所存储的当前行系数;将当前行
系数并行与对应的输入元素相乘得到当前行系数的对应乘积;对各行系数的乘积结果进行逐次累加以得到最终的输出值,使得每次完整的乘法累加运算得出至少4个顺序采样时刻的输出变量。这满足IIR滤波器的滤波系数的数据类型为q15类型时候的计算需求。
[0008]根据本申请的第二方案,提供了一种IIR滤波器组件,其包括根据本申请各个实施例的处理器。该处理器包括第一配置寄存器、第二配置寄存器、至少一个通用寄存器和矩阵乘法累加单元。第二配置寄存器用于配置输出数据的读出方式。所述第一配置寄存器用于配置包括矩阵乘法累加单元在内的算术逻辑单元的数据类型,以及配置输入数据到所述矩阵乘法累加单元的输入模式为复制模式或广播模式。所述至少一个通用寄存器配置为:对于IIR滤波器的各阶的系数矩阵的各行系数,依序读取并存储该行系数。所述矩阵乘法累加单元配置为,对于同个输入向量:以各行系数分别作为当前行系数,在所述第一配置寄存器配置输入模式为广播模式的情况下,获取所述当前行系数对应的所述输入向量中对应的单个输入元素;在所述第一配置寄存器配置输入模式为复制模式的情况下,复制所存储的当前行系数;将当前行系数并行与对应的输入元素相乘得到当前行系数的对应乘积;对各行系数的乘积结果进行逐次累加以得到最终的输出值,使得每次完整的乘法累加运算得出至少4个顺序采样时刻的输出变量,这满足IIR滤波器的滤波系数的数据类型为q15类型时候的计算需求。
[0009]根据本申请的第三方案,提供了一种具有IIR滤波器组件的智能便携式设备。该智能便携式设备包括NPU,其配置为处理包括音频、视频和图像中的至少一种的多媒体数据。该智能便携式设备还包括根据本申请各个实施例的处理器,作为NPU协处理器。该处理器包括第一配置寄存器、第二配置寄存器、至少一个通用寄存器和矩阵乘法累加单元。第二配置寄存器用于配置输出数据的读出方式。所述第一配置寄存器用于配置包括矩阵乘法累加单元在内的算术逻辑单元的数据类型,以及配置输入数据到所述矩阵乘法累加单元的输入模式为复制模式或广播模式。所述至少一个通用寄存器配置为:对于IIR滤波器的各阶的系数矩阵的各行系数,依序读取并存储该行系数。所述矩阵乘法累加单元配置为,对于同个输入向量:以各行系数分别作为当前行系数,在所述第一配置寄存器配置输入模式为广播模式的情况下,获取所述当前行系数对应的所述输入向量中的单个输入元素;在所述第一配置寄存器配置输入模式为复制模式的情况下,复制所存储的当前行系数;将当前行系数并行与对应的输入元素相乘得到当前行系数的对应乘积;对各行系数的乘积结果进行逐次累加以得到最终的输出值,使得每次完整的乘法累加运算得出至少4个顺序采样时刻的输出变量,这满足IIR滤波器的滤波系数的数据类型为q15类型时候的计算需求。
[0010]根据本申请的第四方案,提供了一种IIR滤波器的滤波处理方法。该滤波处理方法包括如下步骤。确定IIR滤波器的各阶的系数矩阵。依序读取并存储IIR滤波器的各阶的系数矩阵的各行系数。利用矩阵乘法累加单元,对于同个输入向量,以各行系数分别作为当前行系数,获取所述当前行系数对应的所述输入向量中的单个输入元素,将当前行系数并行与对应的输入元素相乘得到当前行系数的对应乘积;对各行系数的乘积结果进行逐次累加以得到最终的输出值,使得每次完整的乘法累加运算得出至少4个顺序采样时刻的输出变量,这满足IIR滤波器的滤波系数的数据类型为q15类型时候的计算需求。
[0011]利用本申请各个实施例提供的用于IIR滤波器的滤波处理的处理器、组件、设备和方法,其预先将系数矩阵按行展开,配合所述矩阵乘法累加单元的配置,使得能够一次计算
至少4个点积,这满足IIR滤波器的滤波系数的数据类型为q15类型时候的计算需求,并且能够直接累加,能够在需要智能便携式设备处理视频、图像类的海量多媒体数据的应用场景下,相较CMSIS及其现有的IIR滤波计算方式能够显著缩短IIR滤波运算的耗时,可缩短25%左右的耗时,提供充分的加速效果。
附图说明
[0012]下面将参照附图描述本专利技术的示例性实施例的特征、优势以及技术和工业意义,其中相同的附图标记表示相同的元件,并且其中:
[0013]图1示出根据本申请实施例的用于IIR本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于IIR滤波器的滤波处理的处理器,其特征在于,包括第一配置寄存器、第二配置寄存器、至少一个通用寄存器和矩阵乘法累加单元,第二配置寄存器用于配置输出数据的读出方式;所述第一配置寄存器用于配置包括矩阵乘法累加单元在内的算术逻辑单元的数据类型,以及配置输入数据到所述矩阵乘法累加单元的输入模式为复制模式或广播模式;所述至少一个通用寄存器配置为:对于IIR滤波器的各阶的系数矩阵的各行系数,依序读取并存储该行系数;所述矩阵乘法累加单元配置为,对于同个输入向量:以各行系数分别作为当前行系数,在所述第一配置寄存器配置输入模式为广播模式的情况下,获取所述当前行系数对应的所述输入向量中的单个输入元素;在所述第一配置寄存器配置输入模式为复制模式的情况下,复制所存储的当前行系数;将当前行系数并行与对应的输入元素相乘得到当前行系数的对应乘积;对各行系数的乘积结果进行逐次累加以得到最终的输出值,使得每次完整的乘法累加运算得出至少4个顺序采样时刻的输出变量。2.根据权利要求1所述的处理器,其特征在于,所述处理器为NPU协处理器。3.根据权利要求1所述的处理器,其特征在于,所述至少一个通用寄存器为64位,所述数据类型包括Q15格式和Q7格式,在所述IIR滤波器的滤波系数的数据类型为Q15格式时,每次完整的乘法累加运算得出4个顺序采样时刻的输出变量,而在所述IIR滤波器的滤波系数的数据类型为Q7格式时,每次完整的乘法累加运算得出8个顺序采样时刻的输出变量。4.根据权利要求1所述的处理器,其特征在于,对于同阶的每次完整的乘法累加运算,所述系数矩阵是相同的,且利用如下公式(1)来计算:y
n = b0x
n + b1x
n

1 + b2x
n
‑2ꢀ–ꢀ
a1y
n
‑1ꢀ–ꢀ
a2y
n
‑2ꢀꢀꢀꢀꢀꢀꢀ
公式(1)其中,每次完整的乘法累加运算得出n个顺序采样时刻的输出变量,x
n
、x
n
‑1和x
n
‑2分别为n、n

1和n

2时刻的输入变量,y
n
、y
n
‑1和y
n
‑2分别为n、n

1和n
...

【专利技术属性】
技术研发人员:战婷婷吴涛李倩
申请(专利权)人:恒玄科技上海股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1