System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种可配置多模式水声信号特征提取方法技术_技高网

一种可配置多模式水声信号特征提取方法技术

技术编号:40420418 阅读:11 留言:0更新日期:2024-02-20 22:39
本发明专利技术公开了一种可配置多模式水声信号特征提取方法,能够克服现有特征处理技术频谱少,参数不可配置的缺点,提供一种可配置水声信号特征预处理方法,从而实现多频谱,可配置的提取水声信号特征。所提取的水声信号特征包含提取的特征包括STFT谱,LOFAR谱、Mel功率谱以及MFCC系数,具体包括如下步骤:接收水声信号,对所述水声信号进行预处理,将预处理后的水声信号直接进行FFT变换,再进行功率谱计算,结果得到STFT谱。采用Mel尺度的三角函数滤波器组针对STFT功率谱进行Mel滤波,获得Mel功率谱。将得到的Mel功率谱进行一个DCT变换处理最终得到MFCC系数。将预处理后的水声信号进行归一化和中心化处理,将经过归一化和中心化处理的水声信号进行FFT变换得到LOFAR谱。

【技术实现步骤摘要】

本专利技术涉及水声信号处理,具体涉及一种可配置多模式水声信号特征提取方法


技术介绍

1、随着海洋的战略地位日益突显,各国都在积极开发利用海洋资源和空间。声波是目前在海洋中唯一能够进行远距离传播的能量形式,水声目标识别对于海洋开发、国防安全有着重大意义,现已成为水声领域的研究热点之一。水下目标自动识别主要包括特征提取与构建分类器两大部分。当前主流的特征提取方法包括时域波形结构分析、频域谱估计以及时频域分析3个方面。频域谱估计可提取信号的频率、功率、包络等特征,以及利用高阶谱分析非高斯信号的特征。这类方法原理简单、易于实现,仅通过采集到的原始水声信号即可获得,但是提取的特征需要一定的先验知识进行信号预处理,在时变的海洋环境下泛化性较弱。时频分析方法提供了时间域与频率域的联合分布信息,可以清楚地描述信号频率随时间变化的关系,是目前应用效果最好、应用最广的特征提取方法。在特征提取之后再训练隐马尔可夫模型(hidden markov model,hmm)、支持向量机、k近邻、神经网络等分类器以实现水下目标的识别。

2、具体在特征提取方面,研究者们多年研究发展出了时域特征,频谱特征,非线性特征和听觉特征等等特征方法。时域分析本身直观方便理解,但往往反映的是信号统计特性随时间变化的整体特征,因此需要对整段音频的局部特征做精准的描述。由此研究者发展出了短时傅里叶变换(short-time fourier transform,stft),小波变换(wavelettransform,wt),魏格纳-威尔分布(wigner-ville distribution,wvd)等联合时域与频域特性的二维时域空间算法。以混沌,分形等数学理论为基础发展的非线性特征在发展中尚未足够成熟,且相关计算较为复杂。频谱特征作为常用的信号处理概念,广泛用于船舶噪声特征提取,且由原来的傅里叶频谱、功率谱不断丰富扩展,发展到lofar谱,听觉谱,mel频率倒谱等等,越来越契合人耳的听觉感知模型。除此之外,近年图像处理技术和机器视觉的迅猛发展也催生了将音频切片,将一维的声音信号转化为二维的频谱图从而提取图像特征并使用机器视觉进行分类的方法,特征提取越来越多样化,精准化。

3、针对一系列的特征提取,大多数是使用软件方法实现,其中最多的是使用librosa库来进行特征提取,librosa是一个python模块,用于分析一般的音频信号,是一个非常强大的python语音信号处理的第三方库。调用librosa库,可以加载音频文件,读取采样率,并且librosa库也提供了stft、mfcc等特征提取工具。但是librosa提供的库并不能看到源代码。

4、目前针对水声信号时频域特征提取的硬件加速方法通常只针对特定的特征提取算法进行优化,导致了硬件固定化。这限制了在不同应用场景下适应不同特征提取需求的能力。其次,现有的硬件加速方法往往缺乏足够的灵活性,无法在运行时进行算法修改和参数调整。这对于应对实时变化的需求或不同信号类型的适应性较差。由于硬件资源有限,例如对于fpga而言,乘法器资源较为有限,难以满足较多的乘法运算,也是目前导致性能瓶颈和限制性能的原因。

5、可见现有的方案因各种限制因素导致特征处理技术频谱少,参数不可配置。


技术实现思路

1、有鉴于此,本专利技术提供了一种可配置多模式水声信号特征提取方法,能够克服现有特征处理技术频谱少,参数不可配置的缺点,提供一种可配置水声信号特征预处理方法,从而实现多频谱,可配置的提取水声信号特征。

2、为达到上述目的,本专利技术的技术方案为:所提取的水声信号特征包含提取的特征包括stft谱,lofar谱、mel功率谱以及mfcc系数,具体包括如下步骤:

3、接收水声信号,对所述水声信号进行预处理,将预处理后的水声信号直接进行fft变换,再进行功率谱计算,结果得到stft谱。

4、采用mel尺度的三角函数滤波器组针对stft功率谱进行mel滤波,获得mel功率谱。

5、将得到的mel功率谱进行一个dct变换处理最终得到mfcc系数。

6、将预处理后的水声信号进行归一化和中心化处理,将经过归一化和中心化处理的水声信号进行fft变换得到lofar谱。

7、进一步地,对所述水声信号进行预处理,具体过程为:

8、s101:采用预加重滤波器针对所述水声信号进行预加重处理;

9、s102:将预加重处理后的水声信号进行分帧处理,分好的帧组成帧集;

10、s103:针对所述帧集中的每一个帧乘以一个窗口函数,获得加窗后的新帧,即为预处理结果。

11、进一步地,预加重滤波器具体为:

12、pre_mphasized(t)=signal(t)-α×signal(t-1)

13、其中signal(t)为t时刻的水声信号,pre_mphasized(t)为针对t时刻的水声信号进行预加重处理后的信号,α为预加重滤波器系数。

14、进一步地,将预加重处理后的水声信号进行分帧处理,分好的帧组成帧集,具体为:

15、s1021:进行分帧参数设置,所设置的分帧参数包括帧长frame_length,帧移frame_step,信号的长度signal_length,帧的数目number_frames,信号补零的长度pad_signal_length,补零后的信号pad_signal,帧集frames;

16、s1022:取信号前frame_length个采样点为第一帧;

17、根据帧移frame_step第二次从第frame_step个采样点开始往后取frame_length个采样点为第二帧;

18、第三次从frame_length+frame_step个采样点开始往后取frame_length个采样点,为第三帧;

19、以此类推,直到取完最后frame_length点作为最后一帧,这些帧组成帧集frames;

20、若信号的长度signal_length减去帧长frame_length之后能够被帧移frame_step整除,则不需要补零,否则对信号进行补零使得信号的长度signal_length减去帧长frame_length之后能够被帧移frame_step整除。

21、进一步地,针对所述帧集中的每一个帧乘以一个窗口函数,其中窗口函数为hamming窗口,采用查表法实现加窗处理,具体地,将hamming窗函数的各个值存在ram里面,依次查找各值对每一帧进行加窗处理。

22、进一步地,采用mel尺度的三角函数滤波器组针对stft功率谱进行mel滤波,获得mel功率谱,具体为:

23、mel滤波的过程包括s201~s206,每帧的stft功率谱经过以上s201~s206的mel滤波过程处理之后,再将输出能量结果取对数得到每一帧的mel功率谱;

24、s201~s206本文档来自技高网...

【技术保护点】

1.一种可配置多模式水声信号特征提取方法,其特征在于,所提取的水声信号特征包含提取的特征包括STFT谱,LOFAR谱、Mel功率谱以及MFCC系数,具体包括如下步骤:

2.如权利要求1所述的一种可配置多模式水声信号特征提取方法,其特征在于,所述对所述水声信号进行预处理,具体过程为:

3.如权利要求2所述的一种可配置多模式水声信号特征提取方法,其特征在于,所述预加重滤波器具体为:

4.如权利要求2任一所述的一种可配置多模式水声信号特征提取方法,其特征在于,所述将预加重处理后的水声信号进行分帧处理,分好的帧组成帧集,具体为:

5.如权利要求2任一所述的一种可配置多模式水声信号特征提取方法,其特征在于,所述针对所述帧集中的每一个帧乘以一个窗口函数,其中窗口函数为Hamming窗口,采用查表法实现加窗处理,具体地,将Hamming窗函数的各个值存在RAM里面,依次查找各值对每一帧进行加窗处理。

6.如权利要求1或2所述的一种可配置多模式水声信号特征提取方法,其特征在于,所述采用Mel尺度的三角函数滤波器组针对STFT功率谱进行Mel滤波,获得Mel功率谱,具体为:

7.如权利要求1或2所述的一种可配置多模式水声信号特征提取方法,其特征在于,所述将预处理后的水声信号进行归一化和中心化处理,将经过归一化和中心化处理的水声信号进行FFT变换得到LOFAR谱,具体分为如下步骤:

8.如权利要求7所述的一种可配置多模式水声信号特征提取方法,其特征在于,所述S303中,采用的快速傅里叶变换是按时间抽取的基2-FFT算法,其计算模式为定点数计算,快速傅里叶变换输入的点数为2的n次幂,在硬件实现中将所使用的旋转因子存在RAM中,实部和虚部分开计算,其中每一帧的长度是给定的,FFT计算的点数跟帧的长度一致。

...

【技术特征摘要】

1.一种可配置多模式水声信号特征提取方法,其特征在于,所提取的水声信号特征包含提取的特征包括stft谱,lofar谱、mel功率谱以及mfcc系数,具体包括如下步骤:

2.如权利要求1所述的一种可配置多模式水声信号特征提取方法,其特征在于,所述对所述水声信号进行预处理,具体过程为:

3.如权利要求2所述的一种可配置多模式水声信号特征提取方法,其特征在于,所述预加重滤波器具体为:

4.如权利要求2任一所述的一种可配置多模式水声信号特征提取方法,其特征在于,所述将预加重处理后的水声信号进行分帧处理,分好的帧组成帧集,具体为:

5.如权利要求2任一所述的一种可配置多模式水声信号特征提取方法,其特征在于,所述针对所述帧集中的每一个帧乘以一个窗口函数,其中窗口函数为hamming窗口,采用查表法实现加窗处理,具体地,将hamming窗函数的各个值存...

【专利技术属性】
技术研发人员:黎烽云陈虹陈源宝张强石振华李开宇石磊鑫
申请(专利权)人:中国船舶集团有限公司第七一九研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1