本申请提供一种可配置水声信号特征提取方法及装置,方法包括:获取配置文件以及水声采样信号;对水声采样信号执行预处理以得到第一信号帧集;根据配置文件对第一信号帧集执行快速傅里叶变换FFT以得到水声信号特征;根据配置文件输出水声信号特征。其中,配置文件用于指示待提取的LOFAR谱、STFT功率谱、Mel功率谱和MFCC中的一个或多个水声信号特征组合。装置包括控制模块、FPGA模块和电源模块,FPGA模块中,通过四种特征提取方法共用预处理单元以及FFT单元,不仅实现多种结果的水声信号特征提取,还可根据需要选择合适的水声信号特征,减少硬件资源的使用。而且在运算过程中,减少乘法器的使用,提高运算效率。提高运算效率。提高运算效率。
【技术实现步骤摘要】
一种可配置水声信号特征提取方法及装置
[0001]本申请涉及声纹特征提取
,尤其涉及一种可配置水声信号特征提取方法及装置。
技术介绍
[0002]水声目标识别是水声领域的研究热点之一,在对水声目标识别的研究中,需要对水声信号特征进行提取。水声信号特征提取方法主要包括时域波形结构分析、频域谱估计以及时频域分析。频域谱估计可提取信号的频率、功率、包络等特征,以及利用高阶谱分析非高斯信号的特征。这类方法原理简单、易于实现,仅通过采集到的原始水声信号即可获得,但是提取的特征需要一定的经验知识进行信号预处理,在时变的海洋环境下泛化性较弱。通过频域谱估计得到的频谱特征,由原来的傅里叶频谱、功率谱不断丰富扩展,发展到低频率分析记录(Low Frequency Analysis and Recording,LOFAR)谱,听觉谱,梅尔Mel频率倒谱等,越来越契合人耳的听觉感知模型。
[0003]上述水声信号特征提取,大多数通过软件方法实现,常用的是使用librosa库来进行特征提取,librosa是一个Python模块,用于分析一般的音频信号,是一个强大的python语音信号处理的第三方库。调用librosa库,可以加载音频文件,读取采样率,并且librosa库也提供了短时傅里叶变换(Short Time Fourier Transform,STFT)、梅尔频率倒谱系数(Mel Frequency Cepstral Coefficents,MFCC)等特征提取工具。但是librosa提供的库并不能看到源代码,且通过一种编程形式,只能提取一种水声信号特征,提取结果单一。
技术实现思路
[0004]本申请提供一种可配置水声信号特征提取方法及装置,以解决采用软件方法提取水声信号特征时,提取结果单一的问题。
[0005]本申请第一方面提供一种可配置水声信号特征提取方法,所述方法包括:获取配置文件以及水声采样信号;对所述水声采样信号执行预处理,以得到第一信号帧集;所述预处理包括预加重处理、分帧处理和加窗处理;根据所述配置文件对所述第一信号帧集执行快速傅里叶变换FFT,以得到水声信号特征;所述配置文件用于指示待提取的低频率分析记录LOFAR谱、短时傅里叶变换STFT功率谱、梅尔Mel功率谱和梅尔频率倒谱系数MFCC中的一个或多个水声信号特征组合;输出所述水声信号特征。
[0006]可选的,对所述水声采样信号执行预处理包括:利用预加重滤波器加强所述水声采样信号中的高频部分,以对所述水声采样信号进行预加重处理;将所述水声采样信号分割成多个时帧,以进行分帧处理;将分帧处理后的所述水声采样信号的每一帧乘以窗口函数,以进行加窗处理。
[0007]可选的,根据所述配置文件对所述第一信号帧集执行快速傅里叶变换FFT,以得到水声信号特征的步骤包括:对所述第一信号帧集的每一帧进行归一化处理,以得到第二信号帧集;对所述第二信号帧集的每一帧进行中心化处理,以得到第三信号帧集;对所述第三信号帧集执行快速傅里叶变换FFT,以得到所述低频率分析记录LOFAR谱。
[0008]可选的,对所述第一信号帧集的每一帧进行归一化处理的步骤包括:获取所述第一信号帧集中每一帧信号的第一振幅极值,所述第一振幅极值包括最大值和最小值;根据所述第一振幅极值对所述第一信号帧集的每一帧信号求平均值,以得到所述第二信号帧集。
[0009]可选的,对所述第二信号帧集的每一帧进行中心化处理的步骤包括:获取所述第二信号帧集中每一帧信号的第二振幅极值,所述第二振幅极值包括最大值和最小值;根据所述第二振幅极值对所述第二信号帧集的每一帧信号求平均值;将所述第二信号帧集中的每一帧信号振幅与每一帧信号振幅的所述平均值相减,以得到所述第三信号帧集。
[0010]可选的,根据所述配置文件对所述第一信号帧集执行快速傅里叶变换FFT,以得到水声信号特征的步骤还包括:将所述第一信号帧集的每一帧进行快速傅里叶变换FFT;对变换后的所述第一信号帧集的每一帧进行功率谱计算,以得到所述短时傅里叶变换STFT功率谱。
[0011]可选的,根据所述配置文件对所述第一信号帧集执行快速傅里叶变换FFT,以得到水声信号特征的步骤还包括:对每一帧的所述短时傅里叶变换STFT功率谱通过梅尔滤波器组进行梅尔Mel滤波,以得到滤波后的功率谱;将所述滤波后的功率谱与所述梅尔滤波器组相乘,以得到多个能量数值结果;将多个所述能量数值结果分别取对数,以得到所述梅尔Mel功率谱。
[0012]可选的,对每一帧的所述短时傅里叶变换STFT功率谱通过梅尔滤波器组进行梅尔Mel滤波的步骤包括:获取功率谱计算后的水声采样信号的最低频率、最高频率和梅尔滤波器的个数;分别计算所述最高频率和所述最低频率对应的梅尔Mel频率;根据所述梅尔滤波器的个数计算相邻两个所述梅尔滤波器的中心频率间距;分别计算多个所述中心频率间距对应的频率值,以及多个所述频率值对应的快速傅里叶变换FFT中点的下标,所述中点为所述梅尔滤波器三角形底边的中点。
[0013]可选的,根据所述配置文件对所述第一信号帧集执行快速傅里叶变换FFT,以得到水声信号特征的步骤还包括:将得到的所述梅尔Mel功率谱进行离散余弦变换DCT处理,以得到所述梅尔频率倒谱系数MFCC;所述离散余弦变换DCT的点数与所述梅尔滤波器的个数相同。
[0014]本申请另一方面提供一种可配置水声信号特征提取装置,所述装置包括:控制模块、可编程逻辑门阵列FPGA模块和电源模块;其中,所述电源模块分别与所述控制模块、所述FPGA模块电性相连;所述控制模块与所述可编程逻辑门阵列FPGA模块通信相连;所述控制模块内设置有存储单元;所述可编程逻辑门阵列FPGA模块包括预处理单元、归一化中心化单元、快速傅里叶变换FFT单元、短时傅里叶变换STFT功率谱计算单元、梅尔滤波器组单元、对数计算单元、梅尔Mel功率谱单元、离散余弦变换DCT单元和梅尔频率倒谱系数MFCC单元;所述控制模块被配置为执行上述第一方面所述的可配置水声信号特征提取方法。
[0015]由以上技术方案可知,本申请一方面提供一种可配置水声信号特征提取方法,所述方法包括:获取配置文件以及水声采样信号;对所述水声采样信号执行预处理,以得到第一信号帧集;根据所述配置文件对所述第一信号帧集执行快速傅里叶变换FFT,以得到水声信号特征;再根据配置文件输出水声信号特征。其中,配置文件用于指示待提取的低频率分析记录LOFAR谱、短时傅里叶变换STFT功率谱、梅尔Mel功率谱和梅尔频率倒谱系数MFCC中的一个或多个水声信号特征组合。本申请另一方面提供一种可配置水声信号特征提取装置,所述装置包括控制模块、FPGA模块和电源模块,在FPGA模块中,四种特征提取方法共用预处理单元以及FFT单元,不仅可实现多种结果的水声信号特征提取,还可减少硬件资源的使用。通过在运算过程中减少乘法器的使用,还可降低运算的复杂度,提高运算效率。
附图说明
[0016]为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种可配置水声信号特征提取方法,其特征在于,包括:获取配置文件以及水声采样信号;对所述水声采样信号执行预处理,以得到第一信号帧集;所述预处理包括预加重处理、分帧处理和加窗处理;根据所述配置文件对所述第一信号帧集执行快速傅里叶变换FFT,以得到水声信号特征;所述配置文件用于指示待提取的低频率分析记录LOFAR谱、短时傅里叶变换STFT功率谱、梅尔Mel功率谱和梅尔频率倒谱系数MFCC中的一个或多个水声信号特征组合;输出所述水声信号特征。2.根据权利要求1所述的一种可配置水声信号特征提取方法,其特征在于,对所述水声采样信号执行预处理包括:利用预加重滤波器加强所述水声采样信号中的高频部分,以对所述水声采样信号进行预加重处理;将所述水声采样信号分割成多个时帧,以进行分帧处理;将分帧处理后的所述水声采样信号的每一帧乘以窗口函数,以进行加窗处理。3.根据权利要求1所述的一种可配置水声信号特征提取方法,其特征在于,根据所述配置文件对所述第一信号帧集执行快速傅里叶变换FFT,以得到水声信号特征的步骤包括:对所述第一信号帧集的每一帧进行归一化处理,以得到第二信号帧集;对所述第二信号帧集的每一帧进行中心化处理,以得到第三信号帧集;对所述第三信号帧集执行快速傅里叶变换FFT,以得到所述低频率分析记录LOFAR谱。4.根据权利要求3所述的一种可配置水声信号特征提取方法,其特征在于,对所述第一信号帧集的每一帧进行归一化处理的步骤包括:获取所述第一信号帧集中每一帧信号的第一振幅极值,所述第一振幅极值包括最大值和最小值;根据所述第一振幅极值对所述第一信号帧集的每一帧信号求平均值,以得到所述第二信号帧集。5.根据权利要求4所述的一种可配置水声信号特征提取方法,其特征在于,对所述第二信号帧集的每一帧进行中心化处理的步骤包括:获取所述第二信号帧集中每一帧信号的第二振幅极值,所述第二振幅极值包括最大值和最小值;根据所述第二振幅极值对所述第二信号帧集的每一帧信号求平均值;将所述第二信号帧集中的每一帧信号振幅与每一帧信号振幅的所述平均值相减,以得到所述第三信号帧集。6.根据权利要求1所述的一种可配置水声信号特征提取方法,其特征在于,根据所述配置文件对所述第一信号帧集执行快速傅里叶变换FFT,以得到水声信号特征的步骤还包括:将所述第一信号帧集的每一...
【专利技术属性】
技术研发人员:林军,史可,王中风,
申请(专利权)人:南京大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。