一种基于时频特征的环境噪声下海豚声音端点检测方法技术

技术编号:35813962 阅读:27 留言:0更新日期:2022-12-03 13:37
本发明专利技术涉及一种基于时频特征的环境噪声下海豚声音端点检测方法,包括:获取海洋中的声音数字信号;将获取的声音数字信号切割为一定长度的数字信号,并做归一化处理;对每个归一化处理后的数字信号进行分帧处理;计算每一帧信号的短时能量、加权谱质心和谱质心二阶偏移率;拟定短时能量阈值、谱质心阈值和谱质心二阶偏移率阈值;将高于短时能量阈值和谱质心阈值的帧提取出来作为备用有效音段;在备用有效音段两端比较谱质心二阶偏移率,将谱质心二阶偏移率高于谱质心二阶偏移率阈值的部分作为海豚声音的起始点和终止点,生成有效音段。本发明专利技术能够快速准确地在海洋环境中提取出海豚声音信号,并且降低突发噪声的干扰。并且降低突发噪声的干扰。并且降低突发噪声的干扰。

【技术实现步骤摘要】
一种基于时频特征的环境噪声下海豚声音端点检测方法


[0001]本专利技术涉及被动声学
,特别是涉及一种基于时频特征的环境噪声下海豚声音 端点检测方法。

技术介绍

[0002]海豚是鲸类哺乳动物,广泛生活于全球各大海域,在内海及入海口附近的咸淡水中也 有分布,是我国国家重点保护野生动物之一。海豚的声音信号主要分为三类:回声定位信 号(click)、脉冲信号(burst

pulse)、通讯信号(whistle),whistle信号主要集中在 8k~15kHz,burst

pulse信号主要集中在15k~30kHz,click信号主要集中在100k~150kHz。 其中回声定位信号是海豚捕食、定位等活动的声音信号,对于保护海豚种群和相关资源调 查具有重要的意义。
[0003]海洋环境噪声场是海洋环境中普遍存在而又不期望出现的背景声场。它是由风浪、降 雨、航船、海洋生物、人类工业活动等因素产生的,是主、被动声纳的主要声学背景干扰。 海洋环境的声学构成相对复杂,涵盖各个频段并且能量较大。因此,海洋环境噪声场的存 在,导致识别海洋中目标动物的声音较为困难。虽然目前有许多研究通过绘制信号光谱图, 将声音问题转化为图像问题,再使用深度学习或机器学习等方式进行识别,但无论是使用 声学方式处理还是转化为图像处理,都包含大量噪声的干扰,因此数据的预处理变得尤为 重要。除海洋环境的噪声干扰外,另一难点是海豚有三种声音信号,其中回声定位信号的 频率往往超过人耳听力范围,声音的传播特性又使得高频分量衰减的更加迅速,导致人工 处理信号制作数据集变得困难,使用深度学习的方法识别难以进行。
[0004]常用的端点检测方法有:双门限法端点检测,利用短时能量和短时过零率,短时能量 计算公式为:式中,E
i
是第i帧的短时能量,N是单帧信号的采样点数, x
n
(m)是每一个采样点的振幅大小。根据短时能量和短时过零率设定两个门限可以较好的 区分浊音、清音和静音,但是在海洋环境中噪声场和其他生物发声同样会导致过零率产生 变化,不能作为海豚声音检测的参数;
[0005]谱质心法,谱质心计算公式为:式中,f为信号频率;E(n)为 连续信号短时傅里叶变换后对应频率的谱能量。谱质心是频率成分的中心,能够表达声音 的频率分布情况,而海洋环境中存在很多发声频率高的动物以及高频噪声,不能完全表征 海豚发声行为;谱熵法,是根据熵来表示信号的有序程度,而海洋环境中的所有声音信号 都是无序的,熵不能够在复杂环境中区分出目标生物的声音。这些方法在物种信息多、频 率范围广、能量大和无序性的海洋环境中并不适用。

技术实现思路

[0006]本专利技术所要解决的技术问题是提供一种基于时频特征的环境噪声下海豚声音端点检 测方法,能够在海洋环境中实时检测出海豚的声音信号。
[0007]本专利技术解决其技术问题所采用的技术方案是:提供一种基于时频特征的环境噪声下海 豚声音端点检测方法,包括以下步骤:
[0008]数据获取步骤:获取海洋中的声音数字信号;
[0009]数据预处理步骤:将获取的声音数字信号切割为一定长度的数字信号,并做归一化处 理;
[0010]信号分帧步骤:对每个归一化处理后的数字信号进行分帧处理;
[0011]特征提取步骤:对每一帧信号计算时域特征,并计算每一帧信号的短时能量;对每一 帧信号计算频域特征,并计算每一帧信号的加权谱质心,得到加权谱质心后,计算谱质心 二阶偏移率;
[0012]拟定阈值步骤:根据海洋环境噪声场和海豚声音的时频特征拟定短时能量阈值、谱质 心阈值和谱质心二阶偏移率阈值;
[0013]备用有效音段提取步骤:将高于短时能量阈值和谱质心阈值的帧提取出来作为备用有 效音段;
[0014]有效音段生成步骤:获取所述备用有效音段两端的谱质心二阶偏移率,当所述备用有 效音段两端的谱质心二阶偏移率高于所述谱质心二阶偏移率阈值时,将该帧作为海豚声音 的起始点和终止点,生成有效音段。
[0015]所述数据预处理步骤中将输入的声音信号的最大振幅为1做归一化处理。
[0016]所述信号分帧步骤中,对每个归一化处理后的数字信号选择方形窗函数,采用步长等 于窗长的方法对每个数字信号进行分帧处理。
[0017]当检测海豚声音为海豚发出的回声定位信号时,所述窗长选择为10ms,当海豚声音为 海豚发出的脉冲信号和通信信号时,所述窗长选择为20ms

50ms。
[0018]所述特征提取步骤中计算每一帧信号的加权谱质心时,先对每一帧信号进行短时傅里 叶变换,设置海豚声音频谱范围的权重和其他频谱范围的权重,再通过 计算每一帧信号的加权谱质心,其中,C
i
表示 第i帧信号的加权谱质心,Q1表示海豚声音频谱范围的权重,Q2表示其他频谱范围的权 重,F
k1
为海豚声音的频率;X
k1
为连续信号短时傅里叶变换后对应的海豚声音的频率的谱 能量,N1表示海豚声音的频率范围,F
k2
为其他声音的频率;X
k2
为连续信号短时傅里叶 变换后对应的其他声音的频率的谱能量,N2表示其他声音的频率范围。
[0019]所述特征提取步骤中通过计算谱质心二阶偏移率,其中,B
i
表示第i帧 信号的谱质心二阶偏移率,S
i
表示第i帧信号的谱质心偏移率,C
i
表示第 i帧信号的加权谱质心。
[0020]所述拟定阈值步骤中将计算出的短时能量数据中的2/3位数和均值进行求和再除
以2 作为短时能量阈值,将计算出的谱质心数据中的3/4位数作为谱质心阈值,将计算出的谱 质心二阶偏移率数据中的3/4位数作为谱质心二阶偏移率阈值。
[0021]所述备用有效音段提取步骤中,当相邻的备用有效音段之间的间隔不超过N帧时,将 相邻的备用有效音段合并为一段备用有效音段,其中,N=4~6。
[0022]有益效果
[0023]由于采用了上述的技术方案,本专利技术与现有技术相比,具有以下的优点和积极效果: 本专利技术使用谱质心二阶偏移率,并且将短时能量和谱质心结合应用于水生生物端点检测, 基于被动声学技术,不会对海豚和海洋其他生物造成影响;本方法使用的三种特征,短时 能量和加权谱质心能够分别检测出海洋环境中符合发声行为能量特征的信号、符合海豚声 音频率范围的信号,二者互相验证即可得到符合海豚声音频率的发声行为,再通过谱质心 二阶偏移率检测出该发生行为的起始点和终止点,根据海豚发声的持续时间特性,提取出 完整的海豚声音,这三种特征互相补充,降低检测的局限性;本方法能够在检测中不断检 验各个特征的阈值,当出现异常值时,能够及时纠正,随着检测时间增加,阈值越来越贴 合海洋环境中噪声时频特征的分界线,检测效果越来越好;本方法在读取环境样本时,具 有较强的适应性,能够满足不同信噪比条件下的海豚声音端本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时频特征的环境噪声下海豚声音端点检测方法,其特征在于,包括以下步骤:数据获取步骤:获取海洋中的声音数字信号;数据预处理步骤:将获取的声音数字信号切割为一定长度的数字信号,并做归一化处理;信号分帧步骤:对每个归一化处理后的数字信号进行分帧处理;特征提取步骤:对每一帧信号计算时域特征,并计算每一帧信号的短时能量;对每一帧信号计算频域特征,并计算每一帧信号的加权谱质心,得到加权谱质心后,计算谱质心二阶偏移率;拟定阈值步骤:根据海洋环境噪声场和海豚声音的时频特征拟定短时能量阈值、谱质心阈值和谱质心二阶偏移率阈值;备用有效音段提取步骤:将高于短时能量阈值和谱质心阈值的帧提取出来作为备用有效音段;有效音段生成步骤:获取所述备用有效音段两端的谱质心二阶偏移率,当所述备用有效音段两端的谱质心二阶偏移率高于所述谱质心二阶偏移率阈值时,将该帧作为海豚声音的起始点和终止点,生成有效音段。2.根据权利要求1所述的基于时频特征的环境噪声下海豚声音端点检测方法,其特征在于,所述数据预处理步骤中将输入的声音信号的最大振幅为1做归一化处理。3.根据权利要求1所述的基于时频特征的环境噪声下海豚声音端点检测方法,其特征在于,所述信号分帧步骤中,对每个归一化处理后的数字信号选择方形窗函数,采用步长等于窗长的方法对每个数字信号进行分帧处理。4.根据权利要求3所述的基于时频特征的环境噪声下海豚声音端点检测方法,其特征在于,当检测海豚声音为海豚发出的回声定位信号时,所述窗长选择为10ms,当海豚声音为海豚发出的脉冲信号和通信信号时,所述窗长选择为20ms

50ms。5.根据权利要求1所述的基于时频特征的环境噪声下海豚声音端点检测方法,其特征在于,所述特征提取...

【专利技术属性】
技术研发人员:戴阳杨昱皞何瑞麟王书献伍玉梅韦波
申请(专利权)人:大连海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1