System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及仿生隐蔽水声通信,具体为基于ipso-chrfa模型的海洋哺乳动物叫声分类方法。
技术介绍
1、海洋哺乳动物是海洋生态系统中的最为重要的旗舰物种和指示生物,具有不可替代的研究意义和保护价值。海洋哺乳动物依靠叫声来进行交流、捕食、定位和水下导航等活动,例如,抹香鲸通过发出四种不同的叫声来相互交流,虎鲸使用回声定位来定位并捕获难以捉摸的鲑鱼类猎物。
2、然而随着人类活动对海洋生态环境的不断影响,海洋中的人为噪声源,如:船舶交通、地震调查、海底钻探、军用声纳、遥测装置、海洋实验、水下爆炸等,会以不同的方式干扰海洋哺乳动物的生活。海洋哺乳动物叫声监测分类任务对于了解和分析其生活习性、种群状况和栖息地范围,进而科学地对它们实施保护措施具有重要的意义,科学有效的检测方法是支持这项任务的重要组成部分。由于海洋哺乳动物之间的交流方式复杂且难以探测,所以其发声行为一直未能得到全面而详细的解释。
3、目前,虽然已有一些分类方法被应用于海洋哺乳动物叫声的分析,但这些方法普遍存在着识别精度低、识别速率慢、识别类别少和鲁棒性差等问题。因此,开发一种更为科学、有效的海洋哺乳动物叫声多物种分类方法,成为了一项亟待解决的技术问题。
技术实现思路
1、本专利技术的目的在于提供一种基于ipso-chrfa模型的海洋哺乳动物叫声分类方法,能够准确捕捉并识别分类各种复杂的叫声以及噪音,降低训练时间,同时还具备高效、稳定的特点,以适应海洋环境的复杂性和多变性,实现了对海洋哺乳动物叫声的
2、为实现上述目的,本专利技术提供如下技术方案:
3、本专利技术的ipso-chrfa模型包括cbank-hn-gru分类模型、ipso改进的粒子群优化算法以及flash attention加速算法模块;其中,flash attention加速算法模块是一种重新排序注意力计算的算法,利用平铺、重计算经典技术来显著提升计算速度;并将序列长度中的内存实现从二次到线性减少,给模型的训练过程带来时钟时间加速;
4、cbank-hn-gru分类模型包括cbank(cnn-bank)卷积银行、hn(highway networks)高速网络以及gru(abidirectional gated recurrent unit)双向门控制单元网络。
5、优选的,具体步骤包括:
6、s1、生成海洋哺乳动物叫声音频数据集;
7、s2、构建cbank-hn-gru分类模型基础框架;
8、s3、使用ipso改进的粒子群优化算法对cbank-hn-gru分类模型进行优化;
9、s4、使用flash attention加速算法模块对cbank-hn-gru分类模型训练进行加速;
10、s5、ipso-chrfa模型的训练与验证。
11、优选的,s1步骤具体为:
12、s1.1、使用adobe audition软件对原始10种海洋哺乳动物叫声和1种噪声音频进行降噪、声音增强、回声消除、咔嗒声去除等操作;
13、s1.2、从经过预处理的海洋哺乳动物叫声音频中提取梅尔频谱特征;包括对原始音频进行降噪、增幅、分帧、傅里叶变换、梅尔滤波器数据处理和离散余弦变换,最后得到尺寸大小为(513,800)的梅尔频谱特征;
14、s1.3、将所有的梅尔频谱特征以及其对应的标签通过指定比例随机划分为训练集、测试集和验证集,比例为0.8:0.1:0.1。
15、优选的,s2步骤具体为:
16、s2.1、搭建模型开始的cbank网络;
17、cbank网络是由卷积核从1到k的k个并行1d-cnn层组成的,k个卷积核不同的并行1d-cnn层可以有效捕获叫声音频不同时间尺度上的特征;cbank网络的后面是十六个batchnorm1d层,为cbank里的每个并行的1d-cnn层后面添加一个batchnorm1d层,以提高模型训练的稳定性;之后又加了两层1d-cnn层和一层batchnorm1d层,来减少cbank网络输出的通道数;再后面是maxpooling层,用于减少音频时间序列数据的维度,同时增加局部不变性,保留最重要的特征;此时池化操作的窗口大小为2,保持步长stride=1,来保持原始的时间分辨率,以避免因池化操作导致的序列长度缩减太多;其maxpooling层的公式如下所示:
18、;
19、其中,fij是输入特征图上的元素,i、j表示特征图上的索引位置,s是步长,k、l是在池化窗口内部遍历的索引,window是池化窗口的大小,定义了进行最大值操作的区域范围;
20、s2.2、在cbank网络的后面连接hn高速网络;
21、将hn高速网络设置为了n层,每一层的单元维度都是513,对应音频的梅尔频谱的频率维度大小,即梅尔滤波器组的数量,来提取更加高级的特征;hn高速网络通过其门控机制,缓解模型训练时的梯度消失问题,并且有助于改善模型的信息流动,使模型能更快地收敛到较优的性能;hn高速网络的输入的是x,则对于每个hn层,输出y公式计算如下:
22、;
23、其中,h是非线性变换,通过relu激活函数;t是转换门,通过sigmoid函数;c是载波门,通常设置为c(x)=1-t(x),wh和wt分别表示非线性变换和转换门的权重;
24、s2.3、在hn高速网络的后面添加gru双向门控制单元网络;
25、将gru双向门控制单元网络设置为了双向、m层的网络,使gru双向门控制单元在处理序列数据时,不仅从前向后处理数据,还从后向前处理数据,可以捕获序列中的前后文信息,进一步提高模型的性能。
26、优选的,s3步骤具体为:
27、s3.1、设计并搭建使用量子计算技术和混沌算法来改进ipso粒子优化算法模型;
28、使用混沌映射来初始化粒子群的位置和速度,公式为:
29、;
30、;
31、其中,xmin、xmax 分别定义了粒子位置向量的最小值和最大值,vmin、vmax分别定义了粒子速度向量的最小值和最大值,并用来定义粒子位置和速度的取值范围;chaos(x0)是一个迭代产生混沌序列的函数;x0和v0 是在区间(0,1)内的随机初始值;
32、在粒子的速度更新中引入了量子概率云,新的速度更新公式为:
33、;
34、其中,mbest(t)是群体粒子最佳位置的平均值,β是控制搜索范围的系数量子势阱宽度,是第i个粒子在第t次迭代的服从(0,1)均匀分布的随机数;
35、在位置更新中引入量子位的坍缩行为,以及混沌理论来增强多样性,新的位置更新公式为:
36、;
37、其中,xi(t+1)表示粒子下一时刻的位置,xi(t)表示粒子当前的位置,vi(t+1)表示粒子下一刻的速度,chao本文档来自技高网...
【技术保护点】
1.基于IPSO-CHRFA模型的海洋哺乳动物叫声分类方法,其特征在于,所述IPSO-CHRFA模型包括CBank-HN-GRU分类模型、IPSO改进的粒子群优化算法以及Flash Attention加速算法模块;
2.根据权利要求1所述的基于IPSO-CHRFA模型的海洋哺乳动物叫声分类方法,其特征在于,具体步骤包括:
3.根据权利要求2所述的基于IPSO-CHRFA模型的海洋哺乳动物叫声分类方法,其特征在于,所述S1步骤具体为:
4.根据权利要求2所述的基于IPSO-CHRFA模型的海洋哺乳动物叫声分类方法,其特征在于,所述S2步骤具体为:
5.根据权利要求2所述的基于IPSO-CHRFA模型的海洋哺乳动物叫声分类方法,其特征在于,所述S3步骤具体为:
6.根据权利要求2所述的基于IPSO-CHRFA模型的海洋哺乳动物叫声分类方法,其特征在于,所述S4步骤具体为:
7.根据权利要求2所述的基于IPSO-CHRFA模型的海洋哺乳动物叫声分类方法,其特征在于,所述S5步骤具体为:
【技术特征摘要】
1.基于ipso-chrfa模型的海洋哺乳动物叫声分类方法,其特征在于,所述ipso-chrfa模型包括cbank-hn-gru分类模型、ipso改进的粒子群优化算法以及flash attention加速算法模块;
2.根据权利要求1所述的基于ipso-chrfa模型的海洋哺乳动物叫声分类方法,其特征在于,具体步骤包括:
3.根据权利要求2所述的基于ipso-chrfa模型的海洋哺乳动物叫声分类方法,其特征在于,所述s1步骤具体为:
4.根据...
【专利技术属性】
技术研发人员:王景景,姜帅,刘钊,王猛,徐永道,王渝,程婉璐,鄢社锋,
申请(专利权)人:青岛科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。