基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法技术

技术编号:35901216 阅读:58 留言:0更新日期:2022-12-10 10:37
本发明专利技术公开了一种基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法,该方法:首先,通过通道并行注意力模块表征任意时刻发声的时间帧和所有振动声音频率之间的相关性,构造鸟鸣声全局时频依赖关系,其次,通过挤压激励注意力模块自适应地校准特征图中不同通道所携带鸟鸣声信息的重要程度,最后将两个模块并行融合构成双并行注意力机制用于构造全局特征依赖关系。本发明专利技术提出的双并行注意力机制灵活地嵌入浅层卷积神经网络中,并且以较低的计算量在鸟鸣声数据集BirdsData上取得了98.1%的识别精度。98.1%的识别精度。98.1%的识别精度。

【技术实现步骤摘要】
基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法


[0001]本专利技术涉及一种基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法。

技术介绍

[0002]鸟类物种多样性是评估生态环境质量的重要生物指标,同时也反映了其栖息地的物种丰富程度,识别鸟类种群是评估鸟类物种多样性的关键步骤。采集鸟类鸣叫声,通过鸟鸣声识别鸟类种群具有,设备部署简单,不受树木等环境因素遮挡等优点。因此,鸟鸣声识别具有不可替代的作用。
[0003]目前鸟鸣声识别大多基于深度学习方法。先通过短时傅里叶变化等操作将鸟鸣声可视化为频谱图等特征,其次,采用卷积神经网络捕获频谱图中局部区域上时频变化信息来对鸟鸣声进行分类。也有研究人员,采用循环神经网络构造鸟鸣声连续时序信息变换建模时间维度特性识别鸟鸣声。目前最新研究中,采用注意力机制对鸟鸣声时序位置信息进行权重再分配,重新建模时序特征关联度。然而,上述方法中,仅从局部位置信息感知鸟鸣声,并未考虑到鸟鸣声时序信息和发声频率间的关系以及各个通道中鸟鸣声特征的关联度,因而识别的准确率较低。
[0004]因此,有必要设计一本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法,其特征在于,包括以下步骤:步骤1:采用通道并行注意力模块对鸟鸣声特征图X进行操作,表示为F
PCA
(X);步骤2:采用挤压激励注意力模块对鸟鸣声特征图X进行操作,表示为F
SEA
(X);步骤3:将通道并行注意力模块和挤压激励注意力模块并行地融合到一个整体中,表示为F
DPA
(X)=F
PCA
(X)+F
SEA
(X)+X;得到融合处理后的鸟鸣声特征图;基于融合处理后的的鸟鸣声特征图对鸟鸣声进行识别。2.根据权利要求1所述的基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法,其特征在于,F
PCA
(X)=W((σ((φ(X))
T
ψ(X))(θ(X))
T
)
T
)+X;其中鸟鸣声特征图X有m个通道,X=(X1,X2,...,X
m
‑1,X
m
),其中X
i
...

【专利技术属性】
技术研发人员:陈爱斌温治芳向进胡世鹏
申请(专利权)人:中南林业科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1