一种基于图像处理的鸟鸣声特征强化方法技术

技术编号：21362479 阅读：68 留言：0更新日期：2019-06-15 09:33

本发明专利技术公开了一种基于图像处理的鸟鸣声特征强化方法，涉及图像处理、深度学习和鸟类识别技术。本方法是：①对鸟鸣声数据集进行预处理，包括重采样和归一化，得到鸟鸣声的频谱图；②对频谱图进行信噪分离，得到信号谱图和噪声谱图；③对所有频谱图进行分块；④对分块后的信号谱图进行数据增强：⑤通过Jet映射对数据增强后的灰度图像进行伪彩色处理，得到三通道RGB彩色图像；⑥通过迁移学习方式，得到识别结果。本发明专利技术的有益效果是：①用于高效地进行鸟类自动识别；②通过将一维时域的鸟鸣声信号转换为二维时频域的生物频谱信息；③图像处理包括：鸟鸣声信噪分离、特异性数据增强和视觉感知力增强，为深度学习在鸟类自动识别领域的探索更进一步。

A Method of Bird Singing Feature Enhancement Based on Image Processing

The invention discloses a bird song feature enhancement method based on image processing, which relates to image processing, in-depth learning and bird recognition technology. The method is as follows: (1) Preprocessing the data set of bird song, including resampling and normalization, to obtain the spectrum of bird song; (2) Separating the signal and noise from the spectrum, to get the spectrum of signal and noise; (3) dividing all the spectrum into blocks; (4) Data enhancement of the signal spectrum after block; (5) Pseudo-color processing of the gray image after data enhancement through Jet mapping Three-channel RGB color images are obtained. _The recognition results are obtained by transfer learning. The beneficial effects of the present invention are: (1) for efficient automatic bird recognition; (2) by converting the bird song signal in one-dimensional time domain into the bio-spectral information in two-dimensional time-frequency domain; (3) image processing includes: separation of the bird song signal and noise, enhancement of specific data and enhancement of visual perception, which further explores the field of bird automatic recognition for in-depth learning.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图像处理的鸟鸣声特征强化方法
本专利技术涉及图像处理、深度学习和鸟类识别
，特别是涉及一种基于图像处理的鸟鸣声特征强化方法。
技术介绍
生物多样性是人类赖以生存的条件，是社会可持续发展的战略资源，是生态安全和粮食安全的重要保障。由于分布范围广、研究资料齐全和对环境的敏感性，鸟类是生物多样性的重要指示类群。掌握鸟类种群现状及其动态变化信息，对保护和评估生态系统都具有重要意义。鸟类鸣声多种多样，包含了重要的行为意义、物种特异性和丰富的生物学信息，同时也是对其进行物种识别的主要手段。鸟鸣声的分类学意义，目前已成为鸟声研究与鸟类系统分类学研究交叉的热点。生物频谱作为声景观生态学理论分析的重要组成部分，是监测、研究和分析生态系统多样性的重要途径。利用适当的方法对其进行分析能够充分展现声音的时频特性，从而有效地识别出生物的差异性。鸟鸣声谱图作为研究鸟的物种属性的重要途径，其频谱分析对鸟类多样性监测至关重要。深度学习是目前机器学习学科发展最蓬勃的分支，也是整个人工智能领域中应用前景最为广阔的技术。随着深度学习在计算机视觉领域的不断突破，运用其处理图像识别任务已成为一种高效且专业的技术。在该技术背景的支持下，本专利技术结合鸟鸣声特性，对鸟鸣声谱图进行了针对性的处理。
技术实现思路
本专利技术旨在提供一种基于图像处理的鸟鸣声特征强化方法，以解决现有技术在识别过程中的鸣声特征不突出、噪声干扰严重和生物频谱信息不全面的问题。为实现上述目的，本专利技术的技术方案为：具体地说，一种基于图像处理的鸟鸣声特征强化方法包括以下步骤：①对鸟鸣声数据集进行预处理，包括重采样和归一化...

【技术保护点】
1.一种基于图像处理的鸟鸣声特征强化方法，其特征在于包括以下步骤：①对鸟鸣声数据集进行预处理，包括重采样和归一化，得到鸟鸣声的频谱图；②对频谱图进行信噪分离，得到信号谱图和噪声谱图；其中，信号谱图包含鸣唱和鸣叫部分，噪声谱图包含噪音和静音部分，信号谱图作为原始训练样本，噪声谱图用于背景噪声增强的一种途径；③对步骤②中信噪分离后的所有频谱图进行分块，并调整每小块频谱图的大小以适合用于训练的神经网络的输入维度；④对步骤③中分块后的信号谱图进行数据增强，由于频谱图不同于传统图像，之间的差异限制了广泛的图像处理技术的直接应用；综合考量鸟鸣声和频谱图的特性，本数据增强处理特别方法包括频域变换、噪声添加和同类样本混合：⑤为增强灰度图像的视觉感知力，同时方便对不同的神经网络进行迁移学习，通过Jet映射对数据增强后的灰度图像进行伪彩色处理，得到三通道RGB彩色图像，将这些三通道RGB彩色图像分为训练集和测试集，其中训练集占80%，测试集占20%；⑥通过迁移学习方式，选取合适的神经网络模型，对其进行微调并使用步骤⑤中的训练集进行训练，最终通过验证集验证模型准确率，得到识别结果。

【技术特征摘要】
1.一种基于图像处理的鸟鸣声特征强化方法，其特征在于包括以下步骤：①对鸟鸣声数据集进行预处理，包括重采样和归一化，得到鸟鸣声的频谱图；②对频谱图进行信噪分离，得到信号谱图和噪声谱图；其中，信号谱图包含鸣唱和鸣叫部分，噪声谱图包含噪音和静音部分，信号谱图作为原始训练样本，噪声谱图用于背景噪声增强的一种途径；③对步骤②中信噪分离后的所有频谱图进行分块，并调整每小块频谱图的大小以适合用于训练的神经网络的输入维度；④对步骤③中分块后的信号谱图进行数据增强，由于频谱图不同于传统图像，之间的差异限制了广泛的图像处理技术的直接应用；综合考量鸟鸣声和频谱图的特性，本数据增强处理特别方法包括频域变换、噪声添加和同类样本混合：⑤为增强灰度图像的视觉感知力，同时方便对不同的神经网络进行迁移学习，通过Jet映射对数据增强后的灰度图像进行伪彩色处理，得到三通道RGB彩色图像，将这些三通道RGB彩色图像分为训练集和测试集，其中训练集占80%，测试集占20%；⑥通过迁移学习方式，选取合适的神经网络模型，...

【专利技术属性】
技术研发人员：杨春勇，祁宏达，侯金，陈少平，
申请(专利权)人：中南民族大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人