The invention discloses a bird song feature enhancement method based on image processing, which relates to image processing, in-depth learning and bird recognition technology. The method is as follows: (1) Preprocessing the data set of bird song, including resampling and normalization, to obtain the spectrum of bird song; (2) Separating the signal and noise from the spectrum, to get the spectrum of signal and noise; (3) dividing all the spectrum into blocks; (4) Data enhancement of the signal spectrum after block; (5) Pseudo-color processing of the gray image after data enhancement through Jet mapping Three-channel RGB color images are obtained. _The recognition results are obtained by transfer learning. The beneficial effects of the present invention are: (1) for efficient automatic bird recognition; (2) by converting the bird song signal in one-dimensional time domain into the bio-spectral information in two-dimensional time-frequency domain; (3) image processing includes: separation of the bird song signal and noise, enhancement of specific data and enhancement of visual perception, which further explores the field of bird automatic recognition for in-depth learning.
【技术实现步骤摘要】
一种基于图像处理的鸟鸣声特征强化方法
本专利技术涉及图像处理、深度学习和鸟类识别
,特别是涉及一种基于图像处理的鸟鸣声特征强化方法。
技术介绍
生物多样性是人类赖以生存的条件,是社会可持续发展的战略资源,是生态安全和粮食安全的重要保障。由于分布范围广、研究资料齐全和对环境的敏感性,鸟类是生物多样性的重要指示类群。掌握鸟类种群现状及其动态变化信息,对保护和评估生态系统都具有重要意义。鸟类鸣声多种多样,包含了重要的行为意义、物种特异性和丰富的生物学信息,同时也是对其进行物种识别的主要手段。鸟鸣声的分类学意义,目前已成为鸟声研究与鸟类系统分类学研究交叉的热点。生物频谱作为声景观生态学理论分析的重要组成部分,是监测、研究和分析生态系统多样性的重要途径。利用适当的方法对其进行分析能够充分展现声音的时频特性,从而有效地识别出生物的差异性。鸟鸣声谱图作为研究鸟的物种属性的重要途径,其频谱分析对鸟类多样性监测至关重要。深度学习是目前机器学习学科发展最蓬勃的分支,也是整个人工智能领域中应用前景最为广阔的技术。随着深度学习在计算机视觉领域的不断突破,运用其处理图像识别任务已成为一种高效且专业的技术。在该技术背景的支持下,本专利技术结合鸟鸣声特性,对鸟鸣声谱图进行了针对性的处理。
技术实现思路
本专利技术旨在提供一种基于图像处理的鸟鸣声特征强化方法,以解决现有技术在识别过程中的鸣声特征不突出、噪声干扰严重和生物频谱信息不全面的问题。为实现上述目的,本专利技术的技术方案为:具体地说,一种基于图像处理的鸟鸣声特征强化方法包括以下步骤:①对鸟鸣声数据集进行预处理,包括重采样和归一化 ...
【技术保护点】
1.一种基于图像处理的鸟鸣声特征强化方法,其特征在于包括以下步骤:①对鸟鸣声数据集进行预处理,包括重采样和归一化,得到鸟鸣声的频谱图;②对频谱图进行信噪分离,得到信号谱图和噪声谱图;其中,信号谱图包含鸣唱和鸣叫部分,噪声谱图包含噪音和静音部分,信号谱图作为原始训练样本,噪声谱图用于背景噪声增强的一种途径;③对步骤②中信噪分离后的所有频谱图进行分块,并调整每小块频谱图的大小以适合用于训练的神经网络的输入维度;④对步骤③中分块后的信号谱图进行数据增强,由于频谱图不同于传统图像,之间的差异限制了广泛的图像处理技术的直接应用;综合考量鸟鸣声和频谱图的特性,本数据增强处理特别方法包括频域变换、噪声添加和同类样本混合:⑤为增强灰度图像的视觉感知力,同时方便对不同的神经网络进行迁移学习,通过Jet映射对数据增强后的灰度图像进行伪彩色处理,得到三通道RGB彩色图像,将这些三通道RGB彩色图像分为训练集和测试集,其中训练集占80%,测试集占20%;⑥通过迁移学习方式,选取合适的神经网络模型,对其进行微调并使用步骤⑤中的训练集进行训练,最终通过验证集验证模型准确率,得到识别结果。
【技术特征摘要】
1.一种基于图像处理的鸟鸣声特征强化方法,其特征在于包括以下步骤:①对鸟鸣声数据集进行预处理,包括重采样和归一化,得到鸟鸣声的频谱图;②对频谱图进行信噪分离,得到信号谱图和噪声谱图;其中,信号谱图包含鸣唱和鸣叫部分,噪声谱图包含噪音和静音部分,信号谱图作为原始训练样本,噪声谱图用于背景噪声增强的一种途径;③对步骤②中信噪分离后的所有频谱图进行分块,并调整每小块频谱图的大小以适合用于训练的神经网络的输入维度;④对步骤③中分块后的信号谱图进行数据增强,由于频谱图不同于传统图像,之间的差异限制了广泛的图像处理技术的直接应用;综合考量鸟鸣声和频谱图的特性,本数据增强处理特别方法包括频域变换、噪声添加和同类样本混合:⑤为增强灰度图像的视觉感知力,同时方便对不同的神经网络进行迁移学习,通过Jet映射对数据增强后的灰度图像进行伪彩色处理,得到三通道RGB彩色图像,将这些三通道RGB彩色图像分为训练集和测试集,其中训练集占80%,测试集占20%;⑥通过迁移学习方式,选取合适的神经网络模型,...
【专利技术属性】
技术研发人员:杨春勇,祁宏达,侯金,陈少平,
申请(专利权)人:中南民族大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。