一种基于双通道神经网络的鸟类物种识别方法技术

技术编号:16646694 阅读:33 留言:0更新日期:2017-11-26 22:00
本发明专利技术公开了一种基于双通道神经网络的鸟类物种识别方法,包括:采集已知种类的鸟鸣声信号并采用滤波、预加重、分割处理,得到预处理鸟鸣声信号;基于线性调频小波变换生成信号语图;截取符合预设帧长范围的鸟鸣声信号作为鸟鸣声时域信号;将信号语图作为第一通道的输入信号、鸟鸣声时域信号作为第二通道的输入信号、鸟鸣声信号对应的鸟类物种作为识别结果对构建的初步识别模型进行训练得到鸟类物种识别模型;将待识别的鸟鸣声信号经过同样处理得到的信号代入鸟类物种识别模型中进行识别,得到识别结果。所述基于双通道神经网络的鸟类物种识别方法充分利用鸣声信号的时域特征和时频特征,能够提高鸟类物种识别的效率和准确性。

A bird species identification method based on two channel neural network

The invention discloses a bird species recognition method, dual channel based on neural network including birdsong signal acquisition and filtering, using the known species of pre emphasis, segmentation, preprocessing the sound of birds chirp signal; wavelet transform signal generation based on language; with the sound of birds intercepted signal for a predetermined range as the frame length Birdsong time-domain signal; signal spectrogram as the input signal, the first channel of birdsong time-domain signal as input signals, second channel signals corresponding to birdsong bird species as the recognition results of the preliminary recognition model is trained by bird species recognition model; the signals into the same treatment the bird species recognition model in recognition of birdsong signal recognition, and get the recognition result. The bird species recognition method based on the dual channel neural network can make full use of the time domain characteristics and time-frequency characteristics of the vocal signals, which can improve the efficiency and accuracy of bird species recognition.

【技术实现步骤摘要】
一种基于双通道神经网络的鸟类物种识别方法
本专利技术涉及物种识别
,特别是指一种基于双通道神经网络的鸟类物种识别方法。
技术介绍
鸟类是生物多样性监测和生态环境影响评价的重要指标。通过鸟类物种的调查与监测可以了解鸟类资源现状,归纳鸟类物种的组成、数量和多样性等特征,利用这些特征能直接反映栖息地的环境质量、生态系统的健康程度、生物多样性状况、人类活动对生态系统的干扰程度以及土地利用和景观改变对生态系统的影响程度等。传统的鸟类调查方法主要是人工调查法,包括样线法、样点法和直接计数法。此类方法需要耗费大量人力、物力和财力,而且调查效果容易受到调查人员的视力、听力等主观因素的影响。近年来,红外相机技术在国内外野生动物调查与监测中得到了广泛应用。但是许多鸟类由于体型小、飞行速度快、活动区离地面较远,难以被红外相机捕获到清晰图像,增加了调查和监测结果的不确定性。因此红外相机技术更适用于大、中型地栖鸟类的监测,对于非地栖鸟类的监测效果并不理想。综上所述,传统的鸟类物种调查与监测方法存在不同的弊端,有必要研究新的方法弥补以上不足。研究发现,在物种的水平上,鸟类鸣声有一定的稳定性和明显的物种鉴别特征,是识别其物种的主要方式之一。以此为理论依据,利用声音采集设备以及鸟类识别软件,基于鸣声识别鸟类物种,实现鸟类物种调查与监测的方法,不仅可以克服上述缺点,而且是高效率、非损伤、低干扰、大范围的监测方法,具有巨大的应用前景。目前常用的鸟鸣声分类识别方法包括:1、基于模板匹配的分类方法,最具代表性的就是动态时间规整算法,该方法虽然识别精度较高,但是运算量太大,影响识别效率。2、建立基于特征的分类模型实现分类,常用的模型或方法有隐马尔可夫模型、高斯混合模型、支持向量机、随机森林、自主神经网络、k最近邻以及集成学习等,该类方法中手动提取合适的差异特征仍是一大瓶颈。因此,在实现本申请的过程中,专利技术人发现现有技术至少存在以下技术缺陷:当前的鸟类物种识别的方法需要耗费海量的人力物力,而且识别的结果准确度也不高,难以得到较好的识别效果。
技术实现思路
有鉴于此,本专利技术的目的在于提出一种基于双通道神经网络的鸟类物种识别方法,能够提高鸟类物种识别的效率和准确性。基于上述目的本专利技术提供的一种基于双通道神经网络的鸟类物种识别方法,包括:构建具有两个通道的初步识别模型,其中,第一通道针对于鸟鸣声信号的时频特征设定模型结构及参数,第二通道针对于鸟鸣声信号的时域特征设定模型结构及参数;采集已知种类的鸟鸣声信号并且对鸟鸣声信号采用滤波处理、预加重补偿处理、分割处理中的一种或者多种方式进行处理,得到预处理鸟鸣声信号;将所述预处理鸟鸣声信号基于线性调频小波变换生成信号语图;同时对所述预处理鸟鸣声信号截取符合预设帧长范围的鸟鸣声信号区段作为鸟鸣声时域信号;将信号语图作为第一通道的输入信号、鸟鸣声时域信号作为第二通道的输入信号、鸟鸣声信号对应的鸟类物种作为识别结果对初步识别模型进行训练,得到鸟类物种识别模型;将待识别的鸟鸣声信号经过滤波、预加重补偿以及分割处理,然后经过线性调频小波变换生成信号语图作为第一通道的输入信号、截取时间长度符合预设帧长范围的鸟鸣声信号作为第二通道的输入信号,代入所述鸟类物种识别模型中进行识别,得到鸟类物种识别结果。可选的,所述预加重补偿处理时的处理计算公式为:其中,为预加重补偿处理后的第n个采样值和x(n)为预加重补偿处理前的第n个采样值,λ为预加重系数。可选的,所述分割处理包括:利用希尔伯特变化提取出鸟鸣声信号的包络;判断包络的幅值是否小于预设的阈值;若是,则删除该段鸟鸣声信号,否则,保留该段鸟鸣声信号。可选的,所述将所述预处理鸟鸣声信号基于线性调频小波变换生成信号语图的步骤还包括:对预处理鸟鸣声信号进行分帧;利用汉明窗加窗弥补截断信号产生的频谱泄露,得到预设帧长的鸟鸣声信号;对每一帧鸟鸣声信号进行线性调频小波变换,将每一帧鸟鸣声信号展开成一系列线性调频小波基函数的线性组合;利用小波系数生成鸟鸣声信号对应的信号语图。可选的,所述线性调频小波基函数的计算表达式为:其中,t为时间、tc为时间中心、fc为频率中心、△t为持续时间、c为线性调频率。可选的,第二通道时域特性对应的预设帧长范围为5s-10s。可选的,所述第一通道中的模型结构包括:第一卷积层、第一池化层、第二卷积层、第二池化层、第一全连接层、第二全连接层;所述第二通道中的模型结构包括:第三卷积层、第三池化层、第四卷积层、第四池化层、第五卷积层、第五池化层、第六卷积层、第七卷积层、第三全连接层、第四全连接层;所述第二全连接层与第四全连接层连接到融合输出层。可选的,所述第一卷积层的卷积核大小为8×20,步长为2×1;第一池化层的池化核大小为2×2;第二卷积层的卷积核大小为8×20,步长为2×1;第二池化层的池化核大小为2×2;第一全连接层的节点数为200,Dropout为0.4;第二全连接层的节点数为50,Dropout为0.2;池化方式为最大池化,激活函数为Relu。可选的,所述第三卷积层的卷积核大小为64,步长为2;第三池化层的池化核大小为8,步长为2;所述第四卷积层的卷积核大小为32,步长为2;第四池化层的池化核大小为8,步长为2;所述第五卷积层的卷积核大小为16,步长为2;第五池化层的池化核大小为8,步长为2;所述第六卷积层的卷积核大小为8,步长为2;所述第七卷积层的卷积核大小为16,步长为2;第三全连接层的节点数为200,Dropout为0.4;第四全连接层的节点数为50,Dropout为0.2;池化方式为最大池化,激活函数为Relu。可选的,所述融合输出层的节点数为10且采用交叉熵损失函数。从上面所述可以看出,本专利技术提供的基于双通道神经网络的鸟类物种识别方法,通过构建具有两个通道的识别模型,使得能够同时对鸟类的时域特征和时频特征通过两个通道实现鸟类声音的综合识别。同时,本申请所述方法还通过对鸟鸣声信号进行预处理得到符合要求的初始声音数据,然后基于预处理鸟鸣声信号分别进行基于时频特征的语图变换以及基于时域特征的信号处理。所以,本申请基于双通道神经网络的鸟类物种识别方法通过采用鸟鸣声信号的两个特征进行物种识别,同时通过信号特征的融合提高识别的准确性。因此,本申请所述基于双通道神经网络的鸟类物种识别方法能够提高鸟类物种识别的效率和准确性。附图说明图1为本专利技术提供的一种基于双通道神经网络的鸟类物种识别方法的一个实施例的流程示意图;图2为本专利技术提供的鸟鸣声信号分割处理的一个实施例的效果示意图;图3为本专利技术提供的基于双通道神经网络的鸟类物种识别方法另一个实施例的流程示意图;图4为本专利技术提供的双通道深度卷积神经网络的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术进一步详细说明。需要说明的是,本专利技术实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本专利技术实施例的限定,后续实施例对此不再一一说明。针对于当前鸟类识别中存在识别效果不佳的问题,专利技术人认为虽然实际应用中的鸟鸣声复杂多变,但存在鸣叫和鸣唱两种主要类型。因此,有必要研究本文档来自技高网
...
一种基于双通道神经网络的鸟类物种识别方法

【技术保护点】
一种基于双通道神经网络的鸟类物种识别方法,其特征在于,包括:构建具有两个通道的初步识别模型,其中,第一通道针对于鸟鸣声信号的时频特征设定模型结构及参数,第二通道针对于鸟鸣声信号的时域特征设定模型结构及参数;采集已知种类的鸟鸣声信号并且对鸟鸣声信号采用滤波处理、预加重补偿处理、分割处理中的一种或者多种方式进行处理,得到预处理鸟鸣声信号;将所述预处理鸟鸣声信号基于线性调频小波变换生成信号语图;同时对所述预处理鸟鸣声信号截取符合预设帧长范围的鸟鸣声信号区段作为鸟鸣声时域信号;将信号语图作为第一通道的输入信号、鸟鸣声时域信号作为第二通道的输入信号、鸟鸣声信号对应的鸟类物种作为识别结果对初步识别模型进行训练,得到鸟类物种识别模型;将待识别的鸟鸣声信号经过滤波、预加重补偿以及分割处理,然后经过线性调频小波变换生成信号语图作为第一通道的输入信号、截取时间长度符合预设帧长范围的鸟鸣声信号作为第二通道的输入信号,代入所述鸟类物种识别模型中进行识别,得到鸟类物种识别结果。

【技术特征摘要】
1.一种基于双通道神经网络的鸟类物种识别方法,其特征在于,包括:构建具有两个通道的初步识别模型,其中,第一通道针对于鸟鸣声信号的时频特征设定模型结构及参数,第二通道针对于鸟鸣声信号的时域特征设定模型结构及参数;采集已知种类的鸟鸣声信号并且对鸟鸣声信号采用滤波处理、预加重补偿处理、分割处理中的一种或者多种方式进行处理,得到预处理鸟鸣声信号;将所述预处理鸟鸣声信号基于线性调频小波变换生成信号语图;同时对所述预处理鸟鸣声信号截取符合预设帧长范围的鸟鸣声信号区段作为鸟鸣声时域信号;将信号语图作为第一通道的输入信号、鸟鸣声时域信号作为第二通道的输入信号、鸟鸣声信号对应的鸟类物种作为识别结果对初步识别模型进行训练,得到鸟类物种识别模型;将待识别的鸟鸣声信号经过滤波、预加重补偿以及分割处理,然后经过线性调频小波变换生成信号语图作为第一通道的输入信号、截取时间长度符合预设帧长范围的鸟鸣声信号作为第二通道的输入信号,代入所述鸟类物种识别模型中进行识别,得到鸟类物种识别结果。2.根据权利要求1所述的方法,其特征在于,所述预加重补偿处理时的处理计算公式为:其中,为预加重补偿处理后的第n个采样值和x(n)为预加重补偿处理前的第n个采样值,λ为预加重系数。3.根据权利要求1所述的方法,其特征在于,所述分割处理包括:利用希尔伯特变化提取出鸟鸣声信号的包络;判断包络的幅值是否小于预设的阈值;若是,则删除该段鸟鸣声信号,否则,保留该段鸟鸣声信号。4.根据权利要求1所述的方法,其特征在于,所述将所述预处理鸟鸣声信号基于线性调频小波变换生成信号语图的步骤还包括:对预处理鸟鸣声信号进行分帧;利用汉明窗加窗弥补截断信号产生的频谱泄露,得到预设帧长的鸟鸣声信号;对每一帧鸟鸣声信号进行线性调频小波变换,将每一帧鸟鸣声信号展开成一系列线性调频小波基函数的线性组合;利用小波系数生成鸟鸣声信号对应的信号语图。5.根据权利要求4所述的方法,其特...

【专利技术属性】
技术研发人员:谢将剑李文彬丁长青刘文定冯郁茜张博闻
申请(专利权)人:北京林业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1