融合视觉显著性的鸟类识别方法和系统技术方案

技术编号:37453589 阅读:12 留言:0更新日期:2023-05-06 09:25
本申请公开了一种融合视觉显著性的鸟类识别方法和系统,本方法包括获取待检测的图像;利用残差谱对待检测的图像进行处理,得到频域显著图;利用全局对比度对待检测图像的Lab颜色域处理获得时域全局性特征显著图;利用局部对比度对待检测图像的RGB颜色域进行处理获得时域局部特征显著图;将待检测图像、频域显著图、时域全局性特征以及时域局部特征显著图融合为多通道图像,得到输入图像;利用图像识别模型对输入图像进行预测,确定输入图像中鸟类的位置和分类。中鸟类的位置和分类。中鸟类的位置和分类。

【技术实现步骤摘要】
融合视觉显著性的鸟类识别方法和系统


[0001]本申请涉及图像识别技术,特别是一种融合视觉显著性的鸟类识别方法和系统。

技术介绍

[0002]“鸟撞”指的是天空中的飞鸟与飞行的飞机发生碰撞事件。飞鸟虽然体积小,质量轻,由于飞鸟与飞行的飞机相对速度特别大,因此“鸟撞”事件容易导致飞机损坏,直接影响航班飞行,严重情况甚至可能导致机毁人亡。因此,防止“鸟撞”事件对航空安全十分重要且有意义。
[0003]基于人工识别与驱赶的方式十分耗时耗力,且难以做到实时监控。深度学习相较于人工特征能够实现自主特征提取,具有更强的泛化能力。
[0004]针对机场鸟类识别应用场景存在背景环境复杂、天气情况多变、鸟类目标姿态多样性的情况,深度学习虽然具有自主提取特征的优势,但也会捕捉一些不重要的特征,容易减弱模型的辨别能力,降低模型性能。

技术实现思路

[0005]本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术提出一种融合视觉显著性的鸟类识别方法和系统,以在复杂环境中准确识别出鸟类。
[0006]一方面,本申请实施例提供了一种融合视觉显著性的鸟类识别方法,包括:
[0007]获取待检测的图像;
[0008]利用残差谱对待检测的图像进行处理,得到频域显著图;
[0009]利用全局对比度对待检测图像的Lab颜色域处理获得时域全局性特征显著图;
[0010]利用局部对比度对待检测图像的RGB颜色域进行处理获得时域局部特征显著图;
[0011]将待检测图像、频域显著图、时域全局性特征以及时域局部特征显著图融合为多通道图像,得到输入图像;
[0012]利用图像识别模型对输入图像进行预测,确定输入图像中鸟类的位置和分类。
[0013]在一些实施例中,所述利用残差谱对待检测的图像进行处理,得到频域显著图,具体是:
[0014]对待检测的图像进行灰度化处理,获得灰度图像;
[0015]基于对数谱与对数谱的均值之差获得频域显著图像。
[0016]在一些实施例中,所述频域显著图像以S1表示,其中,
[0017]S1=g(x)*F
‑1[exp(R(f)+P(f))]2;
[0018]g(x)表示对残差普获得的显著特征进行高斯滤波操作,F
‑1表示快速傅里叶逆变换,P(f)表示相位谱,其中R(f)表示残差谱;
[0019]P(f)=S(F[I_gray(x)]);
[0020]R(f)=L(f)

h
n
(f)*L(f);
[0021]h
n
(f)表示均值滤波操作,n表示滤波器窗口大小,L(f)表示对数谱,即对傅里叶变
换获得的幅度谱取对数运算;
[0022]R(f)=log(R(F[I_gray(x)]));
[0023]其中,F表示快速傅里叶变换。
[0024]在一些实施例中,所述利用全局对比度对待检测图像的Lab颜色域处理获得时域全局性特征显著图,具体是:
[0025]将待检测图像的颜色空间域转换成Lab颜色空间域;
[0026]按照以下公式进行处理得到时域全局性特征显著图S2;
[0027][0028]其中c表示遍历Lab三个通道层,a
c
表示三个通道分别计算的视觉显著图进行加权的权重值,经验值为1/c,n表示颜色值覆盖范围,f
j
表示颜色值j出现的频率,D(V
cx
,V
cj
)表示颜色值x与颜色值j之间的颜色距离。
[0029]在一些实施例中,所述利用局部对比度对待检测图像的RGB颜色域进行处理获得时域局部特征显著图,具体是:
[0030]将待检测图像的颜色空间域转换成RGB颜色空间;
[0031]按照以下公式处理得到时域局部特征显著图S3;
[0032]其中,
[0033]设像素点x为R1和R2的中心点,R1边长小于R2,局部对比度体现在第一窗口R1区域的颜色值均值与第二窗口R2区域的颜色值均值的距离,距离度量D采用欧式距离,时域局部特征显著图S3由分别处理RGB三通道获得显著图加权融合获得。
[0034]在一些实施例中,所述多通道图像是六通道图像;
[0035]所述图像识别模型是输入层为通道数为6的yolov5模型。
[0036]在一些实施例中,所述yolov5模型包括:
[0037]特征挖掘层,用于对原始图像的视觉显著性特征进行挖掘;
[0038]特征提取网络,用于对输入图像进行特征提取;
[0039]SPP模块与PANet网络,用于对卷积层提取的特征进行进一步提取;
[0040]检测头部分,用于对目标位置提取和类别的划分。
[0041]在一些实施例中,所述特征提取网络包括多个卷积模型,其中,在最后一个卷积模型中设置有注意力机制模块。
[0042]在一些实施例中,还包括以下步骤:
[0043]在识别出鸟类位置和类型后执行相应的驱赶程序。
[0044]另一方面,本申请实施例提供了一种融合视觉显著性的鸟类识别系统,包括:
[0045]存储器,用于存储程序;
[0046]处理器,用于加载所述程序以执行所述的方法。
[0047]本申请实施例通过对原始图像进行更多特征的挖掘,抽取频域显著图、时域全局性特征以及时域局部特征显著图,并将这些挖掘的特征图与原始图像进行融合处理成多通道图像,并交给识别网络进行位置识别和分类,相对于现有技术,可以提高模型有效信息的学习,提高鸟类识别模型的识别率。
附图说明
[0048]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0049]图1是本申请实施例提供的一种鸟类识别方法的步骤流程图;
[0050]图2是本申请实施例提供的一种鸟类识别模型的结构示意图;
[0051]图3是本申请实施例提供的一种ConvBlock融合注意力机制示意图;
[0052]图4是本申请实施例提供的一种R1和R2的关系示意图。
具体实施方式
[0053]为使本申请的目的、技术方案和优点更加清楚,以下将参照本申请实施例中的附图,通过实施方式清楚、完整地描述本申请的技术方案,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0054]在本专利技术的描述中,若干的含义是一个以上,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合视觉显著性的鸟类识别方法,其特征在于,包括:获取待检测的图像;利用残差谱对待检测的图像进行处理,得到频域显著图;利用全局对比度对待检测图像的Lab颜色域处理获得时域全局性特征显著图;利用局部对比度对待检测图像的RGB颜色域进行处理获得时域局部特征显著图;将待检测图像、频域显著图、时域全局性特征以及时域局部特征显著图融合为多通道图像,得到输入图像;利用图像识别模型对输入图像进行预测,确定输入图像中鸟类的位置和分类。2.根据权利要求1所述的融合视觉显著性的鸟类识别方法,其特征在于,所述利用残差谱对待检测的图像进行处理,得到频域显著图,具体是:对待检测的图像进行灰度化处理,获得灰度图像;基于对数谱与对数谱的均值之差获得频域显著图像。3.根据权利要求2所述的融合视觉显著性的鸟类识别方法,其特征在于,所述频域显著图像以S1表示,其中,S1=g(x)*F
‑1[exp(R(f)+P(f))]2;g(x)表示对残差普获得的显著特征进行高斯滤波操作,F
‑1表示快速傅里叶逆变换,P(f)表示相位谱,其中R(f)表示残差谱;P(f)=S(F[I_gray(x)]);R(f)=L(f)

h
n
(f)*L(f);h
n
(f)表示均值滤波操作,n表示滤波器窗口大小,L(f)表示对数谱,即对傅里叶变换获得的幅度谱取对数运算;R(f)=log(R(F[I_gray(x)]));其中,F表示快速傅里叶变换。4.根据权利要求1所述的融合视觉显著性的鸟类识别方法,其特征在于,所述利用全局对比度对待检测图像的Lab颜色域处理获得时域全局性特征显著图,具体是:将待检测图像的颜色空间域转换成Lab颜色空间域;按照以下公式进行处理得到时域全局性特征显著图S2;其中c表示遍历Lab三个通道层,a
c
表示三个通道...

【专利技术属性】
技术研发人员:祝礼佳
申请(专利权)人:广州辰创科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1