【技术实现步骤摘要】
一种机载光电视频目标智能化检测与识别方法
本专利技术涉及机载光电雷达检测与识别
,特别涉及一种基于嵌入式系统的可见光视频目标实时检测与识别方法,适用于高速运动的机载平台上对可见光相机传感器采集的空、海、地多类型目标图像进行准确、实时检测与识别。
技术介绍
基于嵌入式系统实现航拍图像目标实时检测与识别是计算机视觉领域的重要研究方向之一,其在计算资源有限的嵌入式设备上提取并利用目标特征信息,定位图像中的目标、并对搜索到的多类型目标进行分类,在军事目标侦查、航空搜索救援、遥感影像解析等领域应用前景广阔。在机载光电传感器航拍图像目标检测与识别中,受到载机平台高速运动条件的约束,目标环境及拍摄角度不断变化,高空航拍图像中的目标形态多样,目标长宽比、颜色以及角度等用于检测的关键特征变化复杂。因此,采用如梯度方向直方图(HistogramofOrientedGradients,HOG)等人工设计特征的形变部件模型(DeformablePartsModels,DPM)目标检测与识别方法难以应对上述复杂环境下的多类型目标检测与识别任务。近年来,深度学习技术中的卷积神经网络展现了优秀的目标视觉特征提取和表示能力,尤其适用于复杂环境下的目标检测,如YOLO(YouOnlyLookOnce)等目标检测方法被广泛应用于自然图像目标检测与识别任务中。但是YOLO方法也没有充分考虑并利用航拍图像中的目标特征;而且YOLO方法将在图像不同区域、特征图不同通道、以及神经网络不同层提取的特征同等对待,这将导致模型进行决策时受到更多的冗余特 ...
【技术保护点】
1.一种机载光电视频目标智能化检测与识别方法,其特征在于,包括以下步骤:/n步骤1:构建特征提取基础网络,在YOLOv3的卷积神经网络中引入不同膨胀系数的膨胀卷积代替普通卷积,扩大感受野并保留多尺度目标空间结构信息,采用可分离卷积方式对特征图进行分组卷积运算减少计算量,提取并获得目标特征信息;/n步骤2:构建特征金字塔上采样分支分别处理不同尺度目标特征,在YOLOv3的特征金字塔各尺度分支上引入空间注意力机制和通道和注意力机制,对不同空间位置和不同通道的特征赋予不同权重;/n步骤3:在YOLOv3模型的损失函数基础上,引入交并比损失和长宽比损失,构建新的损失函数,并以误差最小化为优化目标,训练目标检测模型;/n步骤4:在嵌入式开发板TX2上移植并实现上述方法,加载步骤3中训练完成的目标检测模型,采集并输入航拍图像,利用上述模型检测航拍图像中的目标,得到目标位置坐标及类型,可视化输出。/n
【技术特征摘要】
1.一种机载光电视频目标智能化检测与识别方法,其特征在于,包括以下步骤:
步骤1:构建特征提取基础网络,在YOLOv3的卷积神经网络中引入不同膨胀系数的膨胀卷积代替普通卷积,扩大感受野并保留多尺度目标空间结构信息,采用可分离卷积方式对特征图进行分组卷积运算减少计算量,提取并获得目标特征信息;
步骤2:构建特征金字塔上采样分支分别处理不同尺度目标特征,在YOLOv3的特征金字塔各尺度分支上引入空间注意力机制和通道和注意力机制,对不同空间位置和不同通道的特征赋予不同权重;
步骤3:在YOLOv3模型的损失函数基础上,引入交并比损失和长宽比损失,构建新的损失函数,并以误差最小化为优化目标,训练目标检测模型;
步骤4:在嵌入式开发板TX2上移植并实现上述方法,加载步骤3中训练完成的目标检测模型,采集并输入航拍图像,利用上述模型检测航拍图像中的目标,得到目标位置坐标及类型,可视化输出。
2.根据权利要求1所述的方法,其特征在于:步骤1包括如下子步骤:
步骤1.1:以YOLOv3的darknet53特征提取网络为基础,将darknet53网络每个残差模块的步长为2的卷积下采样层替换为膨胀卷积层,不丢失分辨率的前提下扩大感受野,提高目标定位精度;膨胀卷积核尺
k'=k+(k-1)(r-1)(1)
式中,k为原始卷积核尺寸,r为膨胀系数;
步骤1.2:采用深度可分离卷积改进YOLOv3原有的残差模块卷积计算方式:首先,采用1×1逐点卷积对特征在通道方向进行升维;其次,采用深度可分离卷积在特征图的通道上分别进行卷积提取目标特征,设输入的特征图尺寸为W×H×C其中W×H×C分别表示特征图的宽、高和数量,则深度可分离卷积共需要C个尺寸为k×k卷积核进行卷积运算,最后再采用1×1逐点卷积对特征在通道方向进行降维得到当前深度可分离卷积残差模块的输出;深度可分离卷积的计算复杂度
O=W×H×C×k×k+1×1×C×N×W×H(2)
式中N表示深度可分离卷积输出的特征图数量。
3.根据权利要求1所述的方法,其特征在于:步骤2包括如下子步骤:
步骤2.1:对步骤1中基础网络提取的特征图进行不同尺度的上采样,并与基础网络中卷积-下采样得到的相同尺寸特征图进行横向连接,构建特征金字塔结构;
步骤2.2:针对桥梁等尺寸较大的条状目标,在三个特征金字塔分支的最底层分支中增加长方形卷积核提取目标特征;
步骤2.3:在YOLOv3的多尺度特征金字塔分支上引入通道注意力机制对不同通道的特征赋予不同权重;设通...
【专利技术属性】
技术研发人员:陶然,李伟,黄展超,马鹏阁,揭斐然,
申请(专利权)人:北京理工大学,郑州航空工业管理学院,中国航空工业集团公司洛阳电光设备研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。