一种知识与数据协同驱动的无人机航拍目标检测方法技术

技术编号:34356043 阅读:36 留言:0更新日期:2022-07-31 06:36
本发明专利技术公开了一种知识与数据协同驱动的无人机航拍目标检测方法,包括:步骤1,准备无人机航拍场景下的训练数据集;步骤2,基于训练数据集,利用先验常识构建知识图谱;步骤3,构建无人机航拍目标检测网络模型;步骤4,基于训练数据集和知识图谱,训练所述无人机航拍目标检测网络模型,获得训练后的无人机航拍目标检测网络模型;步骤5,利用训练后的无人机航拍目标检测网络模型对输入的测试图片进行测试,获得目标定位和分类结果。与传统方法相比,本方法引入先验常识,充分利用目标之间的语义关系和空间关系,更容易检测出无人机航拍复杂场景下的弱小目标,提高无人机航拍目标检测的准确率。率。率。

【技术实现步骤摘要】
一种知识与数据协同驱动的无人机航拍目标检测方法


[0001]本专利技术属于目标检测领域,具体涉及到一种知识与数据协同驱动的无人机航拍目标检测方法。

技术介绍

[0002]目标检测是计算机视觉领域的基本任务之一,它的任务是找出图像中所有的目标,并确定目标的类别、位置,在智能化交通系统、人脸识别、医学图像检测等领域具有广泛的应用价值。近些年随着深度学习技术的火热发展,目标检测算法也从基于手工设计特征的传统算法转向了基于深度神经网络的检测技术。目前基于深度学习的目标检测算法可分为基于候选框的两阶段目标检测算法和基于回归的单阶段目标检测算法。前者平均检测精度更高,后者检测速度更快。
[0003]尽管这两类主流算法通过不断的改进,在检测精度与速度上面得到很大提升,然而在无人机航拍场景下依然面临诸多挑战。无人机航拍图像相较于通用数据集图像,其背景更加复杂,物体尺度变化更大,目标分布更加密集。同时这些主流算法的共同点是单独处理每个对象区域而不考虑目标之间的关键语义关系和空间分布关系,因此在无人机航拍场景下进行目标检测往往不确定性高,误检率大。
...

【技术保护点】

【技术特征摘要】
1.一种知识与数据协同驱动的无人机航拍目标检测方法,其特征在于,包括:步骤1,准备无人机航拍场景下的训练数据集;步骤2,基于训练数据集,利用先验常识构建知识图谱;步骤3,构建无人机航拍目标检测网络模型;步骤4,基于训练数据集和知识图谱,训练所述无人机航拍目标检测网络模型,获得训练后的无人机航拍目标检测网络模型;步骤5,利用训练后的无人机航拍目标检测网络模型对输入的测试图片进行测试,获得目标定位和分类结果。2.根据权利要求1所述的一种知识与数据协同驱动的无人机航拍目标检测方法,其特征在于,步骤3中所述无人机航拍目标检测网络模型包括深度特征提取模块、语义关系模块、空间关系模块、注意力融合模块和分类模块,所述深度特征提取模块,用于提取输入的无人机航拍图片的候选框位置和候选区原始特征;所述语义关系模块,用于基于所述知识图谱和无人机航拍图片候选区原始特征,获得无人机航拍图片的语义特征;所述空间关系模块,用于基于无人机航拍图片的候选区位置和候选区原始特征,获得无人机航拍图片的空间特征;所述注意力融合模块,用于基于无人机航拍图片的语义特征和空间特征,获得无人机航拍图片的强化特征;所述分类模块,用于基于无人机航拍图片的强化特征,获得无人机航拍图片对应的目标检测结果。3.根据权利要求2所述的一种知识与数据协同驱动的无人机航拍目标检测方法,其特征在于,步骤2包括:从所述训练数据集抽取出所有的目标类,基于人类先验常识,构建<物体1,关系,物体2>的三元组,使用图数据库Neo4j进行存储并构建所述训练数据集对应的知识图谱,所述知识图谱的邻接矩阵记为X,,N为知识图谱中节点的个数,D为每个节点的特征向量的维度。4.根据权利要求3所述的一种知识与数据协同驱动的无人机航拍目标检测方法,其特征在于,步骤3中所述无人机航拍目标检测网络模型中的深度特征提取模块和分类模块分别使用Faster RCNN网络的深度特征提取网络和分类器。5.根据权利要求4所述的一种知识与数据协同驱动的无人机航拍目标检测方法,其特征在于,步骤3中所述无人机航拍目标检测网络模型中的语义关系模块包括图卷积网络,步骤4在训练所述无人机航拍目标检测网络模型时,语义关系模块执行以下步骤:将知识图谱的邻接矩阵记X输入图卷积网络处理,提取包含目标间语义信息的特征;将提取到的语义信息与原始特征矩阵进行矩阵点乘融合,并经过全连接层将其变换成与原始特征相同的维度,然后利用注意力机制,使其与原始特征带权融合,获得无人机航拍图片的语义特征X
semantic
,表达式如下:其中,X
CNN
代表深度特征提取模块提取的候选区原始特征,FC代表全连接层,代表两
矩阵点乘,||代表级联,α
se
代表语义关系模块学习到的注意力参数,代表通过图卷积网络得到的包含目标间语义信息的特征,表达式如下:其中是在图卷积网络的第l层输出的特征图,l∈L
GCN
,L
GCN ≥ 3,L
GCN
为图卷积网络总层数,L是拉普拉斯矩阵,σ(
·
)是非线性激活函数;图卷积网...

【专利技术属性】
技术研发人员:孙华韩东马驰施晓东李大伟周徽乐意陆中祥丁阳孙浩张思远赖劭彤陈林伟
申请(专利权)人:中国电子科技集团公司第二十八研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1