当前位置: 首页 > 专利查询>四川大学专利>正文

一种基于可选择的膨胀卷积核大小的目标检测方法技术

技术编号:32257999 阅读:33 留言:0更新日期:2022-02-12 19:17
本发明专利技术公开了一种基于可选择的膨胀卷积核大小的目标检测方法,涉及计算机视觉和人工智能领域。首先,通过卷积神经网络提取特征,在通过特征金字塔进行特征融合;然后,将融合得到的特征图谱分别在对应层引入可选择膨胀系数卷积模块,通过该模块得到更好的特征;最后再对融合后的特征层进行多分类和边界框回归,不断训练迭代模型,得到多尺度融合后的目标检测结果。该方法不仅实现了精度的有效提升,能够在一定大小的输入图片下保持实时性,可应用到机器视觉、人脸识别、自动驾驶、智能视频、医疗检测等场所。疗检测等场所。

【技术实现步骤摘要】
一种基于可选择的膨胀卷积核大小的目标检测方法


[0001]本专利技术涉及一种基于可选择的膨胀卷积核大小的目标检测方法,属于计算机视觉与智能信息


技术介绍

[0002]目标检测是计算机视觉任务的基础,也是人工智能领域许多应用的基础。对于目标检测,其定义如下:给定输入的RGB图像,目标检测完成两个任务:检测和识别,即知道物体属于什么类别,并找出该物体所在图片的位置。其中,类别可以是自然界常见的物种,如人、家禽、交通工具等等,定位采用边框(bounding box)进行定位。目标检测在人脸识别、自动驾驶、人机交互、基于内容的图像检索、智能视频监控等有着广泛的应用。
[0003]现有的检测器主要分为两种:一是单阶段检测器,二是两阶段检测器。两阶段方法将检测问题划分为两个过程,首先产生区域建议,然后对候选区域进行分类和边界框回归,这类算法的开篇之作是2016年提出的R-CNN算法,但是由于两阶段中会产生大量的边框,从而大大增加了计算复杂度,因此难以达到实时;而单阶段检测器则采用基于回归的思想,舍弃区域提案阶段,通过锚点(Anchor)预本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于可选择的膨胀卷积核大小的目标检测方法,其特征包括以下步骤:(1)使用基准网络Darknet-53提取特征,经过5个下采样卷积和3个上采样操作后,得到多尺度特征层,在进行加权融合操作,最后进行二分类和边框回归操作;(2)构建可选择膨胀卷积模块,Selective Dilated Convolution Module(SDCM);(3)将SDCM引入特征金字塔结构结合,即将顶层特征同底层特征融合后,再辅之以注意力信息SDCM,得到更加有效的特征P5,P4,P3用于多分类和回归操作。2.根据权利要求1所述的方法,其特征在于(1)中构建可选择膨胀卷积模块,构建方法如下:通过Darknet-53网络得到一系列的特征层,池化层和激活层,在Darknet-53中的P4,P5特征层依次引入SDCM,并将其送入上采样阶段相应的特征层进行加权融合。3.根据权利要求1所述的方法,其特征在于(2)中构建可选择膨胀卷积模块,构建方法如下:网络由卷积函数(conv),激活函数(leakyrelu)和平均池化函数(avgpool)组成;给定输入F,F经过选择膨胀系数公式后得到输出F',F'先通过通道注意力机制得到F
C
,然后空间注意力机制得到最终的输出F”:F'=w
×
conv 1(F)+(1-w)
...

【专利技术属性】
技术研发人员:何小海熊书琪吴晓红陈洪刚卿粼波滕奇志
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1