【技术实现步骤摘要】
一种基于可选择的膨胀卷积核大小的目标检测方法
[0001]本专利技术涉及一种基于可选择的膨胀卷积核大小的目标检测方法,属于计算机视觉与智能信息
技术介绍
[0002]目标检测是计算机视觉任务的基础,也是人工智能领域许多应用的基础。对于目标检测,其定义如下:给定输入的RGB图像,目标检测完成两个任务:检测和识别,即知道物体属于什么类别,并找出该物体所在图片的位置。其中,类别可以是自然界常见的物种,如人、家禽、交通工具等等,定位采用边框(bounding box)进行定位。目标检测在人脸识别、自动驾驶、人机交互、基于内容的图像检索、智能视频监控等有着广泛的应用。
[0003]现有的检测器主要分为两种:一是单阶段检测器,二是两阶段检测器。两阶段方法将检测问题划分为两个过程,首先产生区域建议,然后对候选区域进行分类和边界框回归,这类算法的开篇之作是2016年提出的R-CNN算法,但是由于两阶段中会产生大量的边框,从而大大增加了计算复杂度,因此难以达到实时;而单阶段检测器则采用基于回归的思想,舍弃区域提案阶段,通过锚 ...
【技术保护点】
【技术特征摘要】
1.一种基于可选择的膨胀卷积核大小的目标检测方法,其特征包括以下步骤:(1)使用基准网络Darknet-53提取特征,经过5个下采样卷积和3个上采样操作后,得到多尺度特征层,在进行加权融合操作,最后进行二分类和边框回归操作;(2)构建可选择膨胀卷积模块,Selective Dilated Convolution Module(SDCM);(3)将SDCM引入特征金字塔结构结合,即将顶层特征同底层特征融合后,再辅之以注意力信息SDCM,得到更加有效的特征P5,P4,P3用于多分类和回归操作。2.根据权利要求1所述的方法,其特征在于(1)中构建可选择膨胀卷积模块,构建方法如下:通过Darknet-53网络得到一系列的特征层,池化层和激活层,在Darknet-53中的P4,P5特征层依次引入SDCM,并将其送入上采样阶段相应的特征层进行加权融合。3.根据权利要求1所述的方法,其特征在于(2)中构建可选择膨胀卷积模块,构建方法如下:网络由卷积函数(conv),激活函数(leakyrelu)和平均池化函数(avgpool)组成;给定输入F,F经过选择膨胀系数公式后得到输出F',F'先通过通道注意力机制得到F
C
,然后空间注意力机制得到最终的输出F”:F'=w
×
conv 1(F)+(1-w)
...
【专利技术属性】
技术研发人员:何小海,熊书琪,吴晓红,陈洪刚,卿粼波,滕奇志,
申请(专利权)人:四川大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。