【技术实现步骤摘要】
一种基于分块卷积神经网络的细粒度图像分类方法
本专利技术涉及细粒度图像识别
,具体涉及一种基于分块卷积神经网络的细粒度图像分类方法。
技术介绍
在细粒度图像识别
中,现有基于人工智能和深度学习的方法大多直接将图像输入到卷积神经网络(ConvolutionalNeuralNetwork,CNN)中,通过多层卷积和池化层操作,在前一层的输出特征图(FeatureMap)上提取特征图,逐层提取并获得感受野(ReceptiveField,RF),即特征图上每个特征点映射到输入图片上的范围)更大的特征图,最终得到感受野为整幅图像尺寸大小的特征图(理论感受野可能大于整幅图像尺寸大小)并用于细粒度图像分类。但是,多数现有方法主要通过在图像上寻找有判别力的局部区域,用于识别图像中物体的种类,例如鸟类中不同颜色的翅膀和不同形状的喙,机动车中不同形状的车灯和轮胎。在这种情况下,更小的感受野能够使模型更好地提取图像上的局部特征,进而寻找较小的有判别力的局部区域。然而,现有的卷积神经网络框架主要通过引入复杂度较高、参数量较大的操作,但是 ...
【技术保护点】
1.一种基于分块卷积神经网络的细粒度图像分类方法,设定分块卷积神经网络共有L个分块卷积层,l为当前分块卷积层的层数,1≤l≤L,初始化为l=1;其特征是:/n该方法由以下步骤实现:/n步骤一、对于第l个分块卷积层f(·;Ω
【技术特征摘要】
1.一种基于分块卷积神经网络的细粒度图像分类方法,设定分块卷积神经网络共有L个分块卷积层,l为当前分块卷积层的层数,1≤l≤L,初始化为l=1;其特征是:
该方法由以下步骤实现:
步骤一、对于第l个分块卷积层f(·;Ω(l)),获取其输入特征图为x(l);所述为卷积核参数,R表示实数,c(l)为输入特征图通道数,c(l+1)为输出特征图通道数,·表示函数的输入,和为每个卷积核的宽和高;表示维度为的实矩阵;
所述输入特征图为第l-1个分块卷积层的输出特征图,x(1)为模型输入,W(l)和H(l)为输入特征图的宽和高;
步骤二、当l=1时,设置m1=n1=1;当l>1时,通过下式计算输入特征图上的每行分块数ml和每列分块数nl:
式中,和分别为输入特征图x(l)的理论感受野的宽和高,且和为所述理论感受野在宽和高维度上的收缩因子,和分别为第l′层分块卷积层的卷积核在特征图的宽和高维度上的步长,为向上取整操作;
步骤三、根据步骤二中获得的输入特征图上每行每列分块数ml和nl,随机采样获得特征图分块的宽和高并且和均为正整数,
步骤四、根据步骤三获得的特征图分块的宽和高将输入的特征图x(l)分成ml×nl块,获得分块特征图集合
步骤五、采用步骤一中的卷积核参数Ω(l)分别对步骤四获得的所有进行卷积,获得对应卷积输出特征图
步骤六、将步骤五获得的卷积输出特征图按原位置进行拼接,获得分块卷积神经网络中的第l个卷...
【专利技术属性】
技术研发人员:马占宇,谢吉洋,杜若一,司中威,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。