【技术实现步骤摘要】
卷积神经网络及基于卷积神经网络的图像处理方法
[0001]本公开涉及神经网络
,尤其涉及一种卷积神经网络及基于卷积神经网络的图像处理方法。
技术介绍
[0002]近年来,深度神经网络在模式识别领域进行大量应用,例如,深度神经网络已应用于目标检测、人脸识别、语义分割等。这些应用与深度神经网络能够学习具有强表达能力的特征(图像的表示方法)息息相关。手工提取特征的方法通过引入专家知识能提取图像的低层级特征。与传统的手工提取特征的方法相比,深度神经网络依靠数据驱动,能够学习图像的包括低层级、中层级及高层级特征的各层级特征。神经网络提取图像特征的工作方式类似于人类的视觉系统,因而在识别效果上优于手工提取特征的方法。
[0003]卷积神经网络固有的平移不变性,使其对目标在图像中的位置具有很强的鲁棒性。但是卷积神经网络对旋转和尺度缩放比较敏感,不具有旋转和尺度不变性。最近,已经提出一些方案试图将旋转不变性引入到卷积神经网络。这些方案大致分为两类:
[0004]1)采用数据增广的方法,将训练集中的样本做旋转变换得到增广数据集,然后用来训练普通的卷积神经网络结构或者专门设计的一些卷积神经网络结构,得到具有旋转不变性的卷积神经网络模型。
[0005]2)完全不需要对训练集的样本进行数据增广,但改变卷积神经网络的卷积核的结构,来得到具有旋转不变性的卷积神经网络模型。
[0006]采用数据增广的方法,能够获得一定的旋转不变性,但是数据增广需要对数据做预处理,同时,增广使得训练集的样本量成倍增加,使得训练 ...
【技术保护点】
【技术特征摘要】
1.一种卷积神经网络,其特征在于,所述卷积神经网络,包括:至少一个卷积层,每个所述卷积层包括至少一个卷积核组,每个所述卷积核组包括两个以上的卷积核,每个所述卷积核组的各所述卷积核对输入的具有不同旋转角度的图像数据的相同特征进行特征提取以获得特征图,其中,所述卷积核组的一个卷积核经过旋转能得到所述卷积核组的其他卷积核;以及至少一个池化层,每个所述池化层利用与所述卷积核组的各所述卷积核分别对应的池化窗口对各所述卷积核输出的特征图进行池化,以输出池化后的特征图,其中,通过绕与所述卷积核组的所述一个卷积核对应的池化窗口的中心而旋转所述池化窗口,能得到与所述卷积核组中的其他卷积核对应的池化窗口。2.根据权利要求1所述的卷积神经网络,其特征在于,所述卷积神经网络还包括特征图选择层,所述特征图选择层将经过所有池化层池化后的且来源于属于同一卷积核组的各卷积核的特征图进行比较,并选出具有最大值的特征图,作为该卷积核组对所述图像数据提取的特征图。3.根据权利要求1所述的卷积神经网络,其特征在于,所述卷积核组包括第一卷积核,所述第一卷积核由F0表示,所述卷积核组中的其他卷积核由F
i
表示,则所述其他卷积核F
i
通过以下公式获得:F
i
(c,p,q)=F0(c,p
′
,q
′
),其中其中,i表示各卷积核在所述卷积核组中的索引,c表示卷积核的通道数,p,q分别表示第i卷积核的高和宽的索引,θ
i
表示第i卷积核从所述第一卷积核旋转的角度,p
’
和q
’
分别表示所述第一卷积核的高和宽的索引。4.根据权利要求3的卷积神经网络,其特征在于,所述第一卷积核的权重随着所述卷积神经网络的训练而改变。5.根据权利要求4的卷积神经网络,其特征在于,对前一所述池化层池化后的特征图进行特征提取的所述卷积层中的每一卷积核的通道的数量是其输入的池化后的所述特征图的通道的数量的1/n,其中,n表示所述不同旋转角度的数量并且为大于2的自然数。6.根据权利要求3的卷积神经网络,其特征在于,与所述卷积核组中除所述第一卷积核之外的其他卷积核对应的各池化窗口的中心表示为(h
θi
,w
θi
),则所述池化窗口的中心(h
θi
,w
θi
)通过以下公式获得:其中,(h
θo
,w
θo
)表示与所述第一卷积核对应的池化窗口的中心,θ
i
表示自中心(h
θo
,w
θo
)旋转的角度。7.一种基于卷积神经网络的图像处理方法,其特征在于,所述方法包括:由所述卷积神经网络的各卷积层中的每个卷积核组的各卷积核对输入的具有不同旋转角度的图像数据的相同特征进行特征提取以获得特征图,其中,所述卷积核组的一个卷...
【专利技术属性】
技术研发人员:李永,吴岳辛,叶翔,刘莹,姜卫星,丰,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。