【技术实现步骤摘要】
一种等变网络训练方法、装置、电子设备及存储介质
[0001]本专利技术涉及人工智能
,具体涉及一种等变网络训练方法、装置、电子设备及存储介质。
技术介绍
[0002]通常,图像中可视对象的旋转、缩放等变换,会改变可视对象的外观,这样就会给神经网络带来很大的学习空间。目前可行的解决途径是增强神经网络的解耦能力,获得更紧凑的潜在学习空间,卷积神经网络具有内在的平移解耦能力,不管对象在输入中的位置如何,都能够学习到基本特征。为了进一步提高网络的解耦能力,有人提出了群等变理论和旋转群等变网络。
[0003]在实践中,无论是输入图像、特征映射,还是网络中的卷积核,都是定义在离散的空间中或者经过离散采样的,因此现有的等变网络都是在离散群上等变,例如对于平移群变换只能平移采样间隔的整数倍,卷积步长决定了网络只能在相同步长的离散群上具有等变性,尤其是对于深度网络需要执行多次降采样,最终的等变非常有限。由此可见,现有的等变网络由于都是在离散群上实现的离散等变,其等变性非常有限。
技术实现思路
[0004]本专利技 ...
【技术保护点】
【技术特征摘要】
1.一种等变网络训练方法,其特征在于,所述方法包括:构建由等变卷积层组成的等变网络;对所述等变网络中的等变卷积层进行高斯调制;利用训练图像集中的图像对所述等变网络进行训练,直至所述等变网络收敛结束。2.根据权利要求1所述的方法,其特征在于,所述对所述等变网络中的等变卷积层进行高斯调制,包括:对所述等变网络中的等变卷积层部署的卷积核进行高斯调制,使得所述等变卷积层利用调制后的卷积核对输入特征进行等变卷积操作。3.根据权利要求2所述的方法,其特征在于,所述对所述等变网络中的等变卷积层部署的卷积核进行调制,包括:利用预设高斯采样函数与所述卷积核进行等变卷积操作,以获得调制后的卷积核。4.根据权利要求3所述的方法,其特征在于,调制公式为:在上述公式中,Ψ为调制后的卷积核,为调制前的卷积核,
⊙
为等变卷积操作符号,ζ(x)为预设高斯采样函数,具体形式如下:其中,σ为方差,T表示转置符号,z2表示整数。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:利用已训练的等变网络对输入的待识别图像进行处理,以获得目标任务的处理结果;其中...
【专利技术属性】
技术研发人员:陈智强,余山,陈阳,
申请(专利权)人:北京智源人工智能研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。