【技术实现步骤摘要】
一种基于路径多样性与一致性的动态路由网络学习方法
本专利技术属于计算机视觉领域,特别的设计一种基于路径多样性与一致性的动态路由网络学习方法。技术背景深度模型为了追求精度提高层数已经是愈来愈多,可更多的层次带来的精度边际提升却不断减小。或者对某些输入图片而言,真正所需的神经元操作并非那么多,只有一些真正模糊、特征不明显、即使人看上去也较难分辨的图片才需要较多的网络层处理最终得到能分别其类别的表达特征。但对于图像集合,其所经过的路径是否无规律或无法建模,对于相似图像与不同难度的图像,其选择的路径应存在相应的规律。针对以上背景,现有技术中面临两个关键性技术问题:第一点,如何对经过网络的图像所选择经过的路径进行建模。第二点,对于相似图像与不同图像,如何对图像与所选择的路径,其中天然的关联进行约束。
技术实现思路
为解决现有技术中存在的问题,本专利技术主要针对动态路由网络中路径选择的多样性与一致性进行探究,并提出一种基于路径多样性与一致性的动态路由网络学习方法。通过该方法中路径的多样性操作,网络模型可以被更加充 ...
【技术保护点】
1.一种基于路径多样性与一致性的动态路由网络学习方法,其特征在于,包括以下步骤:/nS1、获取用于训练的图像分类数据集,并将数据集分为若干批次,作为网络输入;/nS2、针对用于图像分类的目标卷积神经网络,将其分为若干子结构并在子结构前增加动态路由结构,构建得到基于路径选择的动态路由网络模型;/nS3、将S1中的数据分批次输入S2中构建的动态路由网络模型中,结合路径的一致性约束和多样性约束,对模型进行训练;/nS4、基于S3中训练得到的动态路由网络模型,对每一个子结构前的动态路由结构输出进行二值化,得到动态预测模型,用于对输入图像进行分类。/n
【技术特征摘要】
1.一种基于路径多样性与一致性的动态路由网络学习方法,其特征在于,包括以下步骤:
S1、获取用于训练的图像分类数据集,并将数据集分为若干批次,作为网络输入;
S2、针对用于图像分类的目标卷积神经网络,将其分为若干子结构并在子结构前增加动态路由结构,构建得到基于路径选择的动态路由网络模型;
S3、将S1中的数据分批次输入S2中构建的动态路由网络模型中,结合路径的一致性约束和多样性约束,对模型进行训练;
S4、基于S3中训练得到的动态路由网络模型,对每一个子结构前的动态路由结构输出进行二值化,得到动态预测模型,用于对输入图像进行分类。
2.如权利要求1所述的基于路径多样性与一致性的动态路由网络学习方法,其特征在于,所述S1中,用于训练目标任务的图像数据集,包括图像组其中Ii为第i张图像,K为图像组中的图像数目;将图像组划分为若干批次,每个批次中包含L张图像。
3.如权利要求2所述的基于路径多样性与一致性的动态路由网络学习方法,所述S2中,建立基于路由选择的基础网络模型的过程如下:
将卷积神经网络按Block为单位,划分成N个网络子结构,其中Fj(xj-1)表示第j个子结构,第j个子结构的输入xj-1为上一个子结构的输出;在每个子结构前添加用于选择跳过或执行当前子结构的动态路由结构Rj;
所述动态路由结构的输入为上一个子结构的输出,第j个动态路由结构的动态路由结构输出rj为:
rj=softmax(β·softmax(Conv(xj-1)))[0]
其中Cony为3×3卷积模型,β为自适应可学习参数,rj为[0,1]范围内的连续值;
对带有动态路由结构的第j个子结构而言,其输出为:
xj=rjFj(xj-1)+(1-rj)xj-1。
4.如权利要求3所述的基于路径多样性与一致性的动态路由网络学习方法,其特征在于,所述S3的具体方法如下:
S31、从S1中的图像分类数据集中选择一个批次,作为S2中构建的动态路由网络模型的输入;
S32:对S31中选择批次中的每张图像进行数据扩充,每张图像Ii均通过图像变换扩充成M张相似图像I′i,m,m=1,2,…,M;
S33、针对当前选择批次中的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。