一种基于深度学习的可变形卷积网络制造技术

技术编号:22022904 阅读:34 留言:0更新日期:2019-09-04 01:31
本发明专利技术公开了一种基于深度学习的可变形卷积网络,包括可变形卷积模块和可变形的ROI池化层模块;所述可变形卷积模块将二维偏移量添加到标准卷积中的常规网格采样的位置,使得采样网格可以自由变形;偏移量是从其前面的映射特征中通过额外的卷积层得到;所述可变形的ROI池化层模块为池化层中每一个小分区位置添加一个偏移量,偏移量能从前面的特征映射和感兴趣区域中学习,从而为具有不同形状的目标实现自适应定位。本发明专利技术的两个新的模块可以代替现有主流的网络中的普通模块,并且可以通过标准的反向传播进行端到端的训练,从而产生可变形的卷积网络,在处理复杂目标情况时,大大提高了检测精度。

A deformable convolution network based on deep learning

【技术实现步骤摘要】
一种基于深度学习的可变形卷积网络
本专利技术涉及可变形卷积网络,具体涉及一种基于深度学习的可变形卷积网络。
技术介绍
目前,在计算机视觉的任务中一个关键的挑战是网络架构如何适应由目标尺寸,姿态,角度和变形带来的几何变化或者模型的几何转换。针对上述的问题,目前主要有两种解决的办法。第一种是构建具有足够期望变化的训练数据集。这通常是通过增加现有的数据样本来进行实现,如将现有的数据样本进行尺寸变化或剪裁、旋转等方式。稳定的拟合表示可以从数据中学习,但通常是以昂贵的训练和复杂的模型参数为代价的;第二种是使用变换不变性的特征和算法。以上的方法有两个缺点,首先,假设几何变换是固定已知的,并且利用这些先验知识对数据进行扩充,设计特征和算法。这种假设阻止了对具有未知几何变换的新任务的泛化,使得建立的模型没有很好的泛化性能。其次,对于过于复杂的转换,设计的具有变换不变特性的特征和算法的难度提高,可行性极低。近年来,卷积神经网络在图像分类,语义分割,目标检测等视觉识别任务中取得了显著的成功。然而,它们仍然有上述的两个缺点。基于卷积神经网络的模型对几何变换建模的能力主要来自广泛的数据扩充、大的模型容量和一本文档来自技高网...

【技术保护点】
1.一种基于深度学习的可变形卷积网络,其特征在于,包括可变形卷积模块和可变形的ROI池化层模块;所述可变形卷积模块将二维偏移量添加到标准卷积中的常规网格采样的位置,使得采样网格可以自由变形;偏移量是从其前面的映射特征中通过额外的卷积层得到;所述可变形的ROI池化层模块为池化层中每一个小分区位置添加一个偏移量,偏移量能从前面的特征映射和感兴趣区域中学习,从而为具有不同形状的目标实现自适应定位。

【技术特征摘要】
1.一种基于深度学习的可变形卷积网络,其特征在于,包括可变形卷积模块和可变形的ROI池化层模块;所述可变形卷积模块将二维偏移量添加到标准卷积中的常规网格采样的位置,使得采样网格可以自由变形;偏移量是从其前面的映射特征中通过额外的卷积层得到;所述可变形的ROI池化层模块为池化层中每一个小分区位置添加一个偏移量,偏移量能从前面的特征映射和感兴趣区域中学习,从而为具有不同形状的目标实现自适应定位。2.根据权利要求1所述的基于深度学习的可变形卷积网络,其特征在于,所述可变形卷积模块包括两个步骤:S1,在输入的映射特征x上使用规则的网格R进行采样;S2,用w代表加权采样之和,网格R定义感受野大小和扩张,R用数组坐标代表卷积核位置。3.根据权利要求2所述的基于深度学习的可变形卷积网络,其特征在于,所述步骤S1和S2具体为:对于输出映射特征y上的每个位置p0,有:其中,pn枚举R中的位置;在可变形的卷积中,规则网格R用偏移量进行增广{Δpn|n=1,...,N},其中N=|R|,因此有:此时,采样是在不规则和偏移的位置pn+Δpn,由于Δpn常常会以小数的形式出现。4.根据权利要求2所述的基于深度学习的可变形卷积网络,其特征在于,所述步骤S1和S2还包括:对Δpn进行处理:其中,p代表任意位置(p=p0+pn+Δpn),q枚举了映射特征x所有完整的空间位置,G(·,·)代表着双线性插值的内核;G是二维的,随即被分为两个一维的核:G(q,p)=g(qx,px)·g(qy,py)其中,g(a,b)=max(0,1-|a-b|);其中的偏移量是通过在相同的输入映射特征上应用卷积层得到的,输出的偏移量...

【专利技术属性】
技术研发人员:龙飞胡建国张海招继恩候邦恩
申请(专利权)人:杰创智能科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1