【技术实现步骤摘要】
一种用于多目标任务实例分割的方法
本专利技术涉及一种用于多目标任务实例分割的方法。技术背景近几年随着计算机科学技术的飞速发展,基于计算机技术的图像处理、图像目标检测、图像分割等也获得了空前的快速发展,其中深度学习通过学习海量的数字图像特征,提取关键目标特征,在实例分割上已超过人类,给工业界带来了一个又一个惊喜。随着神经元网络的再度兴起,基于卷积神经元网络的视频图像法成为图像分割和识别的主流技术,采用模板匹配、边缘特征提取、梯度直方图等手段,实现对图像的精确识别。虽然基于神经网络的图像特征分割能够针对复杂场景的目标进行有效的特征识别,而且其效果远优于传统的方法,但也存在不足之处:(1)对噪声抗干扰性较弱;(2)通过使用Dropout方法解决了过拟合问题,改进了卷积神经网络模型和参数,但是精度却略有下降;(3)引入了可变型卷积与可分离卷积结构,提高了模型的泛化性,增强了网络模型特征提取能力,但对复杂场景的目标识别表现欠佳;(4)虽然目前提出的图像分割方法,能够直接预测图像像素分类信息,做到了目标物体的像素定位,但模型存在参数 ...
【技术保护点】
1.一种用于多目标任务实例分割的方法方法,包括如下步骤:/n步骤一,样本图像直方图均衡化处理;具体包括:/n(1)统计直方图各灰度级;/n首先,设变量r表示图像中像素灰度级,对灰度级进行归一化处理,若图像的灰度级为{0,1,2,...,L-1},则/n
【技术特征摘要】
1.一种用于多目标任务实例分割的方法方法,包括如下步骤:
步骤一,样本图像直方图均衡化处理;具体包括:
(1)统计直方图各灰度级;
首先,设变量r表示图像中像素灰度级,对灰度级进行归一化处理,若图像的灰度级为{0,1,2,...,L-1},则
其中,0≤r≤1,L为灰度级层次数;
(2)计算出对应的概率密度;
图像的像素灰度级是在[0,1]之间随机分布的,用概率密度函数来表示图像灰度级的分布;而在离散形式下,用rk代表离散灰度,用Pr(rk)代表灰度rk出现的概率:
其中,nk为图像中出现rk这种灰度的像素数,n是图像中的像素总数,而nk/n表示频数;
(3)求累计分布函数;
图像进行直方图均衡化的函数表达式为:
其中,k为灰度级数;
(4)求出每个灰度级对应的输出灰度级;
经过下式的反变换过程得到输出灰度级:
ri=T-1(Si)(4)
(5)映射到新的图像,得到均衡化处理后的直方图;
将原始样本图像经过直方图均衡化处理后前景和背景特征变得更加鲜明,然后将其作为新的图像样本,用作后续步骤的输入;
步骤二,构建多目标特征提取网络;
以ResNeXt101网络为基础,同时结合FPN网络构建了多目标特征提取网络结构,该多目标特征提取网络结构由输入层、卷积网络、池化层和语义特征加强层四部分组成;具体参数设置如下:
2.1)设计输入层;
将步骤一中得到的经过直方图均衡化的样本图像经过进一步的缩放处理,将其尺寸统一成1024*1024大小;如果样本图像不是正方形,则需要在其短边一侧填充黑色像素点;
2.2)设计卷积网络;
1)第一阶段设置两个卷积层,第一层有64个7*7的卷积核,其卷积步长为2;本结构在第一层之后加入了一个ReLu激活函数;第二层结构与第一层完全一样,也是由64个7*7的卷积核组成,其卷积步长为2;在第二层与第二阶段网络之间加入了一个步长为2、感受野为2*2的最大池化层;
2)在第二阶段中,首先连接一个通道数为64、卷积核大小为1*1的卷积分层;然后连接一个通道数为64、卷积核大小为3*3的卷积分层;最后再连接一个通道数为256、卷积核大小为1*1的卷积分层;将这三个分层看作一个整体的并行卷积层,并在此阶段将并将分支个数cardinality设置为32,同时连续进行三次整体的卷积操作;
3)第三阶段和第四阶段同第二阶段的卷积操作方式相同,但是第三阶段中卷积核的通道数是第二阶段的二倍,第四阶段中卷积核的通道数是第二阶段的四倍;
4)在第五阶段中,网络结构共分为两层,分别是全连接层和Dropout层,其中全连接层输出的特征维数为2048,Dropout层的参数设置为0.5,并在最后加入了一个ReLu激活函数;
2.3)设计池化层;
池化层的参数包括池化方式、池化核尺寸、滑动步长以及池化类型数4个方面;池化方式选择最大池化方式;池化核的大小关系到提取的特征图尺寸,将前4个池化层Pool1、Pool2、Pool3、Pool4的池化核尺寸均设为2*2,又因为在经过第5层池化层Pool5池化操作后得到的特征图需要作为语义特征加强层的输入数据,因此,将Pool5的池化核大小设置为3*3;最后,5层池化层的滑动步长均为1,池化类型为valid,valid类型的池化方式不提取特征矩阵的边界信息;
2.4)语义特征加强层;
由FPN网络构成,其通过将5个池化层得到的5张特征图上的特征使用双线性内插值的方法进行2倍上采样,使得特征图在原有像素的基础上扩大一倍,然后对特征图上的深层细微的特征信息进行提取,同时对较低层输入的特征图通过1*1卷积来改变其通道数,然后将上采样提取得到的特征和1*1卷积后的对应元素相加,以此来达到语义特征信息加强的效果;
步骤三,设计候选边界框,并对特征图上目标物体进行提取和分类;
用于对图像上的目标...
【专利技术属性】
技术研发人员:张烨,樊一超,陈威慧,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。