基于多尺度特征与前背景对比的图像语义分割方法及系统技术方案

技术编号：24686182 阅读：88 留言：0更新日期：2020-06-27 08:43

本发明专利技术涉及一种基于多尺度特征与前背景对比的图像语义分割方法及系统。该方法首先图像进行预处理后，然后进行特征编码，接着优化编码过程中的浅层特征，再结合前两者基于像素重排技术利用密集连接进行特征解码得到语义分割概率图，完成语义分割模型的核心神经网络搭建；接着基于搭建的核心神经网络，对标注数据集进行数据增强，计算语义分割损失及辅助的边缘检测损失用于迭代更新网络中的参数直至收敛，完成模型的训练；最后结合搭建的核心神经网络和训练好的网络参数，从得到的语义分割概率图中的每个位置选取概率最大的一项作为该像素位置的分类，得到最后的语义分割结果。本发明专利技术方法有利于提高图像语义分割的准确性和鲁棒性，本发明专利技术系统可用于自定义保单系统，用于实现用户上传保单封面图像的图像质量增强与美化，以及敏感图像过滤等。

Image semantic segmentation method and system based on multi-scale feature and background comparison

全部详细技术资料下载

【技术实现步骤摘要】
基于多尺度特征与前背景对比的图像语义分割方法及系统
本专利技术涉及计算机视觉
，具体涉及一种基于多尺度特征与前背景对比的图像语义分割方法及系统。
技术介绍
图像语义分割是人工智能领域中计算机视觉的一个重要分支，是机器视觉中关于图像理解重要的一环。图像语义分割就是将图像中的每一个像素准确地归类到其所属类别，使其与图像本身的视觉表示内容一致，所以图像语义分割任务也被称为像素级的图像分类任务。由于图像语义分割与图像分类有一定的相似性，所以各式各样的图像分类网络常常在剔除最后的全连接层后，作为图像语义分割网络的主干网，并相互之间可替换。有时也会通过移除主干网中的池化层或使用带孔卷积等修改获得更大尺寸的特征，最后使用卷积核为1的卷积层获得语义分割结果。在与图像分类对比之下，图像语义分割的难度要更高，因为它不仅需要全局的上下文信息，还需要结合精细的局部信息来确定每个像素点的类别，所以常常利用主干网来提取较为全局的特征，然后再结合主干网中的浅层特征进行特征分辨率重建恢复到原始图像大小。基于特征尺寸先变小再变大的特征，所以常常把前者称为编码网络，后者称为解码网络。同时在编码过程中，为了能更好捕获不同大小物体的特征，常常结合不同感受野和尺度信息，其中最具有代表性的是带孔空间金字塔池化和空间金字塔池化技术。然而前者由于采取了大比率的扩张卷积导致信息利用率低，后者采取池化导致特征的空间信息丢失，同时两者均没能考虑到前背景的相关性。在现有的语义分割方法中，解码过程中一般都使用转置卷积或者双线性插值等方法将特征逐级扩大，因此特征...

【技术保护点】
1.一种基于多尺度特征与前背景对比的图像语义分割方法，其特征在于，包括如下步骤：/n步骤A：首先对输入图像进行预处理，然后进行编码得到F

【技术特征摘要】
1.一种基于多尺度特征与前背景对比的图像语义分割方法，其特征在于，包括如下步骤：
步骤A：首先对输入图像进行预处理，然后进行编码得到Fenc，接着优化编码过程中的浅层特征得到和最后结合Fenc和进行解码得到语义分割概率图Pss，完成语义分割模型的核心神经网络搭建；
步骤B：基于步骤A搭建的核心神经网络，利用标注数据集迭代更新网络中的参数直至收敛，完成模型的训练；
步骤C：结合步骤A搭建的核心神经网络和步骤B中训练好的网络参数，从得到的语义分割概率图Pss中的每个位置选取概率最大的一项作为该像素位置的分类，得到最后的语义分割结果。

2.根据权利要求1所述的基于多尺度特征与前背景对比的图像语义分割方法，其特征在于，在所述步骤A中，首先对输入图像进行预处理，然后进行编码得到Fenc，接着优化编码过程中的浅层特征得到和最后结合Fenc和进行解码得到语义分割概率图Pss，完成语义分割模型的核心神经网络搭建，包括如下步骤：
步骤A1：预处理输入图像，对其进行标准化，即针对每张输入图像的每个通道，在原像素值的基础上减去各自的像素平均值；
步骤A2：首先用卷积网络处理步骤A1中得到的标准化图像，然后获取具有多尺度前背景对比表示的编码特征Fenc；
步骤A3：选取步骤A2中卷积网络处理的中间层特征进行二次优化得到和
步骤A4：基于像素重排技术和密集连接结构，结合Fenc和进行解码得到语义分割概率图Pss，完成语义分割模型的核心神经网络搭建。

3.根据权利要求2所述的基于多尺度特征与前背景对比的图像语义分割方法，其特征在于，在所述步骤A2中，首先用卷积网络处理步骤A1中得到的标准化图像，然后获取具有多尺度前背景对比表示的编码特征Fenc，包括以下步骤：
步骤A21：使用卷积神经网络提取特征Fbase；
步骤A22：使用具有不同扩张比率的扩张卷积分别处理特征Fbase得到多个不同级别的前景上下文表示特征；扩张比率越大，得到的特征级别越高；其中扩张卷积的公式如下：
ydc[m]＝∑xdc[mdc+rdc·kdc]wdc[kdc]
其中，xdc与ydc分别为卷积前后的值，mdc与kdc分别为图像和卷积核的位置坐标，wdc为权重卷积核，rdc为带孔卷积的比率；
步骤A23：使用具有不同划分区域数的平均池化操作处理特征Fbase得到多个不同级别的背景上下文表示特征；划分的区域越小，得到的特征级别越高；然后再分别用双线性插值缩放特征到原始输入大小；其中池化尺寸dp可通过输入特征尺寸λ和划分区域数p由如下公式计算得到：

步骤A24：将步骤A22中得到前景上下文表示特征分别减去步骤A23中得到的背景上下文表示特征，得到多个对比上下文特征；
步骤A25：将步骤A24中计算得到的全部对比上下文特征和Fbase在通道维度上进行拼接，然后通过卷积核为1的卷积操作对其进行特征降维，最后利用随机失活技术处理提升泛化性能，得到多尺度前背景对比表示特征作为最终的编码特征Fenc。

4.根据权利要求2所述的基于多尺度特征与前背景对比的图像语义分割方法，其特征在于，在所述步骤A3中，选取步骤A2中卷积网络处理的中间层特征进行二次优化得到和包括以下步骤：
步骤A31：从步骤A2中的卷积网络中选择尺寸大于编码特征Fenc的中间层特征其中步长os表示与Fenc的尺寸比例；
步骤A32：用由预激活的残差块和一个3×3卷积构成的适配卷积单元处理得到边界优化特征公式如下：

其中基础块fbb由批量标准化、激活函数和3×3卷积组成，为经过预激活残差块的处理结果；
步骤A33：对于得到的边界优化特征同样用适配卷积单元处理得到融合优化特征
步骤A34：选取不同的步长os重复步骤A32和步骤A33，得到多对和

5.根据权利要求2所述的基于多尺度特征与前背景对比的图像语义分割方法，其特征在于，在所述步骤A4中，基于像素重排技术和密集连接结构，结合Fenc...

【专利技术属性】
技术研发人员：潘昌琴，林涵阳，刘刚，唐伟，邓政华，李伟，卓丽栋，张路，刘华杰，
申请(专利权)人：江苏实达迪美数据处理有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人