一种基于生成对抗网络框架的半监督语义分割方法技术

技术编号：39773459 阅读：9 留言：0更新日期：2023-12-22 02:22

本发明专利技术公开了一种基于生成对抗网络框架的半监督语义分割方法，属于计算机语义分割领域，可用常规图片的语义分割

全部详细技术资料下载

【技术实现步骤摘要】
一种基于生成对抗网络框架的半监督语义分割方法

[0001]本专利技术属于语义分割
，具体涉及一种基于生成对抗网络框架的半监督语义分割方法
。

技术介绍

[0002]目前基于深度学习的图像语义分割模型取得了巨大的成功，但是数据标注的时间和人力成本很高，像素级标注难度大，标注人员专业知识要求高，很难获得强有力的监督信息
。
半监督学习
(Weakly supervised learning
，
WSL)
充分利用人工标注信息，减小标注工作量，将人类经验与学习规则充分结合，有效地解决了全监督学习数据依赖性强的问题，在医学
、
气象学等标记较难的领域有较强的现实意义
。

技术实现思路

[0003]本专利技术针对语义分割发展情况，本专利技术目的在于提供一种基于生成对抗网络框架的半监督语义分割方法，具有分割效果好
、
精度高的，可以胜任半监督语义分割任务的特点
。
[0004]本专利技术目的是这样实现的：一种基于生成对抗网络框架的半监督语义分割方法，包括以下步骤：
[0005]步骤一：获取日常分割数据集
VOC2012
，并对其进行预处理；
[0006]步骤二：基于生成对抗网络框架，采用
DeepLabv2
为基础生成网络，全卷积网络为鉴别网络；
[0007]步骤三：对
DeepLabv2
为基础的生成网络进行改进，优化/>DeepLabv2
中的骨干分割网络
Resnet101
，对
DeepLabv2
为基础的生成网络进行改进，优化
DeepLabv2
中的骨干分割网络
Resnet101
，引入
CBAM
注意力机制和深度可分离卷积，使整个模型将权重参数更为合理地分配，提高模型的表征能力且计算更为高效；
[0008]步骤四：优化基于全卷积网络的鉴别网络，将标准卷积改为空洞卷积，提高感受野，加强整个网络的训练效果；
[0009]步骤五：优化完成后的模型进行训练，生成器和鉴别器对抗训练，提升网络分割能力；
[0010]步骤六：用训练好的模型对测试样本进行分割测试并输出分割结果
。
本专利技术在半监督分割领域对图像的分割准确率高，精度高，能够有效地应用于半监督语义分割任务中
。
[0011]本专利技术的进一步改进，在上述步骤一获取
VOC2012
数据集和对其预处理中，具体的步骤为：先将数据集中的样本导入网络，再使用大小为
321
×
321
的随机缩放和裁剪操作
。
[0012]本专利技术的进一步改进，在上述步骤二中，生成对抗网络框架中生成网络采用
Deeplabv2
框架与
ResNet
‑
101
作为生成网络，
ResNet101
网络由
100
个卷积层和一个全连接层组成，通过卷积步长改变图像尺度，其网络结构分为五个阶段，每经过一个阶段图片下采样2倍
。
鉴别器网络采用类似
FCN
的完全卷积结构
。
[0013]本专利技术的进一步改进，在上述步骤三中，优化生成网络的具体措施如下：
[0014]引入
CBAM
注意力机制，在最后的卷积层前添加
CBAM
自注意力机制，更加合理地分配模型的权重参数；将
DeepLabv2
网络中
Resnet
残差块的三个标准卷积替换为深度可分离卷积，加快运算效率，提升训练效果
。
[0015]本专利技术的进一步改进，在上述步骤四中对鉴别器全卷积网络的改进如下：引入空洞卷积，将原本的卷积层改为以5个卷积层组成主干网络，卷积核为4×4，通道数分别为
{64
，
128
，
256
，
512
，
1}
，空洞卷积参数为
{1
，2，5，1，
2}
，除了最后一层外，每个卷积层后面都跟着一个参数为
0.2
的
Leaky
‑
ReLU。
最后一层添加了一个上采样层
。
[0016]本专利技术的进一步改进，在上述步骤五中训练包括以下步骤：
[0017]5.1
网络参数初始化
[0018]5.2
设置训练参数
[0019]5.3
加载训练数据
[0020]5.4
迭代对抗训练
[0021]本专利技术的进一步改进，在上述步骤
5.2
的训练参数为：生成器网络使用了随机梯度下降
(SGD)
优化方法，其中动量为
0.9
，权重衰减为
10
‑4。
初始学习率设置为
2.5
×
10
‑4。
鉴别器网络采用
Adam
优化方法，学习率为
10
‑4。
[0022]本专利技术的进一步改进，在上述步骤
5.4
的迭代对抗训练中，生成对抗网络框架中的生成网络生成对图像的语义分割结果，输入到鉴别器网络中，鉴别器网络判断这是生成网络生成的图像还是来自已经标注好的分割标签，网络通过反向传播迭代训练，最终尽可能达到鉴别器难以判断生成的图像是生成器生成的分割预测图还是已经人为标注好的分割标签
。
达到较好的分割效果
。
附图说明
[0023]图1为本专利技术的方法流程图
。
[0024]图2为生成对抗网络框架
[0025]图3为生成网络改进后的结构图
[0026]图4为鉴别网络改进后的结构图
具体实施方式
[0027]以下结合附图对本专利技术做进一步概述
。
[0028]实施例：一种基于生成对抗网络框架的半监督语义分割方法，如图1所示，其步骤如下：
[0029]步骤一：获取日常分割数据集
VOC2012
，该数据集包含
21
个类别的图像，涵盖了常见的物体类别，如人
、
车
、
飞机
、
动物等
。
每个图像都配有精确的像素级别的标注，标注了每个对象的位置和类别
。
并导入网络，使用大小为
321
×
321
的随机缩放和裁剪操作
。
[0030]步骤二：基于生成对抗网络框架，采用
DeepLabv2
为基础生成网络，全卷积网络为鉴别网络；生成对抗网络框架中生成网络采用
Deepl本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于生成对抗网络框架的半监督语义分割方法，其特征在于，主要包括以下步骤：步骤一：获取日常分割数据集
VOC2012
，并对其进行预处理；步骤二：基于生成对抗网络框架，采用
DeepLabv2
为基础生成网络，全卷积网络为鉴别网络；步骤三：对
DeepLabv2
为基础的生成网络进行改进，优化
DeepLabv2
中的骨干分割网络
Resnet101
，对
DeepLabv2
为基础的生成网络进行改进，优化
DeepLabv2
中的骨干分割网络
Resnet101
，引入
CBAM
注意力机制和深度可分离卷积，使整个模型将权重参数更为合理地分配，提高模型的表征能力且计算更为高效；步骤四：优化基于全卷积网络的鉴别网络，将标准卷积改为空洞卷积，提高感受野，加强整个网络的训练效果；步骤五：优化完成后的模型进行训练，生成器和鉴别器对抗训练，提升网络分割能力；步骤六：用训练好的模型对测试样本进行分割测试并输出分割结果
。
本发明在半监督分割领域对图像的分割准确率高，精度高，能够有效地应用于半监督语义分割任务中
。2.
根据权利要求1所述的基于生成对抗网络框架的半监督语义分割方法，其特征在于：所述步骤一预处理方法如下：先将数据集中的样本导入网络，再使用大小为
321
×
321
的随机缩放和裁剪操作
。3.
根据权利要求1所述的基于生成对抗网络框架的半监督语义分割方法，其特征在于：所述步骤二中的生成对抗网络框架中生成网络采用
Deeplabv2
框架与
ResNet
‑
101
作为生成网络，
ResNet101
网络由
100
个卷积层和一个全连接层组成，通过卷积步长改变图像尺度，其网络结构分为五个阶段，每经过一个阶段图片下采样2倍
。
鉴别器网络采用类似
FCN
的完全卷积结构
。4.
据权利要求1所述的基于生成对抗网络框架的半监督语义分割方法，其特征在于：所述步骤三对于生成网络的改进如下：引入
CBAM
注意力机制，在最后的卷积层前添加
...

【专利技术属性】
技术研发人员：刘凡，段先华，
申请(专利权)人：江苏科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人