一种基于网络模体图表示学习的小样本语义分割方法技术

技术编号：36541679 阅读：27 留言：0更新日期：2023-02-01 16:42

本发明专利技术属于人工智能研究领域，提出一种基于网络模体图表示学习的小样本语义分割方法。本发明专利技术主要解决由于通道特征提取能力不足，导致的查询图像中通道信息丢失问题。所述方法主要包括特征提取模块、关系参考模块、隐式关系挖掘模块、多尺度交互模块和最终分割模块。该发明专利技术将查询通道特征作为节点，构造图结构，建立节点之间的关系；利用网络模体来量化节点的属性特征和结构特征，以增强通道之间的关系；最后，聚合属性特征和结构特征，并通过图表示学习来挖掘节点之间的隐式关系。该发明专利技术通过将查询通道特征的隐式关系显示化，缓解了查询图像中的信息丢失问题。像中的信息丢失问题。像中的信息丢失问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于网络模体图表示学习的小样本语义分割方法

[0001]本专利技术涉及人工智能研究领域，尤其涉及一种基于网络模体图表示学习的小样本语义分割方法。

技术介绍

[0002]图像语义分割属于计算机的视觉识别任务，在人工智能领域有重要的作用。目前主要应用于医学图像、遥感图像和无人驾驶领域。图像语义分割任务本质上是对图像中的每一个像素点进行分类与定位。该任务也被认为是密集预测任务中的一种。然而，该任务需要大量带密集标注的训练数据集进行支撑，这些数据集的收集成本高昂、耗时长，而且目前的方法很难以数据有效的方式推广到不可见的对象类别。为了解决数据问题，提出了小样本语义分割。“One
‑
shot learning for semantic segmentation,”in British Machine Vision Conference(BMVC)中的小样本语义分割的目标是利用一个或几个带注释的支持图像来分割查询图像中一个不可见类的前景图像，其中该不可见类同时包含在支持图像和查询图像中。
[0003]“Canet:Class
‑
agnostic segmentation networks with iterative refifinement and attentive few
‑
shot learning,”in IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR)中表述小样本语义...

【技术保护点】

【技术特征摘要】
1.一种基于网络模体图表示学习的小样本语义分割方法，其特征在于，该基于网络模体图表示学习的小样本语义分割方法将查询图像通道特征作为节点，构造图结构，利用网络模体量化节点的属性特征和结构特征，通过图表示学习聚合属性特征和结构特征，挖掘节点之间的隐式关系，从而缓解查询图像中的信息丢失问题；基于网络模体图表示学习的小样本语义分割方法包括特征提取模块、关系参考模块、隐式关系挖掘模块、多尺度交互模块和最终分割模块，具体步骤如下：S1、特征提取模块提取支持图像和查询图像的特征，并生成支持原型：利用特征提取主干网络提取支持图像和查询图像的特征，分别为支持特征和查询特征；支持特征和查询特征分为中级特征和高级特征，中级支持特征表示看不见的类共享的对象部分，包括颜色、位置和边缘，高级特征与对象类别相关；使用支持图像掩码全局池去除背景干扰，获得支持原型；S2、关系参考模块用于计算支持特征和查询特征之间的相关性，为后续分割提供先验知识：计算步骤S1获得的高级支持特征与查询特征之间的关系，生成关系参考图；S3、隐式关系挖掘模块将查询图像通道特征建模为拓扑图，通过基于网络模体图表示学习挖掘查询图像的隐式通道关系：挖掘步骤S1获得的中级查询特征的隐式关系；将查询图像中离散的通道特征转换为拓扑图；通过基于网络模体图表示学习，提取出中级查询特征的通道特征的有益隐式相关性，获得新的查询特征；S4、多尺度交互模块基于多尺度将特征提取模块、关系参考模块、隐式关系挖掘模块的输出融合：将关系参考图、新的查询特征和支持原型连接起来；基于多尺度交互模块，通过关系参考图和支持原型自适应地丰富新的查询特征，获得融合的查询特征；在水平方向上，新的查询特征、支持原型和关系参考图相互作用并合并；在纵向上，多尺度交互模块自上而下地将更多的细化特征集成到隐式关系挖掘模块输出的新的查询特征中；最后，收集不同尺度的特征作为最后融合的查询特征；S5、最终分割模块通过融合的查询特征预测出查询图像掩码并分割：对融合的查询特征使用分类报头进行分割，得到最终的查询图像预测掩码；S6、利用交叉熵损失函数计算查询图像真实掩码和最终的查询图像预测掩码之间的损失，以及查询图像真实掩码和不同尺度下的查询图像预测掩码之间的损失，将两种损失相加，利用梯度反传函数更新模型的参数。2.根据权利要求1所述的基于网络模体图表示学习的小样本语义分割方法，其特征在于，所述步骤S1具体为：S11：采用卷积神经网络作为主干网络对支持图像和查询图像进行特征提取，获得中级支持特征X
sm
、中级查询特征X
qm
、高级支持特征X
sh
和高级查询特征X
qh
；获得的支持特征和查询特征的维度均为H
×
W
×
C，其中H、W分别表示特征的高度和宽度，C表示通道数；S12：将中级支持特征X
sm
和支持图像掩码相乘得到支持原型X
s
′
；其中，查询图像为一张图像，支持图像为一张或多张图像，所有图像均有相应的掩码图像。
3.根据权利要求1或2所述的基于网络模体图表示学习的小样本语义分割方法，其特征在于，所述步骤S2具体为：S21：计算步骤S1获得的高级支持特征X
sh
和高级查询特征之间的余弦相似度；S22：为每个高级查询特征计算其与高级支持特征X
sh
余弦相似度的最高值，作为关系值；S23：对所有的关系值进行归一化得到关系参考图R
q
，关系参考图的维度为H
×
W
×
1。4.根据权利要求3所述的...

【专利技术属性】
技术研发人员：原旭，于硕，杨影，黄华飞，
申请(专利权)人：大连理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人