一种融合自监督语义引导与条件调制机制的图像分割方法及其系统技术方案

技术编号：46267101 阅读：12 留言：0更新日期：2025-09-02 21:02

本发明专利技术公开一种融合自监督语义引导与条件调制机制的图像分割方法及其系统。本发明专利技术通过将二维图像输入至训练好的扩散分割网络，实现对图像的分割。在主干路径中引入双通道的条件调制机制，将时间嵌入映射为系数调控特征演化，将条件路径提取的语义先验信息映射为仿射参数，按通道缩放/偏移特征，在通道维度执行逐层仿射变换，实现语义条件的深度融合，提升模型在不同空间尺度下的语义一致性保持能力，有助于恢复模糊边界与细碎结构。引入结构感知的复合损失函数，提升模型对目标区域的分割完整性与边界清晰度。本发明专利技术通过融合自监督语义引导与条件调制机制，有效解决现有图像分割方法在结构一致性、边界精度和标注依赖方面的技术缺陷。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于医学图像处理和深度学习，具体涉及一种融合自监督语义引导与条件调制机制的图像分割方法及其系统。

技术介绍

1、图像分割作为计算机视觉的核心任务，旨在将输入图像划分为具有语义一致性的区域，在自动驾驶、工业质检、遥感解译、医学诊断等领域具有广泛应用价值。传统方法主要依赖全卷积神经网络（fcn），如unet、deeplabv3+等架构，通过端到端学习实现像素级分类。然而，此类方法存在两大固有局限：

2、标注依赖性高：需大量精确的像素级标注数据训练模型，标注成本高昂且难以覆盖所有场景变化；

3、泛化能力不足：在目标边缘模糊、形态多变或纹理复杂的场景下（如透明物体分割、自然场景细粒度目标分割），分割精度显著下降。

4、近年来，生成式分割方法（如基于扩散模型的分割网络）通过逐步去噪过程学习数据分布，展现出更强的细节重建能力。扩散模型通过模拟数据从噪声状态逐步重建的马尔可夫过程，在自然图像生成任务中取得突破。然而，其在分割任务中存在明显缺陷：

5、结构感知缺失：生成过程缺乏对图像语义结构的显...

【技术保护点】

1.一种融合自监督语义引导与条件调制机制的图像分割方法，所述方法包括：

2.根据权利要求1所述方法，其特征在于，所述条件路径依次包括图像分块嵌入层、分类标记嵌入层、位置编码层、Transformer 编码模块，其输入为二维图像，输出为二维图像的语义先验信息。

3.根据权利要求1所述方法，其特征在于，所述主干路径采用扩散模型，所述扩散模型的反向马尔可夫链过程中每个时间步采用基于残差块的条件式U-Net架构执行逐步去噪。

4.根据权利要求3所述方法，其特征在于，所述基于残差模块的条件式U-Net架构包括编码模块、瓶颈模块、解码模块；p>

5.根据权...

【技术特征摘要】

1.一种融合自监督语义引导与条件调制机制的图像分割方法，所述方法包括：

2.根据权利要求1所述方法，其特征在于，所述条件路径依次包括图像分块嵌入层、分类标记嵌入层、位置编码层、transformer 编码模块，其输入为二维图像，输出为二维图像的语义先验信息。

3.根据权利要求1所述方法，其特征在于，所述主干路径采用扩散模型，所述扩散模型的反向马尔可夫链过程中每个时间步采用基于残差块的条件式u-net架构执行逐步去噪。

4.根据权利要求3所述方法，其特征在于，所述基于残差模块的条件式u-net架构包括编码模块、瓶颈模块、解码模块；

5.根据权利要求4所述方法，其特征在于，所述编码模块、瓶颈模块、解码模块中，每个残差块内部集成时间步条件调制与语义条件调制，其中时间步条件调制将时间步嵌入向量通过时间步条件调制层映射为时间步调制系数后加至中间激活通道进行时间步调制，得到中间激活特征，用于刻画扩散过程中的时间变化；语义...

【专利技术属性】
技术研发人员：陈奇良，马玉良，林如意，孟明，张卫，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人