【技术实现步骤摘要】
本专利技术属于医学图像处理和深度学习,具体涉及一种融合自监督语义引导与条件调制机制的图像分割方法及其系统。
技术介绍
1、图像分割作为计算机视觉的核心任务,旨在将输入图像划分为具有语义一致性的区域,在自动驾驶、工业质检、遥感解译、医学诊断等领域具有广泛应用价值。传统方法主要依赖全卷积神经网络(fcn),如unet、deeplabv3+等架构,通过端到端学习实现像素级分类。然而,此类方法存在两大固有局限:
2、标注依赖性高:需大量精确的像素级标注数据训练模型,标注成本高昂且难以覆盖所有场景变化;
3、泛化能力不足:在目标边缘模糊、形态多变或纹理复杂的场景下(如透明物体分割、自然场景细粒度目标分割),分割精度显著下降。
4、近年来,生成式分割方法(如基于扩散模型的分割网络)通过逐步去噪过程学习数据分布,展现出更强的细节重建能力。扩散模型通过模拟数据从噪声状态逐步重建的马尔可夫过程,在自然图像生成任务中取得突破。然而,其在分割任务中存在明显缺陷:
5、结构感知缺失:生成过程缺乏对图像语义结构的显
...【技术保护点】
1.一种融合自监督语义引导与条件调制机制的图像分割方法,所述方法包括:
2.根据权利要求1所述方法,其特征在于,所述条件路径依次包括图像分块嵌入层、分类标记嵌入层、位置编码层、Transformer 编码模块,其输入为二维图像,输出为二维图像的语义先验信息。
3.根据权利要求1所述方法,其特征在于,所述主干路径采用扩散模型,所述扩散模型的反向马尔可夫链过程中每个时间步采用基于残差块的条件式U-Net架构执行逐步去噪。
4.根据权利要求3所述方法,其特征在于,所述基于残差模块的条件式U-Net架构包括编码模块、瓶颈模块、解码模块;
...【技术特征摘要】
1.一种融合自监督语义引导与条件调制机制的图像分割方法,所述方法包括:
2.根据权利要求1所述方法,其特征在于,所述条件路径依次包括图像分块嵌入层、分类标记嵌入层、位置编码层、transformer 编码模块,其输入为二维图像,输出为二维图像的语义先验信息。
3.根据权利要求1所述方法,其特征在于,所述主干路径采用扩散模型,所述扩散模型的反向马尔可夫链过程中每个时间步采用基于残差块的条件式u-net架构执行逐步去噪。
4.根据权利要求3所述方法,其特征在于,所述基于残差模块的条件式u-net架构包括编码模块、瓶颈模块、解码模块;
5.根据权利要求4所述方法,其特征在于,所述编码模块、瓶颈模块、解码模块中,每个残差块内部集成时间步条件调制与语义条件调制,其中时间步条件调制将时间步嵌入向量通过时间步条件调制层映射为时间步调制系数后加至中间激活通道进行时间步调制,得到中间激活特征,用于刻画扩散过程中的时间变化;语义...
【专利技术属性】
技术研发人员:陈奇良,马玉良,林如意,孟明,张卫,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。