融合傅里叶变换的图像语义分割方法及装置制造方法及图纸

技术编号:43839417 阅读:16 留言:0更新日期:2024-12-31 18:35
本申请实施例提供一种融合傅里叶变换的图像语义分割方法及装置,方法包括:构建基于U型网络的分割模型,采用四层卷积池化网络作为编码器进行特征提取;构建傅里叶变换模块,对输入图像进行二维离散傅里叶变换得到频谱图,对频谱图进行幅度谱和相位谱分解得到初始频域特征;将输入图像经过预设尺寸缩放和像素归一化处理得到预处理图像,将预处理图像输入傅里叶变换模块,得到四组调整后的频域特征;采用双线性插值算法将预测概率图的尺寸调整至原始输入图像尺寸,将预测概率图中概率值大于0.5的像素点标记为前景区域,得到最终的语义分割结果;本申请能够更好地处理复杂场景下的语义分割任务,提高了分割精度和模型鲁棒性。

【技术实现步骤摘要】

本申请涉及人工智能领域,具体涉及一种融合傅里叶变换的图像语义分割方法及装置


技术介绍

1、图像语义分割是计算机视觉领域的一个重要研究方向,但现有的分割方法在处理复杂场景和细节特征时仍存在不足。传统的基于深度学习的语义分割方法主要依赖空间域特征,虽然在一些简单场景中表现良好,但在处理纹理丰富、边界模糊等复杂情况时往往效果欠佳。

2、目前主流的语义分割模型大多采用编码器-解码器架构,但在特征提取和融合方面存在局限性。这些模型主要关注空间域信息,忽视了频域特征所包含的全局结构和纹理信息,导致在处理具有复杂纹理模式或规律性结构的图像时效果不理想。同时,现有的特征融合方式较为简单,往往采用直接叠加或拼接的方式,没有充分考虑不同特征的重要性权重。

3、另一个普遍存在的问题是模型的适应性不足。现有方法在处理不同尺度和不同类型的目标时,往往需要针对特定场景进行模型调优,缺乏良好的泛化能力。特别是在处理小目标或细节特征时,由于信息的逐层压缩导致重要特征丢失,影响分割精度。


技术实现思路

1、针对现有技本文档来自技高网...

【技术保护点】

1.一种融合傅里叶变换的图像语义分割方法,其特征在于,所述方法包括:

2.根据权利要求1所述的融合傅里叶变换的图像语义分割方法,其特征在于,所述构建基于U型网络的分割模型,采用四层卷积池化网络作为编码器进行特征提取,其中,每层卷积池化网络由两组卷积层、激活层和批量归一化层组成,每次池化后特征图的空间尺寸减半,通道数加倍,包括:

3.根据权利要求1所述的融合傅里叶变换的图像语义分割方法,其特征在于,所述构建傅里叶变换模块,对输入图像进行二维离散傅里叶变换得到频谱图,对所述频谱图进行幅度谱和相位谱分解得到初始频域特征,包括:

4.根据权利要求1所述的融合傅...

【技术特征摘要】

1.一种融合傅里叶变换的图像语义分割方法,其特征在于,所述方法包括:

2.根据权利要求1所述的融合傅里叶变换的图像语义分割方法,其特征在于,所述构建基于u型网络的分割模型,采用四层卷积池化网络作为编码器进行特征提取,其中,每层卷积池化网络由两组卷积层、激活层和批量归一化层组成,每次池化后特征图的空间尺寸减半,通道数加倍,包括:

3.根据权利要求1所述的融合傅里叶变换的图像语义分割方法,其特征在于,所述构建傅里叶变换模块,对输入图像进行二维离散傅里叶变换得到频谱图,对所述频谱图进行幅度谱和相位谱分解得到初始频域特征,包括:

4.根据权利要求1所述的融合傅里叶变换的图像语义分割方法,其特征在于,所述将所述初始频域特征通过1×1卷积层进行通道数调整,使其与所述编码器各层特征图的通道数分别对应,包括:

5.根据权利要求1所述的融合傅里叶变换的图像语义分割方法,其特征在于,所述将所述输入图像经过预设尺寸缩放和像素归一化处理得到预处理图像,将所述预处理图像输入所述傅里叶变换模块,得到四组调整后的频域特征,包括:

【专利技术属性】
技术研发人员:郑东陈光远张波刘浩苏亮亮赵五岳
申请(专利权)人:杭州宇泛智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1