基于多尺度池化建模的伪装物体实例分割方法、装置及系统制造方法及图纸

技术编号：38200765 阅读：10 留言：0更新日期：2023-07-21 16:42

本发明专利技术公开了一种基于多尺度池化建模的伪装物体实例分割方法、装置及系统，其中方法包括：获取待分割图像；使用带有实例级标签的伪装物体数据对模型进行监督训练，通过监督训练得到待分割图像的多尺度特征的提取结果；基于多尺度特征的提取结果，对待分割图像中的伪装物体利用多尺度池化方式进行处理，得到高分辨率掩码特征和包含全局信息的实例感知结果；基于实例感知结果，利用融合空间注意力的实例归一化方法聚焦高分辨掩码特征，输出模型的预测实例结果。本发明专利技术的技术方案能解决现有实例分割技术在伪装图像数据中分割性能较差的问题。题。题。

全部详细技术资料下载

【技术实现步骤摘要】
基于多尺度池化建模的伪装物体实例分割方法、装置及系统

[0001]本专利技术涉及图像分割
，特别是涉及基于多尺度池化建模的伪装物体实例分割方法、装置及系统。

技术介绍

[0002]根据生物学家的有关研究表明，伪装生物与其周围环境具有高度的相似性，这使得伪装物体的相关视觉任务相比普通物体更具挑战性。近年来，随着伪装物体检测方向的发展，伪装物体实例分割任务也在逐渐发展。
[0003]目前，伪装物体实例分割任务要求算法模型能够在实例级上理解图像中的伪装语义信息，并从图像中分割出伪装物体的所属区域。
[0004]同时研究发现，在多尺度池化建模技术的应用下，提取图像中伪装物体在不同尺度下的细节信息，包括：纹理、形状和边缘等，能够进一步提升算法模型对于伪装物体的信息理解能力，从而提升模型的分割性能。

技术实现思路

[0005]为了解决现有技术的不足，本专利技术提供了基于多尺度池化建模的伪装物体实例分割方法、装置及系统；上述基于多尺度池化建模的伪装物体实例分割方法可用于检测图片中的伪装物体并将其实例级像素分割出来。用户提供一张图像，算法会自动分割出图像中包含有伪装物体的实例级像素区域。
[0006]第一方面，本专利技术提供了一种基于多尺度池化建模的伪装物体实例分割方法；
[0007]获取待分割图像；使用带有实例级标签的伪装物体数据对模型进行监督训练，通过所述监督训练得到待分割图像的多尺度特征的提取结果；
[0008]基于所述多尺度特征的提取结果，对待分割图像中的伪装物体...

【技术保护点】

【技术特征摘要】
1.一种基于多尺度池化建模的伪装物体实例分割方法，其特征在于，包括：获取待分割图像；使用带有实例级标签的伪装物体数据对模型进行监督训练，通过所述监督训练得到待分割图像的多尺度特征的提取结果；基于所述多尺度特征的提取结果，对待分割图像中的伪装物体利用多尺度池化方式进行处理，得到高分辨率掩码特征和包含全局信息的实例感知结果；基于所述实例感知结果，利用融合空间注意力的实例归一化方法聚焦所述高分辨掩码特征，输出模型的预测实例结果。2.如权利要求1所述的一种基于多尺度池化建模的伪装物体实例分割方法，其特征在于，使用带有实例级标签的伪装物体数据对模型进行监督训练，通过所述监督训练得到待分割图像的多尺度特征的提取结果，具体包括：基于金字塔池化Transformer骨干网络，对待分割的伪装图像进行多尺度特征提取；其中，所述金字塔池化Transformer骨干网络，包括：依次连接的第一嵌入块、第二嵌入块、第三嵌入块和第四嵌入块；所述第一嵌入块，对待分割图像进行卷积核大小为7*7的卷积层和1个P2T基础块，输出第一特征图；所述第二嵌入块，对所述第一特征图进行两倍下采样和2个P2T基础块，输出第二特征图；所述第三嵌入块，对所述第二特征图进行两倍下采样和2个P2T基础块，输出第三特征图；所述第四嵌入块，对所述第三特征图进行两倍下采样和6个P2T基础块，输出第四特征图。其中，所述P2T基础块包括：依次连接为一个基于池化的第一多头自注意力模块、第一加法器、第一层归一化层、前馈网络、第二加法器和第二层归一化层。3.如权利要求1所述的一种基于多尺度池化建模的伪装物体实例分割方法，其特征在于，基于所述多尺度特征的提取结果，对待分割图像中的伪装物体利用多尺度池化方式进行处理，得到高分辨率掩码特征和包含全局信息的实例感知结果，具体包括：基于所述第二特征图、第三特征图、第四特征图，通过拼接和展平操作输入到池化学习Transformer结构，得到对应大小的第二高质量掩码图、第三高质量掩码图和第四高质量掩码图及具有全局信息的粗糙实例感知参数；所述粗糙实例感知参数使用全连接层获取位置标签，利用所述位置标签来确定实例感知参数的位置并计算得到当前位置标签的置信度，通过所述位置标签的置信度来过滤不正确的参数，得到过滤后的精确实例感知参数；基于第一特征图和第二高质量掩码图、第三高质量掩码图和第四高质量掩码图，同时输入到多尺度互补特征池化模块，输出一个共享的高分辨率掩码图。4.如权利要求3所述的一种基于多尺度池化建模的伪装物体实例分割方法，其特征在于，所述池化学习Transformer结构，包括：编码器、多尺度特征池化操作器和解码器；其中，所述编码器、所述多尺度特征池化操作器和所述解码器为依次连接关系；所述编码器，包括：依次连接的结构为第三加法器、第一多头可变形自注意力、第四加法器、第一标准化操作模块和第一HS
‑
FFN结构；
所述多尺度特征池化操作器为依次进行的操作是特征恢复操作、三个自适应平均池化操作、展平操作的模块；所述解码器，包括：依次连接的结构为第二多头可变形自注意力、第五加法器、第二标准化操作模块和第二HS
‑
FFN结构；所述编码器的第三加法器将第二特征图、第三特征图、第四特征图与位置编码信息进行连接；所述第一HS
‑
FFN结构和第二HS
‑
FFN结构相同；所述HS
‑
FFN结构，包括：依次连接的卷积核为3*3的卷积层、组归一化层、Hardswish激活层和卷积核为3*3的卷积层。5.如权利要求4所述的一种基于多尺度池化建模的伪装物体实例分割方法，其特征在于，所述多尺度互补特征池化模块的内部结构包括：第一输入端、第二输入端、第三输入端和第四输入端以及多个加法器；其中，所述第一输入端用于输入第一特征图；所述第二输入端用于输入第二高质量掩码图；所述第三输入端用于输入第三高质量掩码图；所述第四输入端用于输入第四高质量掩码图；所述第二高质量掩码图经过两倍上采样处理，与第一特征图进行特征减法和绝对值运算，再经过卷积核为3*3大小的卷积层，得到第一互补特征；所述第三高...

【专利技术属性】
技术研发人员：李臣，焦铬，
申请(专利权)人：衡阳师范学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人