一种图像分割方法、系统、存储介质及设备技术方案

技术编号：40529628 阅读：6 留言：0更新日期：2024-03-01 13:50

本发明专利技术公开了一种图像分割方法、系统、存储介质及设备，本发明专利技术的分割模型分别采用Resnet50网络和Vision Transformer网络生成输入图像的第一CAM和第二CAM，将两个CAM中的值进行取最大值结合，基于结合后的第三CAM中每个类别的高鉴别性区域和低鉴别性区域，生成高鉴别性区域CAM和低鉴别性区域CAM，获得更均衡和更全面的分割结果，不会出现现有方法低覆盖率和准确性的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种图像分割方法、系统、存储介质及设备，属于图像处理领域。

技术介绍

1、图像的弱监督语义分割旨在根据弱监督标签，对图像中的目标实现准确的像素级分类预测。目前常用的分割方法包括基于cnn（convolutional neural network ，卷积神经网络）的方法和基于vision transformer的方法；其中，基于cnn的方法采用cam（classactivation map，类激活图）作为初始组件，由于cam只关注于目标对象中最具鉴别性的部分区域，因此该方法利用这一特性获取小而精确的高鉴别性区域（在识别为当前类别的区域中，值排在前1/4的区域被认为是高鉴别性区域），即仅激活与目标相关的高鉴别性区域，因高鉴别性区域仅占据目标对象整体区域的一小部分，这就导致该方法能够预测出的目标区域太小，即低覆盖率；而基于vision transformer的注意力机制可以帮助cam激活许多与目标相关的低鉴别性区域（在识别为当前类别的区域中，值排在1/4到5/6的区域被认为是低鉴别性区域），但同时也激活了一些非目标区域，从而导致该方法的预测精度较低，即低准确性。

技术实现思路

1、本专利技术提供了一种图像分割方法、系统、存储介质及设备，解决了
技术介绍
中披露的问题。

2、为了解决上述技术问题，本专利技术所采用的技术方案是：

3、一种图像分割方法，包括：

4、获取待分割的图像；

5、将待分割的图像输入预先训练的分割模型，获得图像结果；

6、其中，分割模型中的图像处理过程为：

7、分别采用resnet50网络和vision transformer网络，生成输入图像的第一cam和第二cam；其中，在生成第二cam的过程中，将一个卷积层输出的特征作为一个块的输入；卷积层为resnet50网络的卷积层，块为vision transformer网络的块；

8、遍历第一cam中的值，将第一cam中的值与第二cam中对应位置处的值进行比较，获取最大值；

9、根据所有的最大值，生成第三cam；

10、将第三cam中每个类别的高鉴别性区域作为掩码生成第一权重，根据拼接的卷积层输出特征和第一权重，生成高鉴别性区域cam；

11、将第三cam中每个类别的低鉴别性区域作为掩码生成第二权重，根据拼接的块输出特征和第二权重，生成低鉴别性区域cam；

12、将高鉴别性区域cam和低鉴别性区域cam相加，获得最终的结果。

13、在resnet50网络和vision transformer网络中，如果第 i个卷积层输出特征的尺寸与第 m-1个块输出特征的尺寸一致，则将第 i个卷积层输出的特征作为第 m个块的输入。

14、根据拼接的卷积层输出特征和第一权重，生成高鉴别性区域cam，包括：

15、根据拼接的卷积层输出特征和第一权重，生成resnet50特征原型；

16、对resnet50特征原型和拼接的卷积层输出特征进行余弦相似性的计算，获得第一余弦相似度图；

17、将第一余弦相似度图经过relu函数处理，生成高鉴别性区域cam。

18、卷积层输出特征拼接为：剔除第一个卷积层输出的特征，将剩余卷积层输出的特征进行拼接。

19、根据拼接的块输出特征和第二权重，生成低鉴别性区域cam，包括：

20、根据拼接的块输出特征和第二权重，生成vision transformer特征原型；

21、对vision transformer特征原型和拼接的块输出特征进行余弦相似性的计算，获得第二余弦相似度图；

22、将第二余弦相似度图经过relu函数处理，生成低鉴别性区域cam。

23、块输出特征拼接为：将第 m+1块输出的特征至最后一个块输出的特征进行拼接；其中，第 m块为输入卷积层输出特征的块。

24、生成特征原型的公式为：

25、；

26、式中， p c为特征原型， m为当前图像中属于类别 c的鉴别性区域的像素点的个数，( i, j)为像素点的坐标， r c为当前图像中属于类别 c的鉴别性区域，为( i, j)位置对应的权重， h( i, j)为拼接的卷积层输出特征在( i, j)位置上的值。

27、一种图像分割系统，包括：

28、图像获取模块，获取待分割的图像；

29、分割模块，将待分割的图像输入预先训练的分割模型，获得图像分割结果；

30、其中，分割模型中的图像处理过程为：

31、分别采用resnet50网络和vision transformer网络，生成输入图像的第一cam和第二cam；其中，在生成第二cam的过程中，将一个卷积层输出的特征作为一个块的输入；卷积层为resnet50网络的卷积层，块为vision transformer网络的块；

32、遍历第一cam中的值，将第一cam中的值与第二cam中对应位置处的值进行比较，获取最大值；

33、根据所有的最大值，生成第三cam；

34、将第三cam中每个类别的高鉴别性区域作为掩码生成第一权重，根据拼接的卷积层输出特征和第一权重，生成高鉴别性区域cam；

35、将第三cam中每个类别的低鉴别性区域作为掩码生成第二权重，根据拼接的块输出特征和第二权重，生成低鉴别性区域cam；

36、将高鉴别性区域cam和低鉴别性区域cam相加，获得最终的图像分割结果。

37、一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序包括指令，所述指令当由计算设备执行时，使得所述计算设备执行图像分割。

38、一种计算机设备，包括一个或多个处理器、以及一个或多个存储器，一个或多个程序存储在所述一个或多个存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序包括用于执行图像分割的指令。

39、本专利技术所达到的有益效果：本专利技术的分割模型分别采用resnet50网络和visiontrans本文档来自技高网...

【技术保护点】

1.一种图像分割方法，其特征在于，包括：

2.根据权利要求1所述的图像分割方法，其特征在于，在Resnet50网络和VisionTransformer网络中，如果第i个卷积层输出特征的尺寸与第m-1个块输出特征的尺寸一致，则将第i个卷积层输出的特征作为第m个块的输入。

3.根据权利要求1所述的图像分割方法，其特征在于，根据拼接的卷积层输出特征和第一权重，生成高鉴别性区域CAM，包括：

4.根据权利要求3所述的图像分割方法，其特征在于，卷积层输出特征拼接为：剔除第一个卷积层输出的特征，将剩余卷积层输出的特征进行拼接。

5.根据权利要求1所述的图像分割方法，其特征在于，根据拼接的块输出特征和第二权重，生成低鉴别性区域CAM，包括：

6.根据权利要求5所述的图像分割方法，其特征在于，块输出特征拼接为：将第m+1块输出的特征至最后一个块输出的特征进行拼接；其中，第m块为输入卷积层输出特征的块。

7.根据权利要求3或5所述的图像分割方法，其特征在于，生成特征原型的公式为：

8.一种图像分割系统，其特征在于，包括：

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序包括指令，所述指令当由计算设备执行时，使得所述计算设备执行权利要求1~7所述的任一方法。

10.一种计算机设备，其特征在于，包括：

...

【技术特征摘要】

1.一种图像分割方法，其特征在于，包括：

2.根据权利要求1所述的图像分割方法，其特征在于，在resnet50网络和visiontransformer网络中，如果第i个卷积层输出特征的尺寸与第m-1个块输出特征的尺寸一致，则将第i个卷积层输出的特征作为第m个块的输入。

3.根据权利要求1所述的图像分割方法，其特征在于，根据拼接的卷积层输出特征和第一权重，生成高鉴别性区域cam，包括：

4.根据权利要求3所述的图像分割方法，其特征在于，卷积层输出特征拼接为：剔除第一个卷积层输出的特征，将剩余卷积层输出的特征进行拼接。

5.根据权利要求1所述的图像分割方法，其特征在于，根据拼接...

【专利技术属性】
技术研发人员：李军侠，李进盼，
申请(专利权)人：南京信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人