System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于图像目标的分类及定位的方法、电子设备和存储介质技术_技高网

用于图像目标的分类及定位的方法、电子设备和存储介质技术

技术编号:39963994 阅读:6 留言:0更新日期:2024-01-09 00:16
本公开涉及用于图像目标的分类及定位的方法、电子设备和存储介质等。该方法包括:获取待处理图像;对图像进行特征提取处理、特征融合处理和预测处理,得到带有各目标的区域框和类别的特征图;对所述特征图进行掩码判别处理,得到所述图像中的各目标的掩码;对所述特征图进行空间定位处理,得到各目标形成的空间图的推理结果,校正各目标的区域框位置和类别。利用本公开的方法能够提高对图像目标的分类及定位操作的准确度和速度。

【技术实现步骤摘要】

本公开涉及人工智能领域,特别涉及用于图像目标的分类及定位的方法、电子设备和存储介质等。


技术介绍

1、目标检测(object detection)的任务是找出图像中所有感兴趣的目标,确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类目标有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题之一。


技术实现思路

1、本公开实施例提供了用于图像目标的分类及定位的方法、以及相应的执行这些方法的电子设备、计算设备和非暂时性机器可读存储介质等。

2、根据本公开的第一个方面,提供了一种用于图像目标的分类及定位的方法,包括:获取待处理图像;对图像进行特征提取处理、特征融合处理和预测处理,得到带有各目标的区域框和类别的特征图;对所述特征图进行掩码判别处理,得到所述图像中的各目标的掩码;对所述特征图进行空间定位处理,得到各目标形成的空间图的推理结果,校正各目标的区域框位置和类别。

3、可选地,所述特征提取处理为多尺度特征提取,包括:对输入至少一个阶段的中间特征图依次进行第一幻影处理和通道注意力处理;以及将所述中间特征图与经过所述第一幻影处理和所述通道注意力处理后的中间特征图进行第一拼接处理。

4、可选地,对所述特征图进行掩码判别处理,得到所述图像中的各目标的掩码,包括:先对所述特征图进行边缘像素提取,再将所提取的边缘像素进行预测判断得到图像中目标的类别;所述边缘像素提取包括:对所述特征图进行边缘特征强化处理,获取边缘特征像素点,选取在所述边缘特征像素点周围的任意k个像素点进行独立预测,对独立预测后确定的边缘特征像素点通过转置卷积和双线性插值进行上采样,获取更细的边缘像素曲线,从而提取出所述边缘像素,其中k为自然数;所述预测判断包括:利用形状和尺寸对各目标区域的特征图进行像素块修正处理,将所提取的边缘像素点的各像素值与对应的权重进行点乘的结果根据rgb模型来与各类标签像素值进行阈值对比,确定所述边缘像素点的类别,从而得到目标的类别。

5、可选地,所述特征提取处理还包括:对输入的初始图像依次进行两次逐通道卷积处理,得到第一中间特征图;将所述第一中间特征图依次进行卷积处理、第一幻影处理、通道注意力处理、卷积处理得到第二中间特征图,并且还将所述第一中间特征图进行一次卷积处理得到第三中间特征图;将第二中间特征图和第三中间特征图进行拼接。

6、可选地,所述两次逐通道卷积处理缩小了所述图像的在高度和宽度的维度上的尺寸和/或增加了所述图像的通道数。

7、可选地,所述第一幻影处理包括:对所述中间特征图依次执行卷积处理和逐通道卷积处理;以及将经过所述卷积处理后的中间特征图与依次经过所述卷积处理和所述逐通道卷积处理后的中间特征图进行拼接处理。

8、可选地,所述第一幻影处理在所述拼接处理之后还包括:对经过所述拼接处理后的中间特征图依次执行卷积处理和逐通道卷积处理;以及将经过所述卷积处理后的中间特征图与经过所述逐通道卷积处理后的中间特征图进行拼接处理,拼接后的中间特征图作为所述通道注意力处理的输入。

9、可选地,所述通道注意力处理包括:对所述中间特征图依次执行全局池化处理、卷积处理、和sigmoid函数处理;以及将经过所述sigmoid函数处理得到的各通道的权重值与所述中间特征图的对应通道的特征图进行逐元素相乘操作。

10、可选地,所述特征融合处理包括特征金字塔网络处理,其包括:对所述特征提取处理得到的最小尺寸特征图执行上采样处理;将经过所述上采样处理后的特征图与次小尺寸特征图进行拼接处理,得到融合特征图;对所述融合特征图执行第二幻影处理;其中,所述第二幻影处理包括:对所述融合特征图依次执行两次卷积处理、以及一次逐通道卷积处理,得到第一融合特征图;对经过前述第一次卷积处理后的所述融合特征图执行另一次卷积处理,得到第二融合特征图;以及将第一融合特征图与第二融合特征图进行拼接处理。

11、可选地,所述特征融合处理在所述特征金字塔网络处理之后还包括路径聚合网络处理,其包括:对所述特征金字塔网络处理获得的最大尺寸融合特征图进行下采样处理;将经过所述下采样处理后的最大尺寸融合特征图与次大尺寸融合特征图进行拼接处理;对经过所述拼接处理后的融合特征图执行所述第二幻影处理。

12、可选地,所述空间定位处理包括:从所述特征图中的各目标的视觉特征中学习一个稀疏邻接矩阵,在所述稀疏邻接矩阵中各目标以其相关性最强的前t个目标作为邻接节点,其中t为大于1的整数;根据具有可学习参数的高斯核来计算各目标与其邻接目标之间的空间信息,得到相应高斯核权重;以及将各目标的类别软映射得到的视觉嵌入、所述稀疏邻接矩阵与所述高斯核权重进行图卷积处理,得到各目标形成的空间图的推理结果,校正各目标的区域框位置和类别。

13、根据本公开的第二个方面,提供了一种电子设备,包括:摄像头,用于拍摄图像;处理器;存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器对所述摄像头拍摄的图像执行如上述第一方面所述的方法,从而获得所述图像中包含的目标的位置和类别;以及展示/预警部件,用于根据所获得的目标的位置和类别来向用户进行相应的展示和/或预警。

14、根据本公开的第三个方面,提供了一种计算设备,包括:处理器;以及存储器,其上存储有可执行代码,当可执行代码被处理器执行时,使处理器执行如上述第一方面所述的方法。

15、根据本公开的第四个方面,提供了一种非暂时性机器可读存储介质,其上存储有可执行代码,当可执行代码被电子设备的处理器执行时,使处理器执行如上述第一方面所述的方法。

本文档来自技高网...

【技术保护点】

1.一种用于图像目标的分类及定位的方法,包括:

2.根据权利要求1所述的方法,其中,

3.根据权利要求1所述的方法,其中,

4.根据权利要求2所述的方法,其中,所述特征提取处理还包括:

5.根据权利要求4所述的方法,其中,所述两次逐通道卷积处理缩小了所述图像的在高度和宽度的维度上的尺寸和/或增加了所述图像的通道数。

6.根据权利要求2所述的方法,其中,所述第一幻影处理包括:

7.根据权利要求6所述的方法,其中,所述第一幻影处理在所述拼接处理之后还包括:

8.根据权利要求2所述的方法,其中,所述通道注意力处理包括:

9.根据权利要求1所述的方法,其中,所述特征融合处理包括特征金字塔网络处理,其包括:

10.根据权利要求9所述的方法,其中,所述特征融合处理在所述特征金字塔网络处理之后还包括路径聚合网络处理,其包括:

11.根据权利要求1所述的方法,其中,

12.一种电子设备,包括:

13.一种计算设备,包括:

14.一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-11中任一项所述的方法。

...

【技术特征摘要】

1.一种用于图像目标的分类及定位的方法,包括:

2.根据权利要求1所述的方法,其中,

3.根据权利要求1所述的方法,其中,

4.根据权利要求2所述的方法,其中,所述特征提取处理还包括:

5.根据权利要求4所述的方法,其中,所述两次逐通道卷积处理缩小了所述图像的在高度和宽度的维度上的尺寸和/或增加了所述图像的通道数。

6.根据权利要求2所述的方法,其中,所述第一幻影处理包括:

7.根据权利要求6所述的方法,其中,所述第一幻影处理在所述拼接处理之后还包括:

8.根据权利要求2所述...

【专利技术属性】
技术研发人员:唐曦煜寸毛毛
申请(专利权)人:湖北星纪魅族科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1