图像目标检测与分割方法、系统、存储介质和电子设备技术方案

技术编号:35952436 阅读:22 留言:0更新日期:2022-12-14 10:45
本发明专利技术涉及一种图像目标检测与分割方法、系统、存储介质和电子设备,包括:基于多个原始训练图像,对用于图像目标检测与分割的预设深度学习模型进行训练,得到目标深度学习模型;将待测图像输入至所述目标深度学习模型中,得到所述待测图像的目标检测与分割的目标预测结果。本发明专利技术通过对改进的深度学习模型进行训练,加强了模型对图像目标的表达能力,提高了对图像中物体的目标检测和分割精度。对图像中物体的目标检测和分割精度。对图像中物体的目标检测和分割精度。

【技术实现步骤摘要】
图像目标检测与分割方法、系统、存储介质和电子设备


[0001]本专利技术涉及图像处理
,尤其涉及一种图像目标检测与分割方法、系统、存储介质和电子设备。

技术介绍

[0002]随着计算机视觉技术的发展和成熟,其被广泛应用于各个领域。目标检测与分割便是计算机视觉研究的重要问题之一,是理解图像高层语义特征的重要基础,其任务是返回给定图像中的单个或多个特定目标的矩形包围框坐标或区域。现有的图像目标检测与分割算法通常可以被分为两类:一类是两阶段模型,如Faster R

CNN,模型独立的提取候选区域,要先对输入图像筛选出可能存在物体的候选区域,判断候选区域中是否存在目标,然后输出目标类别、位置特征或分割区域。另一种是一阶段模型,如YOLO,模型没有独立提取候选区域,直接输入图像得到图中存在的物体类别、相应的位置特征或分割区域。但上述算法均存在目标检测和分割的精度不高的问题。
[0003]因此,亟需提供一种技术方案解决上述技术问题。

技术实现思路

[0004]为解决上述技术问题,本专利技术提供了一种图像目标检测与分割方法、系统、存储介质和电子设备。
[0005]本专利技术的图像目标检测与分割方法的技术方案如下:
[0006]S1、基于多个原始训练图像,对用于图像目标检测与分割的预设深度学习模型进行训练,得到目标深度学习模型;
[0007]S2、将待测图像输入至所述目标深度学习模型中,得到所述待测图像的目标检测与分割的目标预测结果。
[0008]本专利技术的图像目标检测与分割方法的有益效果如下:
[0009]本专利技术的方法通过对改进的深度学习模型进行训练,加强了模型对图像目标的表达能力,提高了对图像中物体的目标检测和分割精度。
[0010]在上述方案的基础上,本专利技术的图像目标检测与分割方法还可以做如下改进。
[0011]进一步,所述预设深度学习模型包括:原始骨干网络、原始颈部网络和多个原始头部网络;在所述S1之前,还包括:
[0012]S01、采用至少一种标注方式,对每个原始训练图像进行标注,得到每个原始训练图像对应的至少一种标注训练图像;
[0013]所述S1包括:
[0014]S11、将任一原始训练图像输入至所述原始骨干网络进行多尺度图像特征提取,得到所述任一原始训练图像对应的第一训练图像;
[0015]S12、将所述任一原始训练图像对应的第一训练图像输入至所述原始颈部网络进行图像特征提取,得到所述任一原始训练图像对应的第二训练图像;
[0016]S13、将所述任一原始训练图像对应的第二训练图像分别输入至每个原始头部网络中进行预测,得到所述任一原始训练图像在每个原始头部网络中的训练预测结果,直至得到每个原始训练图像分别在每个原始头部网络中训练预测结果;
[0017]S14、基于每个原始训练图像对应的所有训练预测结果和至少一种标注训练图像进行损失计算,得到并根据损失计算结果对所述预设深度学习模型进行优化,将优化后的预设深度学习模型作为所述预设深度学习模型并返回执行S11进行迭代训练,直至所述预设深度学习模型收敛时,将所述预设深度学习模型收敛时所对应的优化后的预设深度学习模型确定为所述目标深度学习模型。
[0018]进一步,所述原始骨干网络包括:多个第一卷积层和多个第一下采样层,每个第一卷积层的输出端分别对应连接一个第一下采样层的输入端;所述S11包括:
[0019]将所述任一原始训练图像输入至所述原始骨干网络的首个第一卷积层,并依次通过所有的第一卷积层和所有的第一下采样层,对所述任一原始训练图像进行多尺度图像特征提取,得到所述任一原始训练图像对应的第一训练图像。
[0020]进一步,所述原始颈部网络包括:至少一个第二卷积层和至少一个第一上采样层,每个第二卷积层的输出端分别对应连接一个第一上采样层的输入端;所述S12包括:
[0021]将所述任一原始训练图像对应的第一训练图像输入至所述原始颈部网络的首个第二卷积层,并依次通过所有的第二卷积层和所有的第一上采样层,对所述任一原始训练图像对应的第一训练图像进行图像特征提取,得到所述任一原始训练图像对应的第二训练图像。
[0022]进一步,所述多个原始头部网络包括:预设目标分类头部网络、预设目标检测头部网络、预设图像分割头部网络和预设中心骨架头部网络;所述任一原始训练图像的训练预测结果包括:第一训练预测结果、第二训练预测结果、第三训练预测结果和第四训练预测结果;所述将所述任一原始训练图像对应的第二训练图像分别输入至每个原始头部网络中进行预测,得到所述任一原始训练图像在每个原始头部网络中的训练预测结果的步骤,包括:
[0023]将所述任一原始训练图像对应的第二训练图像输入至所述预设目标分类头部网络中进行预测,得到所述任一原始训练图像进行目标分类所得到的第一训练预测结果;
[0024]将所述任一原始训练图像对应的第二训练图像输入至所述预设目标检测头部网络中进行预测,得到所述任一原始训练图像进行目标检测所得到的第二训练预测结果;
[0025]将所述任一原始训练图像对应的第二训练图像输入至所述预设图像分割头部网络中进行预测,得到所述任一原始训练图像进行图像分割所得到的第三训练预测结果;
[0026]将所述任一原始训练图像对应的第二训练图像输入至所述预设中心骨架头部网络中进行预测,得到所述任一原始训练图像进行中心骨架提取所得到的第四训练预测结果。
[0027]采用上述进一步技术方案的有益效果是:通过在深度学习模型的头部网络加入中心骨架网络,能够帮助目标检测头部网络和图像分割头部网络获取更多物体形态的特征,以提高物体检测和图像分割的精度。
[0028]进一步,所述对任一原始训练图像进行标注,得到所述任一原始训练图像对应的至少一种标注训练图像的步骤,包括:
[0029]基于物体的类别,对所述任一原始训练图像中的每个物体进行标注,得到包含每
个物体的标注类别信息的第一标注训练图像;
[0030]基于物体的位置,对所述任一原始训练图像中的每个物体进行标注,得到包含每个物体的位置信息的第二标注训练图像;
[0031]对所述任一原始训练图像中的每个物体进行掩膜处理,得到包含每个物体的掩膜信息的第三标注训练图像;
[0032]获取所述任一原始训练图像对应的第三标注训练图像中每个物体的中心骨架,并按照预设排列顺序,将所有的中心骨架进行排列,得到第四标注训练图像。
[0033]采用上述进一步技术方案的有益效果是:通过对训练图像中的物体实例提取中心骨架并表示为按照设定顺序排列的点列,以使物体保留了其形态相关的特征,加强了模型对图像目标的表达能力,更有利于模型学习与物体相关的特征关系,提高物体的检测和分割精度。
[0034]进一步,所述目标预测结果为:所述待测图像的目标检测结果和所述待测图像的图像分割结果。
[0035]本专利技术的图像目标检测与分割系统的技术方案如下:<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像目标检测与分割方法,其特征在于,包括:S1、基于多个原始训练图像,对用于图像目标检测与分割的预设深度学习模型进行训练,得到目标深度学习模型;S2、将待测图像输入至所述目标深度学习模型中,得到所述待测图像的目标检测与分割的目标预测结果。2.根据权利要求1所述的图像目标检测与分割方法,其特征在于,所述预设深度学习模型包括:原始骨干网络、原始颈部网络和多个原始头部网络;在所述S1之前,还包括:S01、采用至少一种标注方式,对每个原始训练图像进行标注,得到每个原始训练图像对应的至少一种标注训练图像;所述S1包括:S11、将任一原始训练图像输入至所述原始骨干网络进行多尺度图像特征提取,得到所述任一原始训练图像对应的第一训练图像;S12、将所述任一原始训练图像对应的第一训练图像输入至所述原始颈部网络进行图像特征提取,得到所述任一原始训练图像对应的第二训练图像;S13、将所述任一原始训练图像对应的第二训练图像分别输入至每个原始头部网络中进行预测,得到所述任一原始训练图像在每个原始头部网络中的训练预测结果,直至得到每个原始训练图像分别在每个原始头部网络中训练预测结果;S14、基于每个原始训练图像对应的所有训练预测结果和至少一种标注训练图像进行损失计算,得到并根据损失计算结果对所述预设深度学习模型进行优化,将优化后的预设深度学习模型作为所述预设深度学习模型并返回执行S11进行迭代训练,直至所述预设深度学习模型收敛时,将所述预设深度学习模型收敛时所对应的优化后的预设深度学习模型确定为所述目标深度学习模型。3.根据权利要求2所述的图像目标检测与分割方法,其特征在于,所述原始骨干网络包括:多个第一卷积层和多个第一下采样层,每个第一卷积层的输出端分别对应连接一个第一下采样层的输入端;所述S11包括:将所述任一原始训练图像输入至所述原始骨干网络的首个第一卷积层,并依次通过所有的第一卷积层和所有的第一下采样层,对所述任一原始训练图像进行多尺度图像特征提取,得到所述任一原始训练图像对应的第一训练图像。4.根据权利要求2所述的图像目标检测与分割方法,其特征在于,所述原始颈部网络包括:至少一个第二卷积层和至少一个第一上采样层,每个第二卷积层的输出端分别对应连接一个第一上采样层的输入端;所述S12包括:将所述任一原始训练图像对应的第一训练图像输入至所述原始颈部网络的首个第二卷积层,并依次通过所有的第二卷积层和所有的第一上采样层,对所述任一原始训练图像对应的第一训练图像进行图像特征提取,得到所述任一原始训练图像对应的第二训练图像。5.根据权利要求2所述的图像目标检测与分割方法,其特征在于,所述多个原始头部网络包括:预设目标分类头部网络、预设目标检测头部网络、预设图像分割...

【专利技术属性】
技术研发人员:袁铭康李叶许乐乐徐金中郭丽丽马忠松金山
申请(专利权)人:中国科学院空间应用工程与技术中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1