基于图像局部边缘的目标分割方法、设备及介质技术

技术编号:39000946 阅读:12 留言:0更新日期:2023-10-07 10:32
本发明专利技术公开一种基于图像局部边缘的目标分割方法,获取原始图像和初始分割图像,将原始图像中的多个通道图像转化为单通道图像,将初始分割图像膨胀扩大,得到候选分割区域;在候选分割区域内对单通道图像做梯度计算;基于梯度的邻域像素迭代标记获取新像素,作为梯度局部极大值像素;基于该极大值像素梯度方向计算对应的邻域保留像素和邻域删除像素,获得梯度极大值像素集合、保留像素集合、删除像素集合,从候选分割区域中去掉删除像素集合,经过形态学后处理,得到优化分割目标。得到优化分割目标。得到优化分割目标。

【技术实现步骤摘要】
基于图像局部边缘的目标分割方法、设备及介质


[0001]本申请涉及人工智能、图像处理目标分割
,具体是一种基于图像局部边缘的目标分割方法。

技术介绍

[0002]目标分割(Object segmentation)是计算机视觉领域的一项关键技术,它旨在将图像中的目标与背景区分开来。目标分割技术的发展可概括为以下几个阶段:
[0003]1.传统图像处理方法:这些方法主要依赖于图像的颜色、纹理和形状等特征,如阈值分割、区域生长、边缘检测等。
[0004]2.机器学习方法:这些方法使用特征提取器和分类器进行目标分割。常见的机器学习方法包括支持向量机(SVM)、决策树、随机森林等。
[0005]3.深度学习方法:随着深度学习的发展,卷积神经网络(CNN)在目标分割任务中表现出色。典型的深度学习方法有:
[0006]全卷积网络(FCN):将卷积神经网络的全连接层替换为卷积层,实现逐像素分类。
[0007]U

Net:一种具有跳跃连接的对称卷积神经网络,适用于医学图像分割等任务。Mask R

CNN:在Faster R

CNN的基础上,增加一个分支用于生成目标的像素级掩码。
[0008]DeepLab:采用空洞卷积、空间金字塔池化(ASPP)和条件随机场(CRF)等技术,提高分割精度。
[0009]目标分割技术在自动驾驶、医学图像分析、视频监控、人机交互、笔迹鉴别等领域有广泛应用。目标分割算法的精度除了依据分割算法,很大程度也取决于训练数据,对像素标注的要求主要包括以下几点:
[0010]1.准确性:像素标注需要准确地将目标对象与背景分离,确保每个像素都被正确分类。
[0011]2.连续性:同一目标对象的像素标注应保持连续,避免出现断裂或孤立的像素点。
[0012]3.边缘清晰:目标对象的边缘应该尽可能清晰,以提高分割结果的质量。
[0013]4.一致性:对于同类对象,像素标注应具有一致性,遵循相同的规则和标准。
[0014]5.标注速度:为了提高工作效率,像素标注过程应尽可能快速,同时保证标注质量。像素级别的标注任务通常需要大量的人工劳动,标注质量直接影响模型的表现。
[0015]研究中发现,在签名笔迹分割标注方面,尤其是小物体时存在边缘模糊或过渡区域较大时,存在很大的挑战。由于小物体的尺寸较小,边缘细节相对复杂,因此在分割标注过程中,基本只能快速将目标中心像素标注出来,很难将边缘也准确、一致性的快速标注。这种情况对后续模型训练和算法评测产生了较大的影响,识别结果准确性降低。
[0016]如图1所示,为“王”字笔画及局部笔画细节放大示意图,通过对最后一笔画细节进行放大可以看出,边缘细节是非常模糊的,很难去定义一个人工标注可执行的统一标准。
[0017]边缘标注的不准确会导致模型训练时无法充分学习到物体边缘的特征,从而影响分割效果。其次,由于标注一致性差,可能会导致模型训练时出现过拟合或者欠拟合的问
题,进一步降低模型的泛化能力。最后,不易于后续算法评测,因为评价指标如IoU和准确率等可能会受到标注质量的影响,从而无法准确地反映算法性能。
[0018]公开号:CN116152274A,名称一种图像分割方法、装置、设备及存储介质,公开了一种图像分割方法,可以在粗分割后得到的初始分割图像的基础上,根据梯度向量在原始图像中每个像素点上对应的梯度变化,通过路径寻优的方式,对原始图像进行细分割从而可以提升图像分割的准确率。但对于模糊边界,上述点特征对于筛选边界点效果并不好。分割寻优路径算法中,特征点和特征点的配对有很多种,计算量非常大,同时由于特征点间距离增大后,容易出现不是同一边缘特征点误匹配情况,导致边缘计算错误。该方法没有给出如何基于边缘得到更佳分割效果的具体方法。
[0019]公开号CN114037710A,名称“图像分割方法”的中国专利技术专利申请,公开一种图像分割方法,目标分割图像中各元素指示视频图像帧中对应像素点属于前景物体的目标分割置信度,根据视频图像帧中的各候选区域的像素梯度和视频图像帧的像素梯度,确定视频图像帧中存在运动模糊的目标图像区域,根据设定阈值,对目标图像区域中各像素点对应的目标分割置信度进行修正,根据修正后的目标分割图像,对视频图像帧进行图像分割,根据梯度变化监测出运动模糊区域,并对其分割结果进行修正,提升了图像分割的准确度。该方法主要解决视频连续帧的运动模糊,需要利用视频帧间的信息。
[0020]上述方法致力于研究在模糊区域寻找连续且封闭的单像素边缘,效果容易受到模糊区域噪音的影响。

技术实现思路

[0021]本专利技术所要解决的问题是,基于小物体目标分割时存在边缘模糊和过渡区域较大,边缘标注和预测存在的准确性差、一致性差等难点,且现有技术计算量非常大、计算错误率高等问题。本申请基于局部边缘极大值对分割预测结果进行修正,提高如签名等小图像目标分割时边缘标注或预测的一致性,以及提高边缘像素标注准确性的问题。
[0022]本申请并未致力于在模糊区域寻找连续且封闭的单像素边缘,而是通过梯度大小和方向对模糊区域进行删除、保留等像素集合的划分,因此具有较小计算量、较强鲁棒性,并且实现边缘标注和预测准确性高、一致性高的目的。
[0023]本申请解决上述技术问题的技术方案是,基于本申请的一方面,提出一种基于图像局部边缘的目标分割方法,获取原始图像和初始分割图像,将原始图像中的多通道图像转化为单通道图像,将初始分割图像区域扩大,得到候选分割区域;在候选分割区域内计算单通道图像梯度的幅值和方向;基于梯度幅值顺序迭代标记候选分割区域内像素;从候选分割区域中去掉标记为不同类型像素集合,得到优化分割目标。
[0024]进一步优选,所述将多个通道图像转化为单通道图像包括,统计彩色图像的R、G、B通道和转换的灰度通道中原始图像在初始分割图像范围的图像前景集合和背景集合,计算前景或背景灰度值二分类的等错误率,选择等错误率最小的通道为最优通道,将原始图像中的多通道图像通过最优通道转化为单通道图像。
[0025]进一步优选,所述将初始分割图像区域扩大包括,如果初始分割图像存在欠分割,对于需要扩大边缘区域的图像,使用3*3形态学算子进行操作,对于需要膨胀范围的图像,采用多次3*3的形态学算子或者5*5的形态学算子进行操作,扩大初始分割图像区域。
[0026]进一步优选,所述计算单通道图像梯度的幅值和方向包括,利用卷积核对图像进行卷积,计算图像每个像素的水平和垂直梯度值G
x
和G
y
,调用公式:
[0027]|G|=|G
x
|+|G
y
|
[0028][0029]计算单通道图像梯度幅值|G|和方向角度θ
[0030]进一步优选,迭代标记候选分割区域内像素包括,计算目标图像梯度的大小和方向,基于梯度幅值顺序排列未标记像素集合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图像局部边缘的目标分割方法,其特征在于,获取原始图像和初始分割图像,将原始图像中的多通道图像转化为单通道图像,将初始分割图像区域扩大,得到候选分割区域;在候选分割区域内计算单通道图像梯度的幅值和方向;基于梯度幅值顺序迭代标记候选分割区域内像素;从候选分割区域中去掉标记为不同类型像素集合,得到优化分割目标。2.根据权利要求1所述的方法,其特征在于,所述将多个通道图像转化为单通道图像包括,统计彩色图像的R、G、B通道和转换的灰度通道中原始图像在初始分割图像范围的图像前景集合和背景集合,计算前景或背景灰度值二分类的等错误率,选择等错误率最小的通道为最优通道,将原始图像中的多通道图像通过最优通道转化为单通道图像。3.根据权利要求1所述的方法,其特征在于,所述将初始分割图像区域扩大包括,如果初始分割图像存在欠分割,对于需要扩大边缘区域的图像,使用3*3形态学算子进行操作,对于需要膨胀范围的图像,采用多次3*3的形态学算子或者5*5的形态学算子进行操作,扩大初始分割图像区域。4.根据权利要求1所述的方法,其特征在于,所述计算单通道图像梯度的幅值和方向包括,利用卷积核对图像进行卷积,计算图像每个像素的水平和垂直梯度值G
x
和G
y
,调用公式:|G|=|G
x
|+|C
y
|计算单通道图像梯度幅值|G|和方向角度θ。5.根据权利要求1

4其中之一所述的方法,其特征在于,迭代标记候选分割区域内像素包括,计算目标图像梯度的大小和方向,基于梯度幅值顺序排列未标记像素集合;在未标记像素集合中过滤掉所有梯度幅值小于设定梯度阈值的像素,并标记为梯度极小值;每次获取新的最大梯度的未标记像素,作为梯度极大值,通过...

【专利技术属性】
技术研发人员:覃勋辉申发海刘科张岩
申请(专利权)人:重庆西部笔迹大数据研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1