一种基于全局抠图的训练数据增强方法技术

技术编号：35641169 阅读：26 留言：0更新日期：2022-11-19 16:32

本发明专利技术公开了一种基于全局抠图的训练数据增强方法,算法读入待增强图片及其对应的三分图，并把抠图问题建模为前景背景像素组合优化问题，使用基于采样的抠图算法，为每个未知像素在前景背景像素采样子集中选择出最优的前景背景像素对，并通过最优像素对计算出该未知像素的透明度遮罩值。最优像素对的选择是通过计算每个像素对的评估函数值，并从中选出最优的解来实现的，其中评估函数值的计算涉及颜色、坐标等多个判据。本发明专利技术通过抠图的方式，对训练数据进行图像增强；同时通过采样的方式，实现对抠图问题的高效率求解。本发明专利技术使用简单，计算量少，对输入的训练图片没有特殊要求，可以快速有效的对训练图片进行数据增强。可以快速有效的对训练图片进行数据增强。可以快速有效的对训练图片进行数据增强。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于全局抠图的训练数据增强方法

[0001]本专利技术涉及涉及图像训练数据增强领域，具体涉及一种基于全局抠图的训练数据增强方法。

技术介绍

[0002]大数据时代下的每一张图像数据都来之不易，丰富而多样的数据越来越成为一种无形的财富。红外线与可见光相比具有较强的适应性和抗干扰性，因此红外成像技术在许多领域有广泛的应用。但复杂环境下的红外辐射传输特性使得红外图像存在信噪比低、弱细节模糊和对比度不强等问题。图像抠图是一种从数字图像中将用户感兴趣的部分(即前景部分)从图像其他部分中分离岀来的一种数字图像处理技术。数字图像的合成公式描述为：C＝αF+(1
‑
α)B，C,F和B分别表示合成图像、前景图像和背景图像。目前的抠图算法主要分为三类：基于采样的方法，基于传播的方法以及基于深度学习的方法。
[0003]以往在解决红外图像在复杂背景下目标物体不突出的问题时，通常是采用更深的神经网络来处理，而与此同时也带来的更高的计算量。而对杂乱背景进行抑制会提高网络性能，但是这方面的工作在之前很少被重视。

技术实现思路

[0004]本专利技术的目的在于克服现有红外图像中目标物体不突出，神经网络难以学习的问题，提供一种基于全局抠图的训练数据增强方法。本专利技术通过抠图的方式对原图中感兴趣的部分进行增强操作，从而降低神经网络提取到有效特征的难度，实现对训练数据的增强。实现该方案需要两个部分，一是通过采样抠图方法，根据指定三分图对原图进行抠图处理，二是对抠图得到的透明度遮罩进行导向滤波。
[...

【技术保护点】

【技术特征摘要】
1.一种基于全局抠图的训练数据增强方法，其特征在于，包括以下步骤：(a)算法读入待训练数据，首先按将图片长边缩放至64的比例，对图像进行等比例缩放；(b)依据输入的三分图，对图像中前景和背景区域的像素进行边缘采样；(c)依据输入的三分图，遍历图像中每个未知像素，其中对每个未知像素，计算其与所有采样后的像素对的评估函数值，选择评估函数值最优的像素对；(d)每个未知像素根据最优像素对计算透明度遮罩值；(e)利用原图对得到的透明度遮罩图进行导向滤波。(f)输出增强后的图像。2.根据权利要求1所述基于全局抠图的训练数据增强方法，其特征在于，步骤(b)包括如下子步骤：(b
‑
1)逐个遍历前景像素，若该像素的四邻域内存在未知像素，则将其加入到前景采样子集中；(b
‑
2)逐个遍历背景像素，若该像素的四邻域内存在未知像素，则将其加入到背景采样子集中。3.根据权利要求2所述基于全局抠图的训练数据增强方法，其特征在于，步骤(c)包括如下子步骤：(c
‑
1)若原图为彩色图像，则计算的评估函数包括颜色判据、空间临近判据，具体计算公式为：公式为：公式为：公式为：k为第k个未知像素，i、j为其对应的第i、j个前背景像素，k为第k个未知像素，i、j为其对应的第i、j...

【专利技术属性】
技术研发人员：黄翰，刘泽洋，梁椅辉，赵煜新，林墨馨，康力，阮子琦，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人