一种基于U2-Net的自动抠图方法技术

技术编号:33128081 阅读:23 留言:0更新日期:2022-04-17 00:40
本发明专利技术涉及U2

【技术实现步骤摘要】
一种基于U2

Net的自动抠图方法


[0001]本专利技术涉及U2

Net自动抠图
,具体地说就是一种基于U2

Net的自动抠图方法。

技术介绍

[0002]目前的图像抠图处理多为手动抠图,需要用户手工画出哪些是需要删除的,哪些是需要保留的;另外一种自动抠图,需要trimap,最后抠图效果很大程度取决于trimap的效果。手动抠图依赖手工,抠图效率低,无法实时批量抠图;依赖trimap的自动抠图虽然可以解决手动抠图效率低的问题,但是如果trimap做得不好,最后效果抠图效果往往不好。

技术实现思路

[0003]为解决上述依赖手工的抠图导致抠图效率低或者依赖trimap抠图导致抠图效果差问题,本专利技术提供了一种基于U2

Net的自动抠图方法。
[0004]本专利技术解决其技术问题所采取的技术方案是:一种基于U2

Net的自动抠图方法,包括以下步骤:
[0005]S1.准备训练数据集;
[0006]S2.将训练数据样本放到U2

Net网络进行训练;
[0007]S3.训练结束后得到U2

Net抠图模型;
[0008]S4.向步骤S3中得到的U2

Net抠图模型中输入一张图像进行推理,得到alpha图;
[0009]S5.将alpha图转换成最终的前景图。
[0010]作为优化,步骤S1中所述训练数据集成对出现,每对训练数据集中包括原图和原图的alpha图,所述alpha图是指将原图背景区域处理成黑色,前景区域处理成白色。
[0011]作为优化,步骤S2中训练的损失函数采用BCELoss,优化器采用Adam,设置学习率为0.001、迭代次数为2000、batchsize为24,设置完成后开始训练。
[0012]作为优化,所述的步骤S1中训练数据集数量>5000对。
[0013]作为优化,所述的S5中将alpha图转换成前景图的方法为:
[0014]A1.将原图用OpenCV分割成b、g、r三通道;读取alpha图,并转换为alpha灰度图;
[0015]A2.新建一个四通道的PNG格式图像,该图像的高度、宽度和原图的高度、宽度一样,将b、g、r三通道的数值分别赋值给新建图像的前三个通道,将alpha灰度图的数值赋值给新建图像的第四通道,然后新建图像就变成最终的前景图,也就是实现对原图进行抠图。
[0016]本方案的有益效果是:一种基于U2

Net的自动抠图方法,具有以下有益之处:
[0017]本申请无需手工操作和干预,是一种全自动的抠图方法,能够大大提高抠图效率,实现快速、批量抠图;
[0018]本申请的抠图方法无需输入trimap,只需要输入原图就能得到原图的前景图,减少了抠图的中间依赖环节,使抠图效果更好。
附图说明
[0019]附图1为本专利技术方法框图示意图。
具体实施方式
[0020]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0022]在本专利技术的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该专利技术产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0023]如图1所示,一种基于U2

Net的自动抠图方法,包括以下步骤:
[0024](1)准备一批训练数据集。
[0025](2)数据集是成对出现的,每一对中包括原图和原图的alpha图;原图的alpha图是指:将原图的背景区域处理成黑色,前景区域处理成白色。原图和原图的alpha图分别放在两个文件夹里,取相同的名字,原图的alpha图保存为png图像格式;为了保证训练效果,准备5000对以上的训练图像。
[0026](3)对训练数据进行一定的数据增强变换。包括Rescale、RandomCrop变换。
[0027](4)编写U2

Net网络的代码。U2

Net网络由三部分组成:六级编码器、五级解码器、与解码器和最后一级编码器相连的六个显著图融合模型。
[0028](5)编写损失函数、优化器的代码。损失函数:把原图输入U2

Net后得到的6个显著性概率图与原图的alpha图作为label分别计算BCELoss,然后把六个BCELoss相加得到最终的损失函数,优化器采用Adam。
[0029](6)设置学习率、迭代次数、batchsize。学习率设为0.001,迭代次数2000,batchsize设为24。
[0030](7)将训练数据放入U2

Net模型开始训练。
[0031](8)得到抠图模型文件。达到设定的迭代次数后,训练结束,得到抠图模型文件。
[0032](9)加载模型文件,输入待抠图的原图,在U2

Net网络上进行推理,得到alpha图。
[0033](10)将alpha图转化为前景图。具体转化方法为:将原图用OpenCV分割成b、g、r三通道;读取alpha图,并转换为灰度图,以下简称“alpha灰度图”;然后新建一个四通道的PNG格式图像,该图像的高度、宽度和原图的高度、宽度一样,将b、g、r三通道的数值分别赋值给
新建图像的前三个通道,将alpha灰度图的数值赋值给新建图像的第四通道,然后新建图像就变成最终的前景图,也就是实现对原图进行抠图。
[0034]上述具体实施方式仅是本专利技术的具体个案,本专利技术的专利保护范围包括但不限于上述具体实施方式的产品形态和式样,任何符合本专利技术权利要求书的一种基于U2

Net的自动抠图方法且任何所属
的普通技术人员对其所做的适当变化本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于U2

Net的自动抠图方法,其特征在于:包括以下步骤:S1.准备训练数据集;S2.将训练数据样本放到U2

Net网络进行训练;S3.训练结束后得到U2

Net抠图模型;S4.向步骤S3中得到的U2

Net抠图模型中输入一张图像进行推理,得到alpha图;S5.将alpha图转换成最终的前景图。2.根据权利要求1所述的一种基于U2

Net的自动抠图方法,其特征在于:步骤S1中所述训练数据集成对出现,每对训练数据集中包括原图和原图的alpha图,所述alpha图是指将原图背景区域处理成黑色,前景区域处理成白色。3.根据权利要求2所述的一种基于U2

Net的自动抠图方法,其特征在于:步骤S2中训练的...

【专利技术属性】
技术研发人员:张国昌王宝臣李晋松殷允恒
申请(专利权)人:北京艺源酷科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1