模型训练方法、海报图像处理方法、电子设备及存储介质技术

技术编号:39150781 阅读:8 留言:0更新日期:2023-10-23 14:58
本申请公开了一种模型训练方法、海报图像处理方法、电子设备及存储介质。其中,模型训练方法包括:获得训练样本数据,所述训练样本包含第一类样本数据和第二类样本数据,所述第一类样本数据包含获得的实际海报图像、海报图像的文字掩膜(mask),所述第二类样本数据包含利用图像生成海报文字而得到的海报图像、海报图像的文字mask和生成海报图像的原始图像;利用训练样本数据对第一模型进行训练,所述第一模型用于去除待擦除海报图像中的文字并对文字区域进行修复。区域进行修复。区域进行修复。

【技术实现步骤摘要】
模型训练方法、海报图像处理方法、电子设备及存储介质


[0001]本申请涉及图像处理
,尤其涉及一种模型训练方法、海报图像处理方法、装置、电子设备及存储介质。

技术介绍

[0002]计算机视觉领域的图像修复是指对图像中丢失的区域进行修补,相关技术中,可以基于图像的局部区域内容以及全局上下文语义信息,利用深度学习模型对污损区域进行填补修复。图像修复广泛应用于图像编辑、影视制作等方面,其中,海报图像处理(比如,海报文字擦除)即为图像修复众多应用场景中的一种。
[0003]然而,利用相关技术中的图像修复方法修复的图像显示效果较差,即视觉质量较差。

技术实现思路

[0004]为解决相关技术问题,本申请实施例提供一种模型训练方法、海报图像处理方法、装置、电子设备及存储介质。
[0005]本申请实施例的技术方案是这样实现的:
[0006]本申请实施例提供了一种模型训练方法,包括:
[0007]获得训练样本数据,所述训练样本包含第一类样本数据和第二类样本数据,所述第一类样本数据包含获得的实际海报图像、海报图像的文字掩膜(mask),所述第二类样本数据包含利用图像生成海报文字而得到的海报图像、海报图像的文字mask和生成海报图像的原始图像;
[0008]利用训练样本数据对第一模型进行训练,所述第一模型用于去除待擦除海报图像中的文字并对文字区域进行修复。
[0009]上述方案中,所述第一模型包括:第一子模型、第二子模型和第三子模型;其中,
[0010]所述第一子模型用于擦除所述待擦除海报图像的文字并进行修复;
[0011]所述第二子模型用于确定擦除后的图像是否是无文字图像,并将确定结果反馈给所述第一子模型,以对海报进行修改;
[0012]所述第三子模型用于比较擦除后的图像的纹理和所述待擦除海报图像的纹理,并将比较结果反馈给所述第一子模型,以对海报进行修改。
[0013]上述方案中,所述第一子模型的损失函数至少包含纹理损失函数和颜色损失函数。
[0014]上述方案中,在获得训练样本数据时,所述方法包括:
[0015]获取至少一张图像;
[0016]针对所述至少一张图像中的每张图像,在图像中添加选择的文字,得到海报图像,并基于文字的添加位置和图像大小生成海报图像的文字mask。
[0017]上述方案中,所述在图像中添加选择的文字,包括:
[0018]基于随机方式确定文字框在图像中的位置,在确定的文字框位置添加选择的文字;
[0019]或者,
[0020]基于背景相似度确定文字框在图像中的位置,在确定的文字框位置添加选择的文字。
[0021]上述方案中,所述基于背景相似度确定文字框在图像中的位置,包括:
[0022]在图像中选择至少一个基准文字框位置;
[0023]针对选择的每个基准文字框位置,在基准文字框位置的周围区域进行遍历,选择N个候选文字框位置,所述候选文字框位置与所述基准文字框位置不重叠,N为大于或等于2的整数;并基于N个候选文字框位置中每个候选文字框位置的背景与基准文字框位置的背景的相似度,确定基准文字框位置的相似文字框位置;
[0024]基于所述至少一个基准文字框位置的相似文字框位置进行组合,得到文字框在图像中的位置;
[0025]在确定的文字框内添加基准文字框内的文字。
[0026]上述方案中,所述基于所述至少一个基准文字框位置的相似文字框位置进行组合,得到文字框在图像中的位置,包括:
[0027]基于所述至少一个基准文字框位置的相似文字框位置进行组合,得到至少一个组合;
[0028]针对所述至少一个组合中每个组合,确定对应组合的背景重叠程度;
[0029]基于所述至少一个组合中每个组合的背景重叠程度,从所述至少一个组合中选择一个组合作为目标组合;
[0030]基于所述目标组合,得到文字框在图像中的位置。
[0031]上述方案中,通过候选文字框位置的背景与基准文字框位置的背景的峰值信噪比,确定候选文字框位置的背景与基准文字框位置的背景的相似度。
[0032]上述方案中,通过网络爬取的方式获得实际海报图像。
[0033]本申请实施例还提供一种海报图像处理方法,包括:
[0034]获取待擦除海报图像;
[0035]利用第一模型去除所述待擦除海报图像中的文字并对文字区域进行修复;其中,所述第一模型是根据上述任一模型训练方法得到的。
[0036]上述方案中,所述方法还包括:
[0037]利用第二模型提取所述待擦除海报图像被擦除文字后的边缘特征;
[0038]将所述待擦除海报图像、边缘特征、所述待擦除图像的文字mask输入至所述第一模型,得到擦除文字的海报图像。
[0039]上述方案中,所述第二模型包含第四子模型和第五子模型,所述利用第二模型提取所述待擦除海报图像被擦除文字后的边缘特征,包括:
[0040]利用所述第四子模型生成所述待擦除海报图像被擦除文字后的边缘特征;
[0041]利用所述第五子模型判别生成的边缘特征是否是真的边缘特征。
[0042]上述方案中,所述第一模型包含第一子模型、第二子模型和第三子模型;所述利用第一模型去除所述待擦除海报图像中的文字并对文字区域进行修复,包括:
[0043]利用所述第一子模型擦除所述待擦除海报图像的文字并进行修复;
[0044]利用所述第二子模型确定擦除后的图像是否是无文字图像,并将确定结果反馈给所述第一子模型,以对海报进行修改;
[0045]利用所述第三子模型比较擦除后的图像的纹理和所述待擦除海报图像的纹理,并将比较结果反馈给所述第一子模型,以对海报进行修改。
[0046]本申请实施例还提供一种模型训练装置,包括:
[0047]第一获取单元,用于获得训练样本数据,所述训练样本包含第一类样本数据和第二类样本数据,所述第一类样本数据包含获得的实际海报图像、海报图像的文字mask,所述第二类样本数据包含利用图像生成海报文字而得到的海报图像、海报图像的文字mask和生成海报图像的原始图像;
[0048]训练单元,用于利用训练样本数据对第一模型进行训练,所述第一模型用于去除待擦除海报图像中的文字并对文字区域进行修复。
[0049]本申请实施例还提供一种海报图像处理装置,包括:
[0050]第二获取单元,用于获取待擦除海报图像;
[0051]处理单元,用于利用第一模型去除所述待擦除海报图像中的文字并对文字区域进行修复;其中,所述第一模型是根据上述任一模型训练方法得到的。
[0052]本申请实施例还提供一种电子设备,包括:通信接口和处理器,其中,
[0053]所述通信接口,用于获得训练样本数据,所述训练样本包含第一类样本数据和第二类样本数据,所述第一类样本数据包含获得的实际海报图像、海报图像的文字mask,所述第二类样本数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获得训练样本数据,所述训练样本包含第一类样本数据和第二类样本数据,所述第一类样本数据包含获得的实际海报图像、海报图像的文字掩膜mask,所述第二类样本数据包含利用图像生成海报文字而得到的海报图像、海报图像的文字mask和生成海报图像的原始图像;利用训练样本数据对第一模型进行训练,所述第一模型用于去除待擦除海报图像中的文字并对文字区域进行修复。2.根据权利要求1所述的方法,其特征在于,所述第一模型包括:第一子模型、第二子模型和第三子模型;其中,所述第一子模型用于擦除所述待擦除海报图像的文字并进行修复;所述第二子模型用于确定擦除后的图像是否是无文字图像,并将确定结果反馈给所述第一子模型,以对海报进行修改;所述第三子模型用于比较擦除后的图像的纹理和所述待擦除海报图像的纹理,并将比较结果反馈给所述第一子模型,以对海报进行修改。3.根据权利要求2所述的方法,其特征在于,所述第一子模型的损失函数至少包含纹理损失函数和颜色损失函数。4.根据权利要求1所述的方法,其特征在于,在获得训练样本数据时,所述方法包括:获取至少一张图像;针对所述至少一张图像中的每张图像,在图像中添加选择的文字,得到海报图像,并基于文字的添加位置和图像大小生成海报图像的文字mask。5.根据权利要求4所述的方法,其特征在于,所述在图像中添加选择的文字,包括:基于随机方式确定文字框在图像中的位置,在确定的文字框位置添加选择的文字;或者,基于背景相似度确定文字框在图像中的位置,在确定的文字框位置添加选择的文字。6.根据权利要求5所述的方法,其特征在于,所述基于背景相似度确定文字框在图像中的位置,包括:在图像中选择至少一个基准文字框位置;针对选择的每个基准文字框位置,在基准文字框位置的周围区域进行遍历,选择N个候选文字框位置,所述候选文字框位置与所述基准文字框位置不重叠,N为大于或等于2的整数;并基于N个候选文字框位置中每个候选文字框位置的背景与基准文字框位置的背景的相似度,确定基准文字框位置的相似文字框位置;基于所述至少一个基准文字框位置的相似文字框位置进行组合,得到文字框在图像中的位置;在确定的文字框内添加基准文字框内的文字。7.根据权利要求6所述的方法,其特征在于,所述基于所述至少一个基准文字框位置的相似文字框位置进行组合,得到文字框在图像中的位置,包括:基于所述至少一个基准文字框位置的相似文字框位置进行组合,得到至少一个组合;针对所述至少一个组合中每个组合,确定对应组合的背景重叠程度;基于所述至少一个组合中每个组合的背景重叠程度,从所述至少一个组合中选择一个
组合作为目标组合;基于所述目标组合,得到文字框在图像中的位置。8.根据权利要求6所述的方法,其特征在于,通过候选文字框位置的背景与基准文字框位置的背景的峰值信噪比,确定候选文字框位置的背景与基准文字框位置的背景的相似度。9.根据权利要求1至8任一项所述的方法,其特征在于,通过网络爬取的方式获得实际海报图像。10.一种海报图像处理方法,其特征在于,包括:获取待擦除海报图像;利用第一模型去除所述待擦除海报图像中的文字并对文字区域进行修复;其中,所述第一模型是根据权利要...

【专利技术属性】
技术研发人员:柳欣杜瞻王千闫敏叶晓倩
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1