一种训练样本的扩充方法技术

技术编号:31078297 阅读:16 留言:0更新日期:2021-12-01 11:31
本发明专利技术公开了一种训练样本的扩充方法、存储介质及终端设备,所述方法包括对于初始训练样本组中的一训练图像,确定该训练图像对应的目标图像;根据目标图像生成目标图像对应的掩码图像;基于经过训练的生成网络模型、该掩码图像以及目标图像生成训练图像对应的第一合成图像;将生成的所有第一合成图像加入初始训练样本组,以得到扩充训练样本组。本发明专利技术通过经过训练的生成网络模型生成训练图像对应的第一合成图像,并将第一合成图像作为初始训练样本组的扩充图像补充至初始训练样本组,从而实现了训练样本的自动扩充,降低了训练样本扩充的工作量,提高了训练样本扩张的效率,进而提高了神经网络模型的训练效率。提高了神经网络模型的训练效率。提高了神经网络模型的训练效率。

【技术实现步骤摘要】
一种训练样本的扩充方法


[0001]本专利技术涉及超声
,特别涉及一种训练样本的扩充方法。

技术介绍

[0002]随着人工智能技术的发展,基于深度学习模型的检测识别技术也取越来越广泛的应用。众所周知,深度学习模型的精度依赖于训练样本的数据量以及训练样本的多样性,当训练样本数量大且多样性高时,训练得到的深度学习模型的模型精度高,反之,当训练样本数量小且多样性低时,训练得到的深度学习模型的模型精度低。由此,在对深度学习模型进行训练之前,普遍需要对训练样本进行扩充。现有的训练样本的扩充方法普遍是通过对训练样本进行随机旋转、空间位移、剪裁以及缩放等处理,以扩充训练样本集。但是现有的图像扩充方法普遍是基于算法工程师都是基于经验和不断的实验来选择适合某一任务的图像数据扩张方案,这样产生了大量的工作,从而降低模型训练的效率。

技术实现思路

[0003]本专利技术要解决的技术问题在于,针对现有技术的不足,提供一种训练样本的扩充方法。
[0004]为了解决上述技术问题,本专利技术所采用的技术方案如下:
[0005]一种训练样本的扩充方法,所述方法包括:
[0006]读取预设的初始训练样本组中的训练图像,确定所述训练图像对应的目标图像,
[0007]根据所述目标图像生成所述目标图像对应的掩码图像;
[0008]基于经过训练的生成网络模型、所述掩码图像及所述目标图像生成所述训练图像对应的第一合成图像,
[0009]将所述第一合成图像加入所述初始训练样本组,以得到扩充训练样本组。
[0010]所述训练样本的扩充方法,其中,所述第一合成图像对应的第一样本标签与所述训练图像对应的第一样本标签相同。
[0011]所述训练样本的扩充方法,其中,所述目标图像的图像背景与该训练图像的图像背景的相似度满足预设条件。
[0012]所述训练样本的扩充方法,其中,所述第一合成图像中的合成图像区域的图像内容与所述目标图像中的目标图像区域的图像内容不同,所述目标图像区域在所述目标图像中的位置信息与所述合成区域在所述第一合成区域中的位置信息相对应。
[0013]所述训练样本的扩充方法,其中,所述目标图像对应若干掩码图像,若干掩码图像中的每个掩码图像均包括掩码区域,每个掩码图像的掩码区域均对应于所述目标图像的部分图像区域,并且各掩码图像中的掩码区域各自分别对应的部分图像区域不同。
[0014]所述训练样本的扩充方法,其中,所述根据所述目标图像生成所述目标图像对应的掩码图像具体包括:
[0015]将所述目标图像中的每个像素点的像素值设置为第一预设像素值,以得到目标图
像对应的中间图像;
[0016]基于所述中间图像上确定第一图像区域,并将确定得到的第一图像区域中各像素点的像素值设置为第二预设像素值,以得到掩码图像,其中,所述第一图像区域为所述掩码图像的掩码区域。
[0017]所述训练样本的扩充方法,其中,所述生成网络模型基于训练样本集训练得到的,所述训练样本集包括多组训练图像组,每组训练图像组包括第一图像、第二图像以及第二图像的掩码图像,第二图像的图像背景与第一图像的图像背景的相似度满足预设条件;所述生成网络模型的训练过程具体包括:
[0018]基于预设的第一网络模型,生成训练图像组中的第二图像和第二图像的掩码图像对应的第二合成图像;
[0019]基于预设的第二网络模型、所述第二合成图像以及所述第一图像,确定所述第二合成图像对应的第一损失函数;
[0020]基于预设的第三网络模型、所述第一图像以及所述第二合成图像,确定所述第二合成图像对应的第二损失函数;
[0021]基于所述第一损失函数和所述第二损失函数,对所述第一网络模型进行训练,以得到所述生成网络模型。
[0022]所述训练样本的扩充方法,其中,所述基于预设的第二网络模型、所述第二合成图像以及所述第一图像,确定所述第二合成图像对应的第一损失函数具体包括:
[0023]将所述第二合成图像与所述第一图像输入至所述第二网络模型,通所述第二网络模型输出所述第一图像和第二合成图像的相似度;
[0024]基于所述相似度,确定所述第二合成图像对应的第一损失函数。
[0025]所述训练样本的扩充方法,其中,所述方法还包括:
[0026]基于所述第一损失函数对所述第二网络模型进行训练。
[0027]所述训练样本的扩充方法,其中,所述第三网络模型为基于预设训练图像集训练得到的,其中,所述预设训练图像集包括所述训练样本集中的所有第一图像,以及各第一图像对应的第一样本标签。
[0028]所述训练样本的扩充方法,其中,所述基于预设的第三网络模型、所述第一图像以及所述第二合成图像,确定所述第二合成图像对应的第二损失函数具体包括:
[0029]将所述第二合成图像增加至预设训练图像集,以得到第一训练图像集,其中,所述第一训练图像集包括所述训练样本集中所有第一图像以及所述第二合成图像;
[0030]基于所述第一训练图像集对所述第三网络模型进行训练,以更新所述第三网络模型;
[0031]基于所述第三网络模型提取预设的测试图像对应的第三损失函数,以及基于更新后的第三网络模型提取所述测试图像对应的第四损失函数;
[0032]根据所述第三损失函数以及所述第四损失函数,确定所述第二损失函数。
[0033]所述训练样本的扩充方法,其中,所述第一网络模型训练结束的预设条件为:
[0034]所述第一损失函数小于或等于第一预设阈值且第二损失函数大于或等于第二预设阈值,或者所述第一网络模型的训练次数达到预设次数阈值。
[0035]一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,
所述一个或者多个程序可被一个或者多个处理器执行,以实现如上任一所述的训练样本的扩充方法中的步骤。
[0036]一种终端设备,其包括:处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;
[0037]所述通信总线实现处理器和存储器之间的连接通信;
[0038]所述处理器执行所述计算机可读程序时实现如上任一所述的训练样本的扩充方法中的步骤。
[0039]有益效果:与现有技术相比,本专利技术提供了一种训练样本的扩充方法、存储介质及终端设备,所述方法包括获取待扩充的初始训练样本组,读取预设的初始训练样本组中的若干训练图像,对于若干训练图像中的每张训练图像,确定该训练图像对应的目标图像;根据所述目标图像生成所述目标图像对应的至少一个掩码图像;对于每个掩码图像,基于经过训练的生成网络模型、该掩码图像以及所述目标图像生成所述训练图像对应的第一合成图像;将生成的所有第一合成图像加入所述初始训练样本组,以得到扩充训练样本组。本专利技术通过经过训练的生成网络模型生成训练图像对应的第一合成图像,并将第一合成图像作为初始训练样本组的扩充图像补充至初始训练样本组,从而实现了训练样本的自动扩充,降低了训本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练样本的扩充方法,其特征在于,所述方法包括:读取预设的初始训练样本组中的训练图像,确定所述训练图像对应的目标图像;根据所述目标图像生成所述目标图像对应的掩码图像;基于经过训练的生成网络模型、所述掩码图像及所述目标图像生成所述训练图像对应的第一合成图像;将所述第一合成图像加入所述初始训练样本组,以得到扩充训练样本组。2.根据权利要求1所述训练样本的扩充方法,其特征在于,所述第一合成图像对应的第一样本标签与所述训练图像对应的第一样本标签相同。3.根据权利要求1所述训练样本的扩充方法,其特征在于,所述目标图像的图像背景与该训练图像的图像背景的相似度满足预设条件。4.根据权利要求1所述训练样本的扩充方法,其特征在于,所述第一合成图像中的合成图像区域的图像内容与所述目标图像中的目标图像区域的图像内容不同,所述目标图像区域在所述目标图像中的位置信息与所述合成区域在所述第一合成区域中的位置信息相对应。5.根据权利要求1所述训练样本的扩充方法,其特征在于,所述目标图像对应若干掩码图像,若干掩码图像中的每个掩码图像均包括掩码区域,每个掩码图像的掩码区域均对应于所述目标图像的部分图像区域,并且各掩码图像中的掩码区域各自分别对应的部分图像区域不同。6.根据权利要求1所述训练样本的扩充方法,其特征在于,所述根据所述目标图像生成所述目标图像对应的掩码图像具体包括:将所述目标图像中的每个像素点的像素值设置为第一预设像素值,以得到目标图像对应的中间图像;基于所述中间图像上确定第一图像区域,并将确定得到的第一图像区域中各像素点的像素值设置为第二预设像素值,以得到掩码图像,其中,所述第一图像区域为所述掩码图像的掩码区域。7.根据权利要求1-6任一所述训练样本的扩充方法,其特征在于,所述生成网络模型基于训练样本集训练得到的,所述训练样本集包括多组训练图像组,每组训练图像组包括第一图像、第二图像以及第二图像的掩码图像,第二图像的图像背景与第一图像的图像背景的相似度满足预设条件;所述生成网络模型的训练过程具体包括:基于预设的第一网络模型,生成训练图像组中的第二图像和第二图像的掩码图像对应的第二合成图像;基于预设的第二网络模型、所述第二合成图像以及所述第一图像,确定所述第二合成图像对应的第一损失函数;基于预设的第三网络模型、所述第一图像以及所述第二合成图像,确定所述第二合成图像对应的第二损失函数;基于所述...

【专利技术属性】
技术研发人员:俞大海李嘉豪
申请(专利权)人:TCL科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1