一种图像检测模型的训练方法技术

技术编号:39678983 阅读:14 留言:0更新日期:2023-12-11 18:56
本申请提供一种图像检测模型的训练方法

【技术实现步骤摘要】
一种图像检测模型的训练方法、图像检测方法及相关装置


[0001]本申请涉及目标检测领域,公开了一种图像检测模型的训练方法

图像检测方法及相关装置


技术介绍

[0002]相关技术中,利用预训练样本训练网络得到预训练网络模型

然后将真实训练样本输入预训练网络模型进行微调训练得到最终模型

预训练样本通常数量较大,并且图像特征较为丰富,如颜色

形状

纹理等特征

而真实训练样本通常数量较小,并且图像特征较差

在利用真实训练样本对与训练网络模型进行微调时效果较差,导致检测精度提升受限


技术实现思路

[0003]本申请提供一种图像检测模型的训练方法

图像检测方法及相关装置,用于提高图像检测模型的检测精度,并降低人工成本

[0004]第一方面,本申请实施例提供一种图像检测模型的训练方法,包括:
[0005]获取训练样本集合,所述训练样本集合包括多个类别的样本图像,一个样本图像对应一个类别,且所述样本图像的标签为所述样本图像对应的类别;
[0006]根据所述多个类别,生成多个文本,并提取每个文本的文本特征,其中,所述多个文本与所述多个类别一一对应,每个文本包括所述每个文本对应的类别;
[0007]对于所述训练样本集合中的每个图像执行如下操作,确定所述每个图像的损失参数:将所述每个图像输入待训练网络模型,提取所述每个图像包含目标对象的区域的第一图像特征;确定所述第一图像特征与所述多个文本中每个文本的文本特征的相似度;以及基于确定出的所述第一图像特征对应的多个相似度,确定所述每个图像的损失参数;
[0008]基于所述训练样本集合中的全部图像的损失参数以及预设的损失函数,调整所述待训练网络模型的参数

[0009]一种可能的实施方式中,本申请实施例提供的图像检测模型的训练方法中,所述根据所述多个类别,生成多个文本,包括:
[0010]根据至少一个扩充字段和所述每个文本对应的类别,生成所述每个文本,其中,所述扩充字段包括如下一个或多个:
[0011]所述训练样本集合中图像的获取方式

所述训练样本集合中图像所属场景

[0012]一种可能的实施方式中,本申请实施例提供的图像检测模型的训练方法中,所述训练样本集合包括:多个样本子集;所述多个样本子集包括第一样本子集和至少一个第二样本子集;
[0013]所述第一样本子集中样本图像的获取方式与所述第二样本子集中样本图像的获取方式不同;
[0014]并且,所述第一样本子集中样本图像的总数量大于所述至少一个第二样本子集中各第二样本子集中样本图像的总数量

[0015]一种可能的实施方式中,本申请实施例提供的图像检测模型的训练方法中,所述损失函数中,所述第一样本子集对应的损失子函数的权重小于所述至少一个第二样本子集对应的损失子函数对应的权重

[0016]例如,所述损失函数可以为
L

α
M
*Lpre+
α
Q
*Lreal
,其中,所述
Lpre
表征所述第一样本子集对应的损失子函数,所述
α
M
表征所述第一样本子集对应的损失子函数的权重;所述
Lreal
表征所述至少一个第二样本子集对应的损失子函数,所述
α
Q
表征所述至少一个第二样本子集对应的损失子函数的权重

[0017]在一些示例中,所述所述述其中,所述表征所述第一样本子集
pre
中第
a
个样本图像的图像特征;所述
real_N
表征所述至少一个第二样本子集中第
N
个第二样本子集,所述
NT
表征所述至少一个第二样本子集的总数量,所述表征所述第
N
个第二样本子集中第
b
个样本图像的图像特征

[0018]所述表征所述第一样本子集
pre
中第
a
个样本图像的图像特征对应的目标文本特征,所述第一样本子集
pre
中第
a
个样本图像的图像特征与所述多个文本的文本特征的相似度中,所述第一样本子集
pre
中第
a
个样本图像的图像特征对应的目标文本特征与所述第一样本子集
pre
中第
a
个样本图像的图像特征的相似度是最大的;
[0019]所述表征所述第
N
个第二样本子集中第
b
个样本图像的图像特征对应的目标文本特征,所述第
N
个第二样本子集中第
b
个样本图像的图像特征与所述多个文本的文本特征的相似度中,所述第
N
个第二样本子集中第
b
个样本图像对应的目标文本特征与所述第
N
个第二样本子集中第
b
个样本图像的图像特征的相似度是最大的

[0020]表征所述的损失参数,表征所述的损失参数;其中,数;其中,所述
F
te_k
表征所述多个文本的文本特征中第
k
个文本特征;表征所述与所述的相似度,表征所述与所述的相似度,所述
τ
为常数

[0021]一种可能的实施方式中,本申请实施例提供的图像检测模型的训练方法中,所述多个样本子集包括多个第二样本子集,其中,任一第二样本子集中图像所属场景与所述多个第二样本子集中除所述任一第二样本子集中的图像所属场景不同

[0022]一种可能的实施方式中,本申请实施例提供的图像检测模型的训练方法中,所述损失函数包括所述第一样本子集对应的损失子函数,和所述第二样本子集中的每个第二样本子集对应的损失子函数;
[0023]其中,所述第一样本子集对应的损失子函数的权重小于所述多个第二样本子集对应的损失子函数的权重的最小值

[0024]例如,本申请实施例提供的图像检测模型的训练方法中,所述损失函数为:
[0025][0026]其中,所述
Lpre
表征所述第一样本子集对应的损失子函数,所述
α
M
表征所述第一样本子集对应的损失子函数的权重;所述
NT
表征所述多个第二样本子集的总数量,所述表征所述多个第二样本子集中第
N
个第二样本子集对应的损失子函数,所述
α
real_N
表征所述第
N
个第二样本子集对应的损失子函数

[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种图像检测模型的训练方法,其特征在于,所述方法包括:获取训练样本集合,所述训练样本集合包括多个类别的样本图像,一个样本图像对应一个类别,且所述样本图像的标签为所述样本图像对应的类别;根据所述多个类别,生成多个文本,并提取每个文本的文本特征,其中,所述多个文本与所述多个类别一一对应,每个文本包括所述每个文本对应的类别;对于所述训练样本集合中的每个图像执行如下操作,确定所述每个图像的损失参数:将所述每个图像输入待训练网络模型,提取所述每个图像包含目标对象的区域的第一图像特征;确定所述第一图像特征与所述多个文本中每个文本的文本特征的相似度;以及基于确定出的所述第一图像特征对应的多个相似度,确定所述每个图像的损失参数;基于所述训练样本集合中的全部图像的损失参数以及预设的损失函数,调整所述待训练网络模型的参数
。2.
如权利要求1所述的方法,其特征在于,所述根据所述多个类别,生成多个文本,包括:根据至少一个扩充字段和所述每个文本对应的类别,生成所述每个文本,其中,所述扩充字段包括如下一个或多个:所述训练样本集合中图像的获取方式

所述训练样本集合中图像所属场景
。3.
如权利要求1或2所述的方法,其特征在于,所述训练样本集合包括:多个样本子集;所述多个样本子集包括第一样本子集和至少一个第二样本子集;所述第一样本子集中样本图像的获取方式与所述第二样本子集中样本图像的获取方式不同;并且,所述第一样本子集中样本图像的总数量大于所述至少一个第二样本子集中各第二样本子集中样本图像的总数量
。4.
如权利要求3所述的方法,其特征在于,所述损失函数中,所述第一样本子集对应的损失子函数的权重小于所述至少一个第二样本子集对应的损失子函数对应的权重
。5.
如权利要求3所述的方法,其特征在于,所述多个样本子集包括多个第二样本子集,其中,任一第二样本子集中图像所属场景与所述多个第二样本子集中除所述任一第二样本子集中的图像所属场景不同
。6.
如权利要求5所述的方法,其特征在于,所述损失函数包括所述第一样本子集对应的损失子函数,和所述第二样本子集中的每个第二样本子集对应的损失子函数;其中,所述第一样本子集对应的损失子函数的权重小于所述多个第二样本子集对应的损失子函数的权重的最小值
。7.
一种图像检测方法,其特征在于,所述方法包括:获取待测图像;若所述待测图像包括目标对象,提取包括所述目标对象的区域的图像特征;确定所述图像特征与多个文本中每个文本的文本特征的相似度,其中,所述多个文本是预先生成的,且所述多个文本与多个...

【专利技术属性】
技术研发人员:茅心悦
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1