【技术实现步骤摘要】
图像检测模型的训练方法及装置、目标检测方法及装置
本申请涉及人工智能
,尤其涉及一种图像检测模型的训练方法及装置、目标检测方法及装置。
技术介绍
从图像中检测人脸或检测其它感兴趣目标的目标检测技术是大量高级视觉任务的必备前提,可被应用到很多实际任务,例如智能视频监控基于内容的图像检索,机器人导航和增强现实等。现有的目标检测方式大多需要采用经训练得到的目标检测模型对待检测图像进行特征提取,然后基于提取出的特征进行目标分类(诸如判断是否为人脸)以及目标定位(诸如确定人脸在图像中的位置)。现有的模型训练方法只是基于目标检测模型的自身网络结构进行训练,这种训练方法得到的目标检测模型对图像的检测效果不佳,诸如,难以对图像中模糊或部分被遮挡的待检测目标进行检测。
技术实现思路
有鉴于此,本申请实施例提供一种图像检测模型的训练方法及装置、目标检测方法及装置,用以改善模型训练方法,并提升经训练得到的目标检测模型对图像的检测效果。主要包括以下几个方面:第一方面,本申请实施例提供了一种图像检测模 ...
【技术保护点】
1.一种图像检测模型的训练方法,其特征在于,所述方法包括:/n将目标训练图像输入初始模型;所述初始模型包括依次连接的骨干网络和头网络,所述头网络包括并行的分类子网络、回归子网络和掩码子网络;所述目标训练图像携带有类别标签、回归标签和掩码标签;/n通过所述骨干网络提取所述目标训练图像的特征响应图;/n通过所述分类子网络对所述特征响应图进行分类处理,并基于分类处理结果与所述类别标签计算得到分类损失值;/n通过所述回归子网络对所述特征响应图进行回归处理,并基于回归处理结果与所述回归标签计算得到回归损失值;/n通过所述掩码子网络对所述特征响应图进行掩码处理,并基于掩码处理结果与所述 ...
【技术特征摘要】
1.一种图像检测模型的训练方法,其特征在于,所述方法包括:
将目标训练图像输入初始模型;所述初始模型包括依次连接的骨干网络和头网络,所述头网络包括并行的分类子网络、回归子网络和掩码子网络;所述目标训练图像携带有类别标签、回归标签和掩码标签;
通过所述骨干网络提取所述目标训练图像的特征响应图;
通过所述分类子网络对所述特征响应图进行分类处理,并基于分类处理结果与所述类别标签计算得到分类损失值;
通过所述回归子网络对所述特征响应图进行回归处理,并基于回归处理结果与所述回归标签计算得到回归损失值;
通过所述掩码子网络对所述特征响应图进行掩码处理,并基于掩码处理结果与所述掩码标签计算得到掩码损失值;
基于所述分类损失值、所述回归损失值和所述掩码损失值对所述初始模型进行训练,得到目标检测模型;其中,所述目标检测模型为用于对图像中的目标进行检测的模型,且所述目标检测模型包括训练后的所述骨干网络、所述分类子网络和所述回归子网络。
2.如权利要求1所述的方法,其特征在于,所述骨干网络包括残差网络和特征金字塔网络;
通过骨干网络提取所述目标训练图像的特征响应图的步骤,包括:
通过所述残差网络提取所述目标训练图像的多种尺度的特征图;
将多种尺度的特征图分别输入至所述特征金字塔网络的多个网络层;其中,每个所述网络层对应输入一种尺度的特征图;
通过所述特征金字塔网络的每个网络层对输入的所述特征图进行特征融合处理,得到对应的特征响应图;其中,不同网络层输出的特征响应图对应的感受野不同。
3.如权利要求2所述的方法,其特征在于,所述特征金字塔网络的网络层至少为4层。
4.如权利要求2所述的方法,其特征在于,所述特征金字塔网络的每个网络层分别与并行的所述分类子网络、所述回归子网络和所述掩码子网络相连;
所述通过所述分类子网络对所述特征响应图进行分类处理的步骤,包括:通过所述分类子网络对与其连接的所述特征金字塔网络的网络层输出的特征响应图进行分类处理;
所述通过所述回归子网络对所述特征响应图进行分类处理的步骤,包括:通过所述回归子网络对与其连接的所述特征金字塔网络的网络层输出的特征响应图进行回归处理;
所述通过所述掩码子网络对所述特征响应图进行掩码处理的步骤,包括:通过所述掩码子网络对与其连接的所述特征金字塔网络的网络层输出的特征响应图进行掩码处理。
5.如权利要求4所述的方法,其特征在于,所述掩码标签为多种;每种所述掩码标签对应一种尺度的所述特征图;
基于掩码处理结果与所述掩码标签计算得到掩码损失函数值的步骤,包括:
根据与所述掩码子网络连接的所述特征金字塔网络的网络层,获取与所述掩码子网络对应的掩码标签;
基于所述掩码子网络的掩码处理结果与获取的所述掩码标签计算得到掩码损失函数值。
6.如权利要求1所述的方法,其特征在于,基于掩码处理结果与所述掩码标签计算得到掩码损失值的步骤,包括:将掩码处理结果与所述掩码标签代入至交叉熵损失函数中,计算得到掩码损失值。
7.如权利要求6所述的方法,其特征在于,所述交叉熵损失函数为Sigmoid函数。
8.如权利要求1所述的方法,其特征在于,所述基于所述分类损失值、所述回归损失值和所述掩码损失值对所述初始模型进行训练的步骤,包括:
采用反向传播算法,基于所述分类损失值、所述回归损失值和所述掩码损失值对所述骨干网络、所述分类子网络、所述回归子网络和所述掩码子网络进行联合训练,直至所述分类损失值收敛到第一预设值,所述回归损失值收敛到第二预设值,所述掩码损失值收敛到第三预设值时停止训练。
9.如权利要求1所述的方法,其特征在于,所述掩码子网络包括依次连接的五个卷积层;其中,前四个所述卷积层的网络参数相同,第五个所述卷积层与前四个所述卷积层的网络参数不同。
10.如权利要求9所述的方法,其特征在于,所述掩码子网络的第五个所述卷积层的输出维度等于待检测目标的类别数。
11.一种目标检测方法,其特征在于,所述方法应用于配置有检测模型的设备;所述检测模型为权利要求1至10任一项所述方法训练得到的目标检测模型;所述方法包括:
获取待检测目标的图像;
将所述图像输入至所述目标检测模型中;
根据所述目标检测模型的输出结果确定所述待检测目标的类别和位置。
12.如权利要求11所述的方法,其特征在于,根据所述目标检测模型的输出结果确定所述待检测目标的类别和位置的步骤,包括:
根据所述目标检测模型输出的分类处理结果确定所述待检测目标的类别;
根据所述目标检测模型输出的回归处理结果确定所述待检测目标的位置。
13.如权利要求11所述的方法,其特征在于,所述待检测目标包括人脸或车辆。
14.一种图像检测模型的训练装置,其特征在于,所述装置包括:
图像输入模块,用于将目标训练图像输入初始模型;所述初始模型包括依次连接的骨干网络和头网络,所述头网络包括并行的分类子网络、回归子网...
【专利技术属性】
技术研发人员:张修宝,田万鑫,沈海峰,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。