【技术实现步骤摘要】
模型训练及图像处理方法、装置、电子设备、存储介质
本申请涉及信息处理领域,尤其涉及图像处理、深度学习领域。
技术介绍
在相关技术中,提高目标检测效果和性能的方法主要有:两阶段的目标检测方法;加深backbone(骨干)网络和图片的输入大小;困难样本挖掘等相关算法和技术(OHEM、FocalLoss等),增强损失(loss)等等。但是,上述方案,无法对模型训练的过程中提供更有针对性的更优化的参数,也无法加减少模型训练的计算量以及无法减少使用模型进行预测的计算量。
技术实现思路
本公开提供了一种模型训练方法、图像处理方法、装置、电子设备及存储介质。根据本公开的一方面,提供了一种模型训练方法,包括:将图像输入至神经网络进行特征提取,得到针对图像的至少一个采样比例的至少一个特征图;确定所述至少一个特征图中不同采样比例的特征图所对应的锚;其中,不同采样比例所的特征图对应的锚的相对位置不同,并且不同采样比例的特征图对应的锚大小不同;基于图像及其不同特征图中的锚、以及图像中标注的目标框的位置和类别,确定目标模型;其中所述目标模型为训练后的模型。根据本公开的一方面,提供了一种图像处理方法,所述方法包括:将待预测图像输入至神经网络进行特征提取,得到针对待预测图像的至少一个采样比例的至少一个特征图;确定所述至少一个特征图中不同采样比例的特征图所对应的锚;其中,不同采样比例所的特征图对应的锚的相对位置不同,并且不同采样比例的特征图对应的锚大小不同; ...
【技术保护点】
1.一种模型训练方法,包括:/n将图像输入至神经网络进行特征提取,得到针对图像的至少一个采样比例的至少一个特征图;/n确定所述至少一个特征图中不同采样比例的特征图所对应的锚;其中,不同采样比例的特征图对应的锚的相对位置不同,并且不同采样比例的特征图对应的锚大小不同;/n基于图像及其不同特征图中的锚、以及图像中标注的目标框的位置和类别,确定目标模型;其中所述目标模型为训练后的模型。/n
【技术特征摘要】
1.一种模型训练方法,包括:
将图像输入至神经网络进行特征提取,得到针对图像的至少一个采样比例的至少一个特征图;
确定所述至少一个特征图中不同采样比例的特征图所对应的锚;其中,不同采样比例的特征图对应的锚的相对位置不同,并且不同采样比例的特征图对应的锚大小不同;
基于图像及其不同特征图中的锚、以及图像中标注的目标框的位置和类别,确定目标模型;其中所述目标模型为训练后的模型。
2.根据权利要求1所述的方法,其中,所述将图像输入至神经网络进行特征提取,得到针对图像的至少一个采样比例的至少一个特征图,包括:
将图像输入至神经网络进行特征提取,得到至少一个采样比例的至少一个原始特征图;
对所述至少一个采样比例的至少一个原始特征图进行融合,得到针对图像的至少一个采样比例的至少一个特征图。
3.根据权利要求1所述的方法,其中,所述确定所述至少一个特征图中不同采样比例的特征图所对应的锚,包括:
基于预设规则,确定所述不同采样比例的特征图所对应的锚;
其中,所述预设规则包括:
在采样比例大的特征图中锚的相对位置比锚在采样比例小的特征图中的相对位置靠近特征图的第一边;
以及,
在采样比例大的特征图中锚的尺度小于在采样比例小的特征图中锚的尺度。
4.根据权利要求1所述的方法,其中,所述确定所述至少一个特征图中不同采样比例的特征图所对应的锚之后,所述方法还包括:
基于每个特征图的锚以及标注的目标框进行匹配,确定正样本以及负样本。
5.根据权利要求4所述的方法,其中,所述基于每个特征图的锚以及标注的目标框进行匹配,确定正样本,包括:
在每一个特征图中,计算锚与标注的目标框之间的交并比,选取交并比最大的K个锚;K为大于等于1的整数;
从所述K个锚中排除标注的目标框的中心点不在锚中的L个锚;其中,L为小于等于K个整数;
将剩余的K-L个锚作为正样本。
6.根据权利要求5所述的方法,所述方法还包括:
在剩余的K-L个锚中,若存在同一个锚匹配到不同的标注的目标框,则选取与锚的交并比最大的一个标注的目标框作为锚需要预测的目标框。
7.根据权利要求6所述的方法,其中,基于图像及其不同特征图中的锚、以及图像中标注的目标框的位置和类别,确定目标模型,包括:
基于图像及其不同特征图中的正样本以及负样本,以及图像中标注的目标框的位置和类别,确定目标模型。
8.一种图像处理方法,所述方法包括:
将待预测图像输入至神经网络进行特征提取,得到针对待预测图像的至少一个采样比例的至少一个特征图;
确定所述至少一个特征图中不同采样比例的特征图所对应的锚;其中,不同采样比例所的特征图对应的锚的相对位置不同,并且不同采样比例的特征图对应的锚大小不同;
基于待预测图像及其不同特征图中的锚、以及目标模型,得到待预测图像中包含目标对象的目标框的位置和所述目标对象的类别。
9.根据权利要求8所述的方法,其中,所述将待预测图像输入至神经网络进行特征提取,得到针对待预测图像的至少一个采样比例的至少一个特征图,包括:
将待预测图像输入至神经网络进行特征提取,得到至少一个采样比例的至少一个原始特征图;
对所述至少一个采样比例的至少一个原始特征图进行融合,得到针对待预测图像的至少一个采样比例的至少一个特征图。
10.根据权利要求8所述的方法,其中,所述确定所述至少一个特征图中不同采样比例的特征图所对应的锚,包括:
基于预设规则,确定所述不同采样比例的特征图所对应的锚;
其中,所述预设规则包括:
在采样比例大的特征图中锚的相对位置比锚在采样比例小的特征图中的相对位置靠近特征图的第一边;
以及,
在采样比例大的特征图中锚的尺度小于在采样比例小的特征图中锚的尺度。
11.根据权利要求8所述的方法,其中,所述方法还包括:
若针对待预测图像中的同一个目标对象存在多个目标框,则基于类别间最大值抑制进行目标框去重处理,得到针对同一个目标对象的一个目标框。
12.一种模型训练装置,包...
【专利技术属性】
技术研发人员:杨喜鹏,蒋旻悦,谭啸,孙昊,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。