【技术实现步骤摘要】
目标检测方法及装置
[0001]本申请涉及人工智能
(artificial intelligence
,
AI)
领域,尤其涉及一种目标检测方法及装置
。
技术介绍
[0002]深度神经网络
(deep neural network
,
DNN)
模型广泛应用于计算机视觉
(Computer Vision
,
CV)、
语音识别
、
自然语言处理
(Natural Language Processing
,
NLP)
等领域
。
以
CV
领域中的目标检测为例,由于数据集中物体级别的注释数据的收集过程耗时较多且成本较高,因此,服务器采用半监督的目标检测方法来识别图像中的目标物
。
该半监督的目标检测方法是指为大量未标记的图像确定伪标签
(pseudo
‑
label)
,并根据这些伪标签对源数据集的
DNN
模型进行训练,从而提高
DNN
模型在使用有限的有标记的图像进行训练时的目标检测性能
。
其中的伪标签是指服务器为未标记的数据添加的预测标签
。
[0003]然而,由于不同数据集中的数据分布不同,导致未标记的图像的伪标签的准确性较低,因此,应用于源数据集的
DNN
模型在对目标数据集中的图像进行目标检测时, ...
【技术保护点】
【技术特征摘要】
1.
一种目标检测方法,其特征在于,包括:获取第一图像;所述第一图像包括一个或多个待检测物;将第一图像输入目标检测模型,获取第一待检测物的类别信息;其中,所述第一待检测物为所述一个或多个待检测物中任一个,所述目标检测模型包括教师
‑
学生网络,所述教师
‑
学生网络用于根据所述第一待检测物的自适应标签确定所述第一待检测物的类别信息,所述自适应标签是由所述第一图像的伪标签和所述第一图像的强增强图像确定的;输出所述第一图像中所述一个或多个待检测物的类别信息
。2.
根据权利要求1所述的方法,其特征在于,输出所述第一图像中所述一个或多个待检测物的类别信息,包括:在所述第一图像中标记所述一个或多个待检测物的类别信息,获得标记后的第一图像;发送所述标记后的第一图像
。3.
根据权利要求1或2所述的方法,其特征在于,所述教师
‑
学生网络包括:教师网络和学生网络;所述将第一图像输入目标检测模型,获取第一待检测物的类别信息,包括:利用所述教师网络获取所述第一图像的伪标签;将所述伪标签和所述强增强图像输入所述学生网络,获取所述第一图像的预测信息;所述预测信息用于指示所述第一待检测物属于第一类别的置信度;利用所述教师网络确定所述预测信息指示的所述第一待检测物的自适应标签;将所述第一待检测物的自适应标签输入所述学生网络,确定所述第一待检测物的类别信息
。4.
根据权利要求3所述的方法,其特征在于,利用所述教师网络获取所述第一图像的伪标签,包括:获取所述第一图像的弱增强图像,所述弱增强图像与所述第一图像之间的相似度大于所述强增强图像与所述第一图像之间的相似度;将所述弱增强图像输入所述教师网络,获得所述第一图像的伪标签
。5.
根据权利要求4所述的方法,其特征在于,利用所述教师网络确定所述预测信息指示的所述第一待检测物的自适应标签,包括:利用所述教师网络获取所述弱增强图像的特征;若所述预测信息指示的所述第一待检测物属于第一类别的置信度达到置信度阈值,将所述预测信息和所述弱增强图像的特征输入所述教师网络,获得所述第一待检测物的自适应标签
。6.
根据权利要求5所述的方法,其特征在于,所述方法还包括:若所述预测信息指示的所述第一待检测物属于第一类别的置信度未达到所述置信度阈值,将所述第一待检测物标记为不属于所述第一类别
。7.
根据权利要求5或6所述的方法,其特征在于,将所述预测信息和所述弱增强图像的特征输入所述教师网络,获得所述第一待检测物的自适应标签,包括:获取所述预测信息指示的一个或多个候选框,其中的一个候选框包括所述第一待检测
物;根据所述一个候选框和所述弱增强图像的特征,获取检测框;所述检测框包括所述一个候选框,以及所述弱增强图像中所述第一待检测物的特征;将所述检测框输入所述教师网络,获得所述第一待检测物的自适应标签
。8.
根据权利要求5至7中任一项所述的方法,其特征在于,所述方法还包括:获取统计周期内多个历史待检测物中属于所述第一类别的历史待检测物的数量;若所述数量大于或等于统计阈值,增大所述置信度阈值;若所述数量小于所述统计阈值,减小所述置信度阈值
。9.
根据权利要求3至8中任一项所述的方法,其特征在于,所述方法还包括:获取具有标签的第二图像;将所述第二图像输入所述学生网络,获取监督损失值;将所述第一图像输入所述学生网络,获取无监督损失值;根据所述监督损失值和所述无监督损失值确定模型损失参数;根据所述模型损失参数训练所述学生网络,以及,根据训练后的学生网络的模型参数更新所述教师网络的模型参数
。10.
根据权利要求9所述的方法,其特征在于,将所述第一图像输入所述学生网络,获取无监督损失值,包括:根据所述第一图像的伪标签和所述预测信息,获取区域建议网络
RPN
分类损失值和
RPN
回归损失值;将所述第一图像的伪标签和参考阈值输入所述学生网络,获取感兴趣区域
ROI
分类损失值;所述参考阈值包括正参考阈值和负参考阈值;根据所述
RPN
分类损失值
、
所述
RPN
回归损失值和所述
ROI
分类损失值,确定所述无监督损失值
。11.
一种目标检测装置,其特征在于,包括:获取模块,用于获取第一图像;所述第一图像包括一个或多个待检测物;检测模块,用于将第一图像输入目标检测模型,获取第一待检测物的类别信息;其中,所述第一待检测物为所述一个或多个待检测物中任一个,所述目标检测模型包括教师
‑
学生网络,所述教师
‑
学生网络用于根据所述第一待检测物的自适应标签确定所述第一待检测物的类别信息,所述自适应标签是由所述第一图像的伪标签和所述第一图像的强增强图像确定的;输出模块,用于...
【专利技术属性】
技术研发人员:韩承志,张亚斌,陈安伟,唐强,庄景宇,李冠彬,林倞,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。