目标检测方法及装置制造方法及图纸

技术编号:39745167 阅读:11 留言:0更新日期:2023-12-17 23:44
一种目标检测方法及装置,涉及

【技术实现步骤摘要】
目标检测方法及装置


[0001]本申请涉及人工智能
(artificial intelligence

AI)
领域,尤其涉及一种目标检测方法及装置


技术介绍

[0002]深度神经网络
(deep neural network

DNN)
模型广泛应用于计算机视觉
(Computer Vision

CV)、
语音识别

自然语言处理
(Natural Language Processing

NLP)
等领域


CV
领域中的目标检测为例,由于数据集中物体级别的注释数据的收集过程耗时较多且成本较高,因此,服务器采用半监督的目标检测方法来识别图像中的目标物

该半监督的目标检测方法是指为大量未标记的图像确定伪标签
(pseudo

label)
,并根据这些伪标签对源数据集的
DNN
模型进行训练,从而提高
DNN
模型在使用有限的有标记的图像进行训练时的目标检测性能

其中的伪标签是指服务器为未标记的数据添加的预测标签

[0003]然而,由于不同数据集中的数据分布不同,导致未标记的图像的伪标签的准确性较低,因此,应用于源数据集的
DNN
模型在对目标数据集中的图像进行目标检测时,
DNN
模型的目标检测性能受到影响,如
DNN
模型将图像中属于类别1的物体识别为类别2,或者将类别3的物体识别为图像的背景,或者将未知物体识别为已知的类别1等

因此,如何提供一种更为有效的目标检测方法成为目前亟需解决的问题


技术实现思路

[0004]本申请提供一种目标检测方法及装置,解决了目标检测模型对未标记的数据识别准确率较低的问题

[0005]本申请采用如下技术方案

[0006]第一方面,本申请提供了一种目标检测方法,该方法应用于
AI
系统,该
AI
系统包括服务器,或支持实现该服务器实现目标检测方法的物理设备,例如该物理设备包括芯片系统

这里以服务器执行本实施例提供的目标检测方法为例进行说明,该目标检测方法包括:服务器获取第一图像,并将第一图像输入目标检测模型,获取第一待检测物的类别信息

其中的第一图像包括一个或多个待检测物,第一待检测物为一个或多个待检测物中任一个,前述的目标检测模型包括教师

学生网络,所述教师

学生网络用于根据第一待检测物的自适应标签确定第一待检测物的类别信息,自适应标签是由第一图像的伪标签和第一图像的强增强图像确定的

最后,服务器输出第一图像中一个或多个待检测物的类别信息

[0007]在本实施例中,服务器可在第一图像的伪标签的基础上,结合第一图像对应的强增强图像获得自适应标签,并根据自适应标签确定第一图像中物体的类别信息,避免了有标记数据和未标记数据的分布不同所导致的未标记数据的伪标签不准确的问题,以及由未标记数据的伪标签不准确所导致的目标检测模型的检测准确性降低,提高了服务器对未标记数据中物体的检测准确性

[0008]在一种可选的实现方式中,服务器输出第一图像中一个或多个待检测物的类别信
息,包括:服务器在第一图像中标记一个或多个待检测物的类别信息,获得并发送标记后的第一图像

如此,服务器可将图像中物体的类别信息标记到图像中,标记后的图像可展示图像中物体的类别,从而使得用户能够快速的从服务器输出的图像中查看到各物体的类别,提高
QoE。
[0009]在另一种可选的实现方式中,教师

学生网络包括:教师网络和学生网络

服务器将第一图像输入目标检测模型,获取第一待检测物的类别信息,包括:第一,服务器利用教师网络获取第一图像的伪标签

第二,服务器将伪标签和强增强图像输入学生网络,获取第一图像的预测信息;该预测信息用于指示第一待检测物属于第一类别的置信度

第三,服务器利用教师网络确定预测信息指示的第一待检测物的自适应标签

第四,服务器将第一待检测物的自适应标签输入学生网络,确定第一待检测物的类别信息

[0010]在本实施例中,服务器不仅可以利用第一图像的伪标签和第一图像所对应的强增强图像对第一图像进行初始的目标检测,服务器还可以利用教师网络基于第一图像的初始预测信息生成待检测物的自适应标签,进而,服务器利用学生网络对待检测物的自适应标签进行识别,获取到第一图像中待检测物的类别信息

[0011]由于待检测物的自适应标签是服务器基于第一图像的伪标签以及强增强图像确定的,因此,避免了第一图像的伪标签不准确所导致的目标检测准确性降低的问题

而且,在第一图像不存在标记的情况下,服务器可基于教师网络为待检测物确定自适应标签,并由学生网络依据该自适应标签确定待检测物的类别,多个网络协同对未标记的待检测物进行目标检测,避免了单个网络无法准确识别未标记图像的问题,提高了目标检测模型的识别准确率

[0012]在另一种可选的实现方式中,服务器利用教师网络获取第一图像的伪标签,包括:服务器获取第一图像的弱增强图像,并将弱增强图像输入教师网络,获得第一图像的伪标签

其中,弱增强图像与第一图像之间的相似度大于强增强图像与第一图像之间的相似度

[0013]在服务器利用第一图像对应的强增强图像对第一图像进行初始的目标检测之前,服务器还可利用第一图像对应的弱增强图像确定第一图像的伪标签

示例性的,该伪标签由教师

学生网络中的教师网络根据第一图像的弱增强图像进行确定,避免了服务器采用单个网络对第一图像获取伪标签导致的伪标签准确性较低的问题,提高了目标检测模型对第一图像的检测准确性

[0014]在另一种可选的实现方式中,服务器利用教师网络确定预测信息指示的第一待检测物的自适应标签,包括:服务器利用教师网络获取弱增强图像的特征

[0015]若预测信息指示的第一待检测物属于第一类别的置信度达到置信度阈值,服务器将预测信息和弱增强图像的特征输入教师网络,获得第一待检测物的自适应标签

[0016]该置信度阈值用于控制自适应标签的门限,示例性的,当预测信息确定的第一待检测物属于第一类别的置信度
(
简称:初始置信度
)
大于或等于置信度阈值时,服务器确定该预测信息为有效信息,并依据弱本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种目标检测方法,其特征在于,包括:获取第一图像;所述第一图像包括一个或多个待检测物;将第一图像输入目标检测模型,获取第一待检测物的类别信息;其中,所述第一待检测物为所述一个或多个待检测物中任一个,所述目标检测模型包括教师

学生网络,所述教师

学生网络用于根据所述第一待检测物的自适应标签确定所述第一待检测物的类别信息,所述自适应标签是由所述第一图像的伪标签和所述第一图像的强增强图像确定的;输出所述第一图像中所述一个或多个待检测物的类别信息
。2.
根据权利要求1所述的方法,其特征在于,输出所述第一图像中所述一个或多个待检测物的类别信息,包括:在所述第一图像中标记所述一个或多个待检测物的类别信息,获得标记后的第一图像;发送所述标记后的第一图像
。3.
根据权利要求1或2所述的方法,其特征在于,所述教师

学生网络包括:教师网络和学生网络;所述将第一图像输入目标检测模型,获取第一待检测物的类别信息,包括:利用所述教师网络获取所述第一图像的伪标签;将所述伪标签和所述强增强图像输入所述学生网络,获取所述第一图像的预测信息;所述预测信息用于指示所述第一待检测物属于第一类别的置信度;利用所述教师网络确定所述预测信息指示的所述第一待检测物的自适应标签;将所述第一待检测物的自适应标签输入所述学生网络,确定所述第一待检测物的类别信息
。4.
根据权利要求3所述的方法,其特征在于,利用所述教师网络获取所述第一图像的伪标签,包括:获取所述第一图像的弱增强图像,所述弱增强图像与所述第一图像之间的相似度大于所述强增强图像与所述第一图像之间的相似度;将所述弱增强图像输入所述教师网络,获得所述第一图像的伪标签
。5.
根据权利要求4所述的方法,其特征在于,利用所述教师网络确定所述预测信息指示的所述第一待检测物的自适应标签,包括:利用所述教师网络获取所述弱增强图像的特征;若所述预测信息指示的所述第一待检测物属于第一类别的置信度达到置信度阈值,将所述预测信息和所述弱增强图像的特征输入所述教师网络,获得所述第一待检测物的自适应标签
。6.
根据权利要求5所述的方法,其特征在于,所述方法还包括:若所述预测信息指示的所述第一待检测物属于第一类别的置信度未达到所述置信度阈值,将所述第一待检测物标记为不属于所述第一类别
。7.
根据权利要求5或6所述的方法,其特征在于,将所述预测信息和所述弱增强图像的特征输入所述教师网络,获得所述第一待检测物的自适应标签,包括:获取所述预测信息指示的一个或多个候选框,其中的一个候选框包括所述第一待检测
物;根据所述一个候选框和所述弱增强图像的特征,获取检测框;所述检测框包括所述一个候选框,以及所述弱增强图像中所述第一待检测物的特征;将所述检测框输入所述教师网络,获得所述第一待检测物的自适应标签
。8.
根据权利要求5至7中任一项所述的方法,其特征在于,所述方法还包括:获取统计周期内多个历史待检测物中属于所述第一类别的历史待检测物的数量;若所述数量大于或等于统计阈值,增大所述置信度阈值;若所述数量小于所述统计阈值,减小所述置信度阈值
。9.
根据权利要求3至8中任一项所述的方法,其特征在于,所述方法还包括:获取具有标签的第二图像;将所述第二图像输入所述学生网络,获取监督损失值;将所述第一图像输入所述学生网络,获取无监督损失值;根据所述监督损失值和所述无监督损失值确定模型损失参数;根据所述模型损失参数训练所述学生网络,以及,根据训练后的学生网络的模型参数更新所述教师网络的模型参数
。10.
根据权利要求9所述的方法,其特征在于,将所述第一图像输入所述学生网络,获取无监督损失值,包括:根据所述第一图像的伪标签和所述预测信息,获取区域建议网络
RPN
分类损失值和
RPN
回归损失值;将所述第一图像的伪标签和参考阈值输入所述学生网络,获取感兴趣区域
ROI
分类损失值;所述参考阈值包括正参考阈值和负参考阈值;根据所述
RPN
分类损失值

所述
RPN
回归损失值和所述
ROI
分类损失值,确定所述无监督损失值
。11.
一种目标检测装置,其特征在于,包括:获取模块,用于获取第一图像;所述第一图像包括一个或多个待检测物;检测模块,用于将第一图像输入目标检测模型,获取第一待检测物的类别信息;其中,所述第一待检测物为所述一个或多个待检测物中任一个,所述目标检测模型包括教师

学生网络,所述教师

学生网络用于根据所述第一待检测物的自适应标签确定所述第一待检测物的类别信息,所述自适应标签是由所述第一图像的伪标签和所述第一图像的强增强图像确定的;输出模块,用于...

【专利技术属性】
技术研发人员:韩承志张亚斌陈安伟唐强庄景宇李冠彬林倞
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1