【技术实现步骤摘要】
目标检测方法及装置、计算设备
[0001]本申请涉及人工智能
,尤其涉及一种目标检测方法及装置、计算设备。
技术介绍
[0002]目标检测是计算机视觉领域中一个热点研究方向,可以广泛应用于智能导航、医学图像处理、自动驾驶、智能监控、工业瑕疵检测等诸多领域。目前的目标检测算法可以识别并分割图像中的目标对象所在区域以及背景区域。目标检测可以包括大目标检测以及小目标检测,小目标可以为检测框的宽小于原图像的宽的1/50(像素点),检测框的高小于原图像的高的1/50(像素点);检测框的大小与目标对象的大小相适应。
[0003]现有技术中,通常可以采用一个目标检测模型来检测图像中的全部目标,但是对于图像中的小目标而言,通常可以采用深层网络以及更多尺度对图像特征进行提取以及分类预测,使用更适合小目标的损失函数,以确保获得准确的小目标。
[0004]但是,采用目标检测模型直接对小目标进行检测的方式时,由于小目标足够小,即便是采用更复杂的网络、更多的尺度以及更适合小目标的损失函数,获得的检测结果仍然不够准确,检测精度较低。
技术实现思路
[0005]有鉴于此,本申请实施例提供一种目标检测方法及装置、计算设备,用以解决现有技术中目标检测模型对小目标的检测结果不够准确的技术问题。
[0006]第一方面,本申请实施例提供一种目标检测方法,包括:
[0007]确定待检测图像;
[0008]基于第一检测模型,检测所述待检测图像中目标对象所在第一目标区域以及所述目标对象所属目标类别;< ...
【技术保护点】
【技术特征摘要】
1.一种目标检测方法,其特征在于,包括:确定待检测图像;基于第一检测模型,检测所述待检测图像中目标对象所在第一目标区域以及所述目标对象所属目标类别;提取所述待检测图像在所述第一目标区域的局部图像;基于第二检测模型,检测所述局部图像中所述目标对象所在第二目标区域;根据所述第二目标区域,结合所述目标对象所属目标类别,确定所述待检测图像中所述目标对象的检测结果。2.根据权利要求1所述的方法,其特征在于,还包括:确定第一类别集合中的至少一个第一分类类别以及第二类别集合中的至少一个第二分类类别对应的第一检测模型;确定第二类别集合中至少一个第二分类类别对应的第二检测模型。3.根据权利要求2所述的方法,其特征在于,所述基于第一检测模型,检测所述待检测图像中目标对象所在第一目标区域以及所述目标对象所属目标类别包括:基于所述第一检测模型,检测所述待检测图像中所述目标对象所在第一目标区域;根据所述第一目标区域对应的对象特征,从所述第一检测模型对应至少一个第一分类类别以及至少一个第二分类类别中,确定所述目标对象所属目标类别。4.根据权利要求1~3任一项所述的方法,其特征在于,所述基于第一检测模型,检测所述待检测图像中目标对象所在第一目标区域以及所述目标对象所属目标类别之后,还包括:确定所述第一类别集合以及所述第二类别集合;其中,所述第一类别集合包括具有第一类别属性的所述至少一个第一分类类别;所述第二类别集合包括具有第二类别属性的所述至少一个第二分类类别;如果所述目标类别属于第一类别集合,根据所述第一目标区域,结合所述目标对象所属目标类别,确定所述待检测图像中所述目标对象的检测结果。5.根据权利要求2所述的方法,其特征在于,所述提取所述待检测图像在所述第一目标区域的局部图像包括:如果所述目标类别属于第二类别集合,提取所述待检测图像在所述第一目标区域的局部图像。6.根据权利要求5所述的方法,其特征在于,所述如果所述目标类别属于第二类别集合,提取所述待检测图像在所述第一目标区域的局部图像包括:如果所述目标类别属于第二类别集合,确定所述第一检测模型检测所述目标对象的第一目标区域以及目标类别对应的第一置信度;如果所述第一置信度大于第一阈值,根据所述第一目标区域,结合所述目标对象所属目标类别,确定所述待检测图像中所述目标对象的检测结果;如果所述第一置信度大于第二阈值且小于所述第一阈值,则提取所述待检测图像在所述第一目标区域的局部图像。7.根据权利要求4所述的方法,其特征在于,所述第一类别集合以及第二类别集合通过以下方式确定:
确定多个标注图像;其中,任一个标注图像对应有标注对象所在的标注区域以及标注类别;将标注类别相同的标注图像划分至同一个类别图像集合中,以获得多个标注类别分别对应的类别图像集合;其中,任一个类别图像集合包括具有相同标注类别的至少一个标注图像;根据任一个标注类别对应类别图像集合中的至少一个标注图像,从第一类别属性以及第二类别属性中确定所述标注类别对应的目标类别属性,以获得所述多个标注类别分别对应的目标类别属性;将目标类别属性为第一类别属性的标注类别划分至第一类别集合以及将目标类别属性为第二类别属性的标注类别划分至第二类别集合。8.根据权利要求7所述的方法,其特征在于,所述标注区域对应有第一类别属性或者第二类别属性;所述根据任一个标注类别对应类别图像集合中的至少一个标注图像,从第一类别属性以及第二类别属性中确定所述标注类别对应的目标类别属性,以获得所述多个标注类别分别对应的目标类别属包括:针对任一个标注类别对应类别图像集合中的至少一个标注图像,确定所述至少一个标注图像中标注区域对应第一类别属性的第一标注图像,以及标注区域对应第二类别属性的第二标注图像;统计所述第一标注图像的数量,获得第一图像数量以及所述第二标注图像的数量,获得第二图像数量;判断所述第一图像数量与所述第二图像数量的比值是否大于第一比例阈值;如果是,则确定所述标注类别对应第一类别属性;如果否,则确定所述标注类别对应第二类别属性。9.根据权利要求7所述的方法,其特征在于,所述将目标类别属性为第一类别属性的标注类别划分至第一类别集合以及将目标类别属性为第二类别属性的标注类别划分至第二类别集合之后,还包括:针对第一类别集合中的任一个标注类别,如果所述标注类别的测试结果不满足测试条件,则将所述标注类别标记为第二类别属性,并划分至所述第二类别集合中。10.根据权利要求9所述的方法,其特征在于,所述第一类别集合中的任一个标注类别的测试结果通过以下方式确定:确定属于所述标注类别的多个第一测试图像;其中,所述多个第一测试图像对应有标注对象所在的标注区域;将所述多个第一测试图像分别输入所述第一检测模型,获得所述多个第一测试图像分别检测获得的目标对象所在的测试区域以及测试类别;根据所述多个第一测试图像各自的标注区域以及测试区域,以及所述多个第一测试图像各自的标注类别以及测试类别,确定所述多个第一测试图像对应的测试结果。11.根据权利要求10所述的方法,其特征在于,所述根据所述多个第一测试图像各自的标注区域以及测试区域,以及所述多个第一测试图像各自的标注类别以及测试类别,确定所述多个第一测试图像对应的测试结果包括:
根据所述多个第一测试图像各自的标注区域以及测试区域,以及所述第一多个测试图像各自的标注类别以及测试类别,确定所述多个第一测试图像对应的准确率以及召回率;所述针对第一类别集合中的任一个标注类别,如果所述标注类别的测试结果不满足测试条件,则将所述标注类别的类别属性由第一类别属性更新为第二类别属性,并将所述标注类别划分至所述第二类别集合中包括:针对第一类别集合中的任一个标注类别,确定所述标注类别对应的准确率以及召回率;如果所述标注类别的准确率小于预设准确率阈值且所述标注类别的召回率小于召回率阈值,确定所述标注类别的测试结果不满足测试条件;将所述标注类别的类别属性由第一类别属性更新为第二类别属性,并将所述标注类别划分至所述第二类别集合中。12.根据权利要求7所述的方法,其特征在于,所述第一检测模型通过以下方式训练获得:确定多个第一训练数据;其中,所述多个第一训练数据分别对应有标注对象所在的标注区域以及标注类别;所述标注区域对应有第一类别属性或者第二类别属性;基于所述第一类别集合中的至少一个第一分类类别以及第二类别集合中的至少一个第二分类类别,构建所述第一检测模型;根据预设第一训练目标,利用所述多个第一训练数据训练获得所述第一检测模型的第一模型参数。13.根据权利要求7所述的方法,其特征在于,所述第二检测模型通过以下方式训练获得:确定多个第二...
【专利技术属性】
技术研发人员:邹远鹏,陈想,汪彪,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。