图像检测方法、装置、设备以及存储介质制造方法及图纸

技术编号：25551833 阅读：21 留言：0更新日期：2020-09-08 18:52

本申请实施例公开了图像检测方法、装置、设备以及存储介质，涉及人工智能、深度学习、图像处理技术领域。该方法的一具体实施方式包括：将待检测图像输入至预先训练的多任务检测模型，其中，多任务检测模型包括位置检测分支网络和属性预测分支网络；利用位置检测分支网络对待检测图像进行处理，得到待检测图像中的目标的位置；利用属性预测分支网络对待检测图像进行处理，得到待检测图像中的目标的属性；对应输出待检测图像中的至少部分目标的位置和属性。该实施方式利用包括位置检测分支网络和属性预测分支网络的多任务检测模型同时进行位置检测和属性预测，并且属性预测分支网络能够一次预测所有目标的属性，大大降低了多任务检测耗时。

全部详细技术资料下载

【技术实现步骤摘要】
图像检测方法、装置、设备以及存储介质
本申请实施例涉及计算机
，具体涉及人工智能、深度学习、图像处理
，特别涉及图像检测方法、装置、设备以及存储介质。
技术介绍
目标检测是深度学习中的一种检测模型，目标检测模型可以定位出一张图像中的多个目标的边界框。对于普通的目标检测模型，当输入一张图像时，仅输出图像中的多个目标的位置。当需要进行多任务检测时，通常需要多个模型来完成。例如，在目标检测模型检测出图像中的多个目标的边界框之后，将多个目标的边界框以规定的格式从原图像中分别抠出，在对抠出的多个目标的边界框做少量变换之后，依次输入至属性预测模型，以得到多个目标的属性值。
技术实现思路
本申请实施例提出了图像检测方法、装置、设备以及存储介质。第一方面，本申请实施例提出了一种图像检测方法，包括：将待检测图像输入至预先训练的多任务检测模型，其中，多任务检测模型包括位置检测分支网络和属性预测分支网络；利用位置检测分支网络对待检测图像进行处理，得到待检测图像中的目标的位置；利用属性预测分支网络对待检测图像进行处理，得到待检测图像中的目标的属性；对应输出待检测图像中的至少部分目标的位置和属性。第二方面，本申请实施例提出了一种图像检测装置，包括：图像输入模块，被配置成将待检测图像输入至预先训练的多任务检测模型，其中，多任务检测模型包括位置检测分支网络和属性预测分支网络；位置检测模块，被配置成利用位置检测分支网络对待检测图像进行处理，得到待检测图像中的目标的位置；属性预测模块，被配置成利用属性预...

【技术保护点】
1.一种图像检测方法，包括：/n将待检测图像输入至预先训练的多任务检测模型，其中，所述多任务检测模型包括位置检测分支网络和属性预测分支网络；/n利用所述位置检测分支网络对所述待检测图像进行处理，得到所述待检测图像中的目标的位置；/n利用所述属性预测分支网络对所述待检测图像进行处理，得到所述待检测图像中的目标的属性；/n对应输出所述待检测图像中的至少部分目标的位置和属性。/n

【技术特征摘要】
1.一种图像检测方法，包括：
将待检测图像输入至预先训练的多任务检测模型，其中，所述多任务检测模型包括位置检测分支网络和属性预测分支网络；
利用所述位置检测分支网络对所述待检测图像进行处理，得到所述待检测图像中的目标的位置；
利用所述属性预测分支网络对所述待检测图像进行处理，得到所述待检测图像中的目标的属性；
对应输出所述待检测图像中的至少部分目标的位置和属性。

2.根据权利要求1所述的方法，其中，位置包括目标框的坐标、得分和索引；以及
所述对应输出所述待检测图像中的至少部分目标的位置和属性，包括：
基于目标框的得分选取所述待检测图像中的至少部分目标；
使用所选取的每个目标的目标框的索引在所述待检测图像中的目标的属性中查找，得到所选取的每个目标的属性；
对应输出所选取的每个目标的位置和属性。

3.根据权利要求1所述的方法，其中，所述多任务检测模型的训练步骤包括：
获取样本图像集合；
对于所述样本图像集合中的样本图像，若该样本图像中的目标同时标注位置和属性，将该样本图像作为输入，将该样本图像中的目标的标注位置和标注目标属性作为输出，训练所述多任务检测模型。

4.根据权利要求3所述的方法，其中，所述多任务检测模型的训练步骤还包括：
若该样本图像中的目标仅标注位置，将该样本图像作为输入，将该样本图像中的目标的标注位置作为输出，训练所述多任务检测模型中的位置检测分支网络。

5.根据权利要求4所述的方法，其中，所述位置检测分支网络包括位置检测网络主体、坐标分支和得分分支；以及
所述将该样本图像作为输入，将该样本图像中的目标的标注位置作为输出，训练所述多任务检测模型中的位置检测分支网络，包括：
将该样本图像输入至所述位置检测网络主体，得到该样本图像的位置特征；
将该样本图像的位置特征分别输入至所述坐标分支和所述得分分支，得到该样本图像中的目标框的预测坐标和预测得分；
基于该样本图像中的目标框的预测坐标和预测得分，以及目标的标注位置，计算位置损失函数；
基于所述位置损失函数调整所述位置检测分支网络的参数。

6.根据权利要求3所述的方法，其中，所述多任务检测模型的训练步骤还包括：
若该样本图像中的目标仅标注属性，将该样本图像作为输入，将该样本图像中的目标的标注属性作为输出，训练所述多任务检测模型中的属性预测分支网络。

7.根据权利要求6所述的方法，其中，所述属性预测分支网络包括属性预测网络主体和属性分支；以及
所述将该样本图像作为输入，将该样本图像中的目标的标注属性作为输出，训练所述多任务检测模型中的属性预测分支网络，包括：
将该样本图像输入至所述属性预测网络主体，得到该样本图像的属性特征；
将该样本图像的属性特征输入至所述属性分支，得到该样本图像中的目标的预测属性；
基于该样本图像中的目标的预测属性和标注属性，计算属性损失函数；
基于所述属性损失函数调整所述属性预测分支网络的参数。

8.一种图像检测装置，包括：
图像输入模块，被配置成将待检测图像输入至预先训练的多任务检测模型，其中，所述多任务检测模型包括位置检测分支网络和属性预测分支网络；
...

【专利技术属性】
技术研发人员：王康康，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人