【技术实现步骤摘要】
一种目标识别方法和装置
本专利技术涉及计算机领域,尤其涉及一种目标识别方法和装置。
技术介绍
目标识别是指利用计算机视觉和图像处理技术对图像中的特定物体进行识别和分类,是很多计算机视觉任务的基础。近年来在深度学习技术的推动下,目标识别技术取得了巨大的进步,并广泛应用于视频监控、智能交通、智能家居等领域。现有技术中目标识别技术的实现流程一般包括目标检测、目标对齐和目标转正三个步骤,目标检测用于从输入图像中获取包含目标的矩形框,目标对齐需要对绘制有矩形框的输入图像进行关键点检测,目标转正需要根据关键点将倾斜或者大角度偏转的目标进行转正。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:(1)目标识别的精度依赖于目标检测和目标对齐的精度,如果关键点检测不准确,会导致在目标转正时得到的图像不完整,将这样的图像添加到训练集,后续训练出的目标识别模型将无法正确识别目标。(2)为了提高目标检测和目标对齐的精度,需要使用高精度模型,但是高精度模型耗时长,而且目标对齐对输入图像的质量要求 ...
【技术保护点】
1.一种目标识别方法,其特征在于,包括:/n为基础图像数据集包含的目标生成对应的多姿态图像,将所述多姿态图像添加到所述基础图像数据集,得到中间图像数据集;/n对所述中间图像数据集的多张图像分别进行目标检测,得到目标检测结果;/n将所述中间图像数据集和所述目标检测结果作为训练集,基于预训练的基准识别模型,训练目标识别模型;/n将待识别图像输入所述目标识别模型,以进行目标识别。/n
【技术特征摘要】
1.一种目标识别方法,其特征在于,包括:
为基础图像数据集包含的目标生成对应的多姿态图像,将所述多姿态图像添加到所述基础图像数据集,得到中间图像数据集;
对所述中间图像数据集的多张图像分别进行目标检测,得到目标检测结果;
将所述中间图像数据集和所述目标检测结果作为训练集,基于预训练的基准识别模型,训练目标识别模型;
将待识别图像输入所述目标识别模型,以进行目标识别。
2.根据权利要求1所述的方法,其特征在于,所述为基础图像数据集包含的目标生成对应的多姿态图像,包括:
构建多姿态图像数据集,按照角度姿态信息对所述多姿态图像数据集的图像进行分类;
根据分类结果标注图像姿态,之后结合设定的编码规则,将标注结果编码为姿态控制参数;
以所述姿态控制参数为条件,基于生成对抗网络模型,训练多姿态图像生成模型;
将基础图像数据集的多张图像分别输入所述多姿态图像生成模型,以输出所述基础图像数据集包含的目标对应的多姿态图像。
3.根据权利要求1所述的方法,其特征在于,所述多姿态图像包括面内旋转图像和/或面外旋转图像;
所述为基础图像数据集包含的目标生成对应的多姿态图像,包括:
按照设定的第一旋转角度,将基础图像数据集中分别进行旋转,得到所述目标对应的面内旋转图像;
使用三维渐变模型分别拟合所述基础图像数据集中包含目标的图像,按照设定的第二旋转角度,将拟合得到的图像分别进行旋转后投影到二维平面,得到所述目标对应的面外旋转图像。
4.根据权利要求2所述的方法,其特征在于,所述将所述多姿态图像添加到所述基础图像数据集的步骤之前,还包括:
提取所述基础图像数据集中包含当前目标的图像的第一特征,以确定所述图像的特征中心;
提取所述当前目标对应的多姿态图像的第二特征,以确定所述第二特征与所述特征中心的第一相似度;
若所述第一相似度小于等于设定的第一阈值,则删除对应的多姿态图像,以完成图像清洗;
所述将所述多姿态图像添加到所述基础图像数据集,包括:将清洗后的所述多姿态图像添加到所述基础图像数据集。
5.根据权利要求3所述的方法,其特征在于,所述将所述多姿态图像添加到所述基础图像数据集的步骤之前,还包括:
计算所述基础图像数据集中包含当前目标的图像与对应的面外旋转图像的第二相似度;
若所述第二相似度小于设定的第二阈值,或者大于设定的第三阈值,则删除对应的面外旋转图像,以完成图像清洗;
所述将所述多姿态图像添加到所述基础图像数据集,包括:将清洗后的所述面外旋转图像添加到所述基础图像数据集。
6.根据权利要求1所述的方法,其特征在于,所述对所述中间图像数据集的多张图像分别进行目标检测的步骤之后,还包括:
保持目标检测所得第一边界框的中心不变,调整所述中间图像数据集的当前图像至设定的包含所述目标的尺寸;
所述将待识别图像输入所述目标识别模型的步骤之前,还包括:
对待识别图像进行目标检测,保持目标检测所得第二边界框的中心不变,调整所述待识别图像...
【专利技术属性】
技术研发人员:汪硕,王军,王晓波,傅天宇,石海林,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。