样本图像数据生成方法、模型的训练方法和装置制造方法及图纸

技术编号：34627202 阅读：24 留言：0更新日期：2022-08-20 09:35

本公开提供了一种样本图像数据生成方法和装置、一种深度学习模型的训练方法和装置、一种目标对象检测方法和装置、电子设备、存储介质和计算机程序产品，涉及人工智能领域，尤其涉及目标识别和深度学习技术领域，可用于智慧城市、智能安防和智能云场景等。具体实现方案为：根据多个原始图像，得到多个原始图像中的多个面部图像、多个全身图像以及多个面部图像和多个全身图像之间的对应关系；对多个面部图像的特征向量进行聚类，得到多个面部类别簇；以及根据多个全身图像、对应关系以及多个面部类别簇，得到多个全身图像各自的标签信息。息。息。

全部详细技术资料下载

【技术实现步骤摘要】
样本图像数据生成方法、模型的训练方法和装置

[0001]本公开涉及人工智能
，尤其涉及目标识别和深度学习
具体涉及一种样本图像数据生成方法和装置、一种深度学习模型的训练方法和装置、一种目标对象检测方法和装置、电子设备、存储介质和计算机程序产品。

技术介绍

[0002]随着深度学习技术的飞速发展，深度学习的方法被广泛应用于目标识别、图像分类和行人重识别等多个计算机视觉领域。基于深度学习原理的目标检测及其识别技术依赖大量高质量的标注数据。因此，标注数据的获取是目标检测及其识别技术研究和应用的重要基础。

技术实现思路

[0003]本公开提供了一种样本图像数据生成方法和装置、一种深度学习模型的训练方法和装置、一种目标对象检测方法和装置、电子设备、存储介质和计算机程序产品。
[0004]根据本公开的一个方面，提供了一种样本图像数据生成方法，包括：根据多个原始图像，得到多个原始图像中的多个面部图像、多个全身图像以及多个面部图像和多个全身图像之间的对应关系；对多个面部图像的特征向量进行聚类，得到多个面部类别簇；以及根据多个全身图像、对应关系以及多个面部类别簇，得到多个全身图像各自的标签信息。
[0005]根据本公开的另一方面，提供了一种深度学习模型的训练方法，包括：获取样本图像数据；将样本图像数据输入深度学习模型，得到样本图像数据的检测结果；以及根据检测结果与样本图像数据的标签信息之间的差异值，对深度学习模型进行训练；其中，样本图像数据是利用以上所述的样本图像数据生成方法生成的。/>[0006]根据本公开的另一方面，提供了一种目标对象检测方法，包括：将待处理图像输入深度学习模型，得到待处理图像中目标对象的检测结果；其中，深度学习模型是利用以上所述的深度学习模型的训练方法训练得到的。
[0007]根据本公开的另一方面，提供了一种样本图像数据生成装置，包括：第一获取模块，用于根据多个原始图像，得到多个原始图像中的多个面部图像、多个全身图像以及多个面部图像和多个全身图像之间的对应关系；聚类模块，用于对多个面部图像的特征向量进行聚类，得到多个面部类别簇；以及标注模块，用于根据多个全身图像、对应关系以及多个面部类别簇，得到多个全身图像各自的标签信息。
[0008]根据本公开的另一方面，提供了一种深度学习模型的训练装置，包括：第二获取模块，用于获取样本图像数据；检测模块，用于将样本图像数据输入深度学习模型，得到样本图像数据的检测结果；以及训练模块，用于根据检测结果与样本图像数据的标签信息之间的差异值，对深度学习模型进行训练；其中，样本图像数据是利用以上所述的样本图像数据生成装置生成的。
[0009]根据本公开的另一方面，提供了一种目标对象检测装置，该装置包括：目标检测模
块，用于将待处理图像输入深度学习模型，得到待处理图像中目标对象的检测结果；其中，深度学习模型是利用以上所述的深度学习模型的训练装置训练得到的。
[0010]根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行根据本公开提供的方法。
[0011]根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行根据本公开提供的方法。
[0012]根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据本公开提供的方法。
[0013]应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案，不构成对本公开的限定。其中：
[0015]图1是根据本公开的实施例的可以应用样本图像数据生成方法、深度学习模型的训练方法、目标对象检测方法和装置的示例性系统架构示意图；
[0016]图2是根据本公开的实施例的样本图像数据生成方法的流程图；
[0017]图3是根据本公开的实施例的样本图像数据生成方法的示意图；
[0018]图4是根据本公开的实施例的深度学习模型的训练方法的流程图；
[0019]图5是根据本公开的实施例的目标对象检测方法的流程图；
[0020]图6是根据本公开的实施例的样本图像数据生成装置的框图；
[0021]图7是根据本公开的实施例的深度学习模型的训练装置的框图；
[0022]图8是根据本公开的实施例的目标对象检测装置的框图；以及
[0023]图9是用来实现本公开的实施例的样本图像数据生成方法、深度学习模型的训练方法以及目标对象检测方法的电子设备的框图。
具体实施方式
[0024]以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
[0025]随着深度学习技术的飞速发展，深度学习的方法被广泛应用于目标识别、图像分类和行人重识别等多个计算机视觉领域。基于深度学习原理的目标检测及其识别技术依赖大量的标注数据。因此，标注数据的获取是目标检测及其识别技术研究和应用的重要基础。
[0026]尤其针对行人重识别技术这一研究方向。行人重识别技术(Person Re
‑
identification)是利用计算机视觉技术在跨摄像头跨场景下判断图像或者视频序列中是否存在特定目标对象的技术。行人重识别技术可以弥补固定的摄像头的视觉局限，可广泛应用于智能安防和智慧城市等场景。然而，由于不同的摄像机具有各自的参数，而且受背景、光照、朝向和遮挡物等影响，导致视频图像的质量参差不齐。因而，行人重识别技术对于
标注数据的质量要求更高。
[0027]数据标注方法可以通过预训练的目标检测模型来进行标注，或者采用人工进行标注。然而，由于不同监控场景下视频图像受背景、光照、朝向和遮挡物等影响较大，因而采用模型进行数据标注的方式往往在限定的时空范围内才能获得令人满意的效果。而采用人工标注的方式不仅效率低下，而且容易出错。
[0028]图1是根据本公开实施例的可以应用样本图像数据生成方法、深度学习模型的训练方法、目标对象检测方法和装置的示例性系统架构示意图。需要注意的是，图1所示仅为可以应用本公开实施例的系统架构的示例，以帮助本领域技术人员理解本公开的
技术实现思路
，但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
[0029]如图1所示，根据该实施例的系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、1本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种样本图像数据生成方法，包括：根据多个原始图像，得到所述多个原始图像中的多个面部图像、多个全身图像以及多个面部图像和多个全身图像之间的对应关系；对所述多个面部图像的特征向量进行聚类，得到多个面部类别簇；以及根据所述多个全身图像、所述对应关系以及所述多个面部类别簇，得到所述多个全身图像各自的标签信息。2.根据权利要求1所述的方法，其中，每个所述面部类别簇包括同一对象的N个面部图像，N为大于等于1的整数；所述根据所述多个全身图像、所述对应关系以及所述多个面部类别簇，得到所述多个全身图像各自的标签信息包括：针对每个所述面部类别簇，根据所述对应关系，确定所述面部类别簇中N个面部图像所对应的N个全身图像；根据所述N个全身图像的第一特征向量从所述多个全身图像中确定与所述N个全身图像相匹配的M个全身图像；M为大于等于1的整数；以及对所述N个全身图像与所述M个全身图像添加标签信息。3.根据权利要求2所述的方法，其中，所述根据所述N个全身图像的第一特征向量从所述多个全身图像中确定与所述N个全身图像相匹配的M个全身图像包括：分别确定所述N个全身图像的第一特征向量与所述多个全身图像的第二特征向量之间的相似度；以及在所述相似度大于等于预定阈值的情况下，根据所述相似度的大小顺序，执行从所述多个全身图像中确定与所述N个全身图像相匹配的M个全身图像的操作。4.根据权利要求2所述的方法，还包括：在对所述N个全身图像与所述M个全身图像添加标签信息之前，响应于检测到所述N个全身图像与所述M个全身图像中存在重复的全身图像，对所述N个全身图像与所述M个全身图像执行去重处理。5.一种深度学习模型的训练方法，包括：获取样本图像数据；将所述样本图像数据输入所述深度学习模型，得到所述样本图像数据的检测结果；以及根据所述检测结果与所述样本图像数据的标签信息之间的差异值，对所述深度学习模型进行训练；其中，所述样本图像数据是利用权利要求1～4中任一项所述的方法生成的。6.一种目标对象检测方法，包括：将待处理图像输入深度学习模型，得到所述待处理图像中目标对象的检测结果；其中，所述深度学习模型是利用权利要求5所述的方法训练得到的。7.一种样本图像数据生成装置，包括：第一获取模块，用于根据多个原始图像，得到所述多个原始图像中的多个面部图像、多个全身图像以及多个面部图像和多个全身图像之间的对应关系；聚类模块，用于对所述多个面部图像的特征向量进行聚类，得到多个面部类别簇；以及标注模块，用于根据所述...

【专利技术属性】
技术研发人员：付琰，许顺楠，陈亮辉，范斌，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人