模型训练数据获取方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：35095392 阅读：38 留言：0更新日期：2022-10-01 16:57

本申请涉及一种模型训练数据获取方法、装置、计算机设备、存储介质和计算机程序产品。方法通过获取待标注的视频数据；提取待标注的视频数据中同一人物对应的目标图片；而后对目标图片进行物品检测处理，得到人物对应的目标物品标识；对人物对应的目标物品标识进行聚类处理，得到目标图片中同一人物对应的多种目标物品标识；从而对目标图片进行标注，得到用于机器学习模型训练的模型训练数据。本申请的方案，通过对人物对应的目标物品标识进行聚类处理，而后再进行标注，通过聚类可以有效地减少人物轨迹图片中同类目标物品的数量，从而提高模型训练数据标注过程的标注效率，综合提高模型训练数据的获取效率。型训练数据的获取效率。型训练数据的获取效率。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练数据获取方法、装置、计算机设备和存储介质

[0001]本申请涉及计算机
，特别是涉及一种模型训练数据获取方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着计算机技术的发展，出现了人工智能(Artificial Intelligence,AI)技术，人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。
[0003]而在使用人工智能技术时，如使用人工智能技术中的机器学习(MachineLearning,ML)技术时，需要针对需要构建的机器学习模型收集相应的模型训练数据，如对于服饰检索(识别)模型，一般需要利用服饰图片数据来作为模型训练数据，如从开源视频集合中提取出带有物品的图片数据作为模型训练数据。然而由于视频中镜头和图片帧量较大，因此对这些数据进行标注来获取模型训练数据的效率较低。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够提高模型训练数据获取效率的模型训练数据获取方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面，本申请提供了一种模型训练数据获取方法。所述方法包括：
[0006]...

【技术保护点】

【技术特征摘要】
1.一种模型训练数据获取方法，其特征在于，所述方法包括：获取待标注的视频数据；提取所述待标注的视频数据中同一人物对应的目标图片；对所述目标图片进行物品检测处理，得到人物对应的目标物品标识；对所述人物对应的目标物品标识进行聚类处理，以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合，得到所述目标图片中同一人物对应的多种目标物品标识；根据所述目标图片中同一人物对应的多种目标物品标识对所述目标图片进行标注，得到用于机器学习模型训练的模型训练数据。2.根据权利要求1所述的方法，其特征在于，所述提取所述未标注的视频数据中同一人物对应的目标图片包括：对所述待标注的视频数据进行镜头切分处理，得到切分视频数据；对所述切分视频数据中的同一人物进行人物识别处理，得到所述同一人物对应的目标图片。3.根据权利要求2所述的方法，其特征在于，所述对所述切分视频数据中的同一人物进行人物识别处理，得到所述同一人物对应的目标图片包括：识别所述切分视频数据中包含人脸的人脸视频帧；对所述人脸视频帧进行人脸识别处理，得到相同人脸对应的人脸视频帧；将所述相同人脸对应的人脸视频帧，作为所述同一人物对应的目标图片。4.根据权利要求1所述的方法，其特征在于，所述对所述人物对应的目标物品标识进行聚类处理，以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合，得到所述目标图片中同一人物对应的多种目标物品标识包括：通过多模型投票法对所述人物对应的目标物品标识进行聚类处理，以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合，得到所述目标图片中同一人物对应的多种目标物品标识。5.根据权利要求4所述的方法，其特征在于，所述通过多模型投票法对所述人物对应的目标物品标识进行聚类处理，以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合，得到所述目标图片中同一人物对应的多种目标物品标识包括：通过不同的预设特征提取模型对包含所述目标物品标识的目标图片进行特征提取处理，得到基础物品特征；将所述不同的预设特征提取模型提取得到的基础物品特征进行拼接处理，获取目标物品特征；基于所述目标物品特征对所述人物对应的目标物品标识进行聚类处理，以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合，得到所述目标图片中同一人物对应的多种目标物品标识。6.根据权利要求5所述的方法，其特征在于，所述预设特征提取模型包括第一特征提取模型、第二特征提取模型、第三特征提取模型以及第四特征提取模型；所述通过不同的预设特征提取模型对包含所述目标物品标识的目标图片进行特征提取处理，得到基础物品特征之前，还包括：
通过预设第一算法与预设第三...

【专利技术属性】
技术研发人员：高树会，曲直，裴唯一，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人