模型训练数据获取方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:35095392 阅读:38 留言:0更新日期:2022-10-01 16:57
本申请涉及一种模型训练数据获取方法、装置、计算机设备、存储介质和计算机程序产品。方法通过获取待标注的视频数据;提取待标注的视频数据中同一人物对应的目标图片;而后对目标图片进行物品检测处理,得到人物对应的目标物品标识;对人物对应的目标物品标识进行聚类处理,得到目标图片中同一人物对应的多种目标物品标识;从而对目标图片进行标注,得到用于机器学习模型训练的模型训练数据。本申请的方案,通过对人物对应的目标物品标识进行聚类处理,而后再进行标注,通过聚类可以有效地减少人物轨迹图片中同类目标物品的数量,从而提高模型训练数据标注过程的标注效率,综合提高模型训练数据的获取效率。型训练数据的获取效率。型训练数据的获取效率。

【技术实现步骤摘要】
模型训练数据获取方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种模型训练数据获取方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着计算机技术的发展,出现了人工智能(Artificial Intelligence,AI)技术,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0003]而在使用人工智能技术时,如使用人工智能技术中的机器学习(MachineLearning,ML)技术时,需要针对需要构建的机器学习模型收集相应的模型训练数据,如对于服饰检索(识别)模型,一般需要利用服饰图片数据来作为模型训练数据,如从开源视频集合中提取出带有物品的图片数据作为模型训练数据。然而由于视频中镜头和图片帧量较大,因此对这些数据进行标注来获取模型训练数据的效率较低。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高模型训练数据获取效率的模型训练数据获取方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种模型训练数据获取方法。所述方法包括:
[0006]获取待标注的视频数据;
[0007]提取所述待标注的视频数据中同一人物对应的目标图片;
[0008]对所述目标图片进行物品检测处理,得到人物对应的目标物品标识;
[0009]对所述人物对应的目标物品标识进行聚类处理,以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合,得到所述目标图片中同一人物对应的多种目标物品标识;
[0010]根据所述目标图片中同一人物对应的多种目标物品标识对所述目标图片进行标注,得到用于机器学习模型训练的模型训练数据。
[0011]第二方面,本申请还提供了一种模型训练数据获取装置。所述装置包括:
[0012]数据获取模块,用于获取待标注的视频数据;
[0013]轨迹提取模块,用于提取所述待标注的视频数据中同一人物对应的目标图片;
[0014]目标物品检测模块,用于对所述目标图片进行物品检测处理,得到人物对应的目标物品标识;
[0015]聚类处理模块,用于对所述人物对应的目标物品标识进行聚类处理,以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合,得到所述目标图片中同一
人物对应的多种目标物品标识;
[0016]数据标注模块,用于根据所述目标图片中同一人物对应的多种目标物品标识对所述目标图片进行标注,得到用于机器学习模型训练的模型训练数据。
[0017]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0018]获取待标注的视频数据;
[0019]提取所述待标注的视频数据中同一人物对应的目标图片;
[0020]对所述目标图片进行物品检测处理,得到人物对应的目标物品标识;
[0021]对所述人物对应的目标物品标识进行聚类处理,以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合,得到所述目标图片中同一人物对应的多种目标物品标识;
[0022]根据所述目标图片中同一人物对应的多种目标物品标识对所述目标图片进行标注,得到用于机器学习模型训练的模型训练数据。
[0023]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0024]获取待标注的视频数据;
[0025]提取所述待标注的视频数据中同一人物对应的目标图片;
[0026]对所述目标图片进行物品检测处理,得到人物对应的目标物品标识;
[0027]对所述人物对应的目标物品标识进行聚类处理,以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合,得到所述目标图片中同一人物对应的多种目标物品标识;
[0028]根据所述目标图片中同一人物对应的多种目标物品标识对所述目标图片进行标注,得到用于机器学习模型训练的模型训练数据。
[0029]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0030]获取待标注的视频数据;
[0031]提取所述待标注的视频数据中同一人物对应的目标图片;
[0032]对所述目标图片进行物品检测处理,得到人物对应的目标物品标识;
[0033]对所述人物对应的目标物品标识进行聚类处理,以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合,得到所述目标图片中同一人物对应的多种目标物品标识;
[0034]根据所述目标图片中同一人物对应的多种目标物品标识对所述目标图片进行标注,得到用于机器学习模型训练的模型训练数据。
[0035]上述模型训练数据获取方法、装置、计算机设备、存储介质和计算机程序产品,通过获取待标注的视频数据;提取待标注的视频数据中同一人物对应的目标图片;而后对目标图片进行物品检测处理,得到人物对应的目标物品标识;对人物对应的目标物品标识进行聚类处理,以将人物对应的目标物品标识中相似度满足相似条件的物品标识聚合,得到目标图片中同一人物对应的多种目标物品标识;根据目标图片中同一人物对应的多种目标物品标识对目标图片进行标注,得到用于机器学习模型训练的模型训练数据。本申请的方
案,在需要从视频数据中提取出与人物结合的目标物品相关的模型训练数据时,可以先从视频数据中提取出包含同一人物的目标图片,并通过检测获取其中人物对应的目标物品标识,而后对人物对应的目标物品标识进行聚类处理,而后再进行标注,通过聚类可以有效地减少人物轨迹图片中同类目标物品的数量,从而提高模型训练数据标注过程的标注效率,综合提高模型训练数据的获取效率。
附图说明
[0036]图1为一个实施例中模型训练数据获取方法的应用环境图;
[0037]图2为一个实施例中模型训练数据获取方法的流程示意图;
[0038]图3为一个实施例中对待标注的视频数据进行切分步骤的流程示意图;
[0039]图4为一个实施例中通过人脸识别进行人物轨迹追踪步骤的流程示意图;
[0040]图5为一个实施例中人脸识别处理后得到的人物轨迹图片示例图;
[0041]图6为另一个实施例中人脸识别处理后得到的人物轨迹图片示例图;
[0042]图7为一个实施例中对人物对应的目标物品标识进行聚类处理步骤的流程示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练数据获取方法,其特征在于,所述方法包括:获取待标注的视频数据;提取所述待标注的视频数据中同一人物对应的目标图片;对所述目标图片进行物品检测处理,得到人物对应的目标物品标识;对所述人物对应的目标物品标识进行聚类处理,以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合,得到所述目标图片中同一人物对应的多种目标物品标识;根据所述目标图片中同一人物对应的多种目标物品标识对所述目标图片进行标注,得到用于机器学习模型训练的模型训练数据。2.根据权利要求1所述的方法,其特征在于,所述提取所述未标注的视频数据中同一人物对应的目标图片包括:对所述待标注的视频数据进行镜头切分处理,得到切分视频数据;对所述切分视频数据中的同一人物进行人物识别处理,得到所述同一人物对应的目标图片。3.根据权利要求2所述的方法,其特征在于,所述对所述切分视频数据中的同一人物进行人物识别处理,得到所述同一人物对应的目标图片包括:识别所述切分视频数据中包含人脸的人脸视频帧;对所述人脸视频帧进行人脸识别处理,得到相同人脸对应的人脸视频帧;将所述相同人脸对应的人脸视频帧,作为所述同一人物对应的目标图片。4.根据权利要求1所述的方法,其特征在于,所述对所述人物对应的目标物品标识进行聚类处理,以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合,得到所述目标图片中同一人物对应的多种目标物品标识包括:通过多模型投票法对所述人物对应的目标物品标识进行聚类处理,以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合,得到所述目标图片中同一人物对应的多种目标物品标识。5.根据权利要求4所述的方法,其特征在于,所述通过多模型投票法对所述人物对应的目标物品标识进行聚类处理,以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合,得到所述目标图片中同一人物对应的多种目标物品标识包括:通过不同的预设特征提取模型对包含所述目标物品标识的目标图片进行特征提取处理,得到基础物品特征;将所述不同的预设特征提取模型提取得到的基础物品特征进行拼接处理,获取目标物品特征;基于所述目标物品特征对所述人物对应的目标物品标识进行聚类处理,以将所述人物对应的目标物品标识中相似度满足相似条件的物品标识聚合,得到所述目标图片中同一人物对应的多种目标物品标识。6.根据权利要求5所述的方法,其特征在于,所述预设特征提取模型包括第一特征提取模型、第二特征提取模型、第三特征提取模型以及第四特征提取模型;所述通过不同的预设特征提取模型对包含所述目标物品标识的目标图片进行特征提取处理,得到基础物品特征之前,还包括:
通过预设第一算法与预设第三...

【专利技术属性】
技术研发人员:高树会曲直裴唯一
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1