一种对人体属性数据进行处理的方法及设备技术

技术编号:27477209 阅读:9 留言:0更新日期:2021-03-02 17:46
本申请的目的是提供一种对人体属性数据进行处理的方法及设备,本申请通过人体检测模型从获取到的图片中获取人体框信息,基于所述人体框信息进行抠图,得到抠图图片;对所述抠图图片进行特征提取,通过聚类算法得到不同行人标识的聚类簇,其中,所述聚类簇包括一簇标注图片;从每个聚类簇中选取类别中心的标注图片以及按照预设比例选取剩余标注图片,得到目标标注图片;选取预设的数据清洗方式对所述目标标注图片进行清洗,得到清洗后的人体属性数据。从而通过对图片进行特征提取然后过滤掉相似度高的图片,在保证数据信息量的同时降低了标注成本,此外对标注的数据进行清洗,进一步提升标注数据的准确率。提升标注数据的准确率。提升标注数据的准确率。

【技术实现步骤摘要】
一种对人体属性数据进行处理的方法及设备


[0001]本申请涉及计算机领域,尤其涉及一种对人体属性数据进行处理的方法及设备。

技术介绍

[0002]行人属性识别由于其在现实世界中的巨大潜力而受到越来越多的关注,例如行人检索和行人重新识别等。现实场景中的数据基本都是通过摄像头采集的视频,后续通过抽帧获得图片。在图片的数量比较大的时候,如何高效地标注这些图片对于人体属性识别的模型迭代至关重要。此外标注的准确率不是百分百的,这时候就需要对标注的数据进行清洗,纠正标注的错误属性。现有的人体属性标注往往都是先标注人体框再标注属性,或者先通过人体检测模型输出检测框抠出人体图片然后标注人体属性,但是很少对标注的数据进行清洗。
[0003]目前的人体属性数据大多都是摄像头获取的视频,需要抽帧之后再处理,但是抽帧之后会存在大量重复后者变化很小的相似图片,不可避免提高了标注成本;数据标注往往都是先标注人体框再标注属性,或者先通过人体检测模型获取检测框并抠出人体图片然后标注人体属性,前者由于标注检测框会降低标注速度,后者则受限于人体检测模型的准确度,然而实际场景比较复杂,人体检测模型的效果很难保证。

技术实现思路

[0004]本申请的一个目的是提供一种对人体属性数据进行处理的方法及设备,解决现有技术中标注成本高、标注速度慢以及受限于人体检测模型的准确度的问题。
[0005]根据本申请的一个方面,提供了一种对人体属性数据进行处理的方法,该方法包括:
[0006]通过人体检测模型从获取到的图片中获取人体框信息,基于所述人体框信息进行抠图,得到抠图图片;
[0007]对所述抠图图片进行特征提取,通过聚类算法得到不同行人标识的聚类簇,其中,所述聚类簇包括一簇标注图片;
[0008]从每个聚类簇中选取类别中心的标注图片以及按照预设比例选取剩余标注图片,得到目标标注图片;
[0009]选取预设的数据清洗方式对所述目标标注图片进行清洗,得到清洗后的人体属性数据。
[0010]进一步地,通过人体检测模型从获取到的图片中获取人体框信息之前,包括:
[0011]对通过摄像头获取到的视频进行间隔抽帧后得到至少一张图片。
[0012]进一步地,对所述抠图图片进行特征提取,通过聚类算法得到不同行人标识的聚类簇,包括:
[0013]通过人体重识别模型对所述抠图图片进行特征提取,输出特征图;
[0014]通过聚类算法对所述特征图进行聚类,得到不同行人标识的聚类簇。
[0015]进一步地,选取预设的数据清洗方式对所述目标标注图片进行清洗,包括:
[0016]选取数据可视化清洗方式对所述目标标注图片进行清洗,其中,所述数据可视化清洗方式包括:
[0017]将所述目标标注图片按照属性标签分别放入至对应的属性文件夹中;
[0018]建立第一结果文件夹和第二结果文件夹,分别遍历每个属性文件夹中含有的图片,判断遍历到的图片中的属性与当前遍历的属性是否一致;
[0019]若所述图片中的属性无法判断,则将所述图片放入至所述第一结果文件中,若所述图片中的属性与当前遍历的属性不一致,则将所述图片放入至所述第二结果文件中。
[0020]进一步地,选取预设的数据清洗方式对所述目标标注图片进行清洗,包括:
[0021]选取互斥清洗方式对所述目标标注图片进行清洗,其中,所述互斥清洗方式包括:
[0022]对所述目标标注图片的每一属性进行赋值,得到属性值;
[0023]遍历采集到的目标标注图片的标签,根据所述标签对每个互斥的属性类别对应的属性值进行统计;
[0024]根据统计结果从所述目标标注图片中选取待重新标注图片,对所述待重新标注图片进行重新标注。
[0025]进一步地,选取预设的数据清洗方式对所述目标标注图片进行清洗,包括:
[0026]选取人体关键点清洗方式对所述目标标注图片进行清洗,其中,所述人体关键点清洗方式包括:
[0027]通过人体关键点模型检测所述目标标注图片中人体及对应的关键点位置;
[0028]根据检测到的关键点位置过滤所述目标标注图片,得到清洗后的目标标注图片。
[0029]进一步地,选取预设的数据清洗方式对所述目标标注图片进行清洗,包括:
[0030]选取使用人体属性模型的清洗方式对所述目标标注图片进行清洗,其中,所述人体属性模型的清洗方式包括:
[0031]对所述目标标注图片的每一属性进行赋值,得到标注的属性值;
[0032]根据所述人体属性模型判断所述目标标注图片的输出属性;
[0033]比较所述输出属性和标注的属性值,将比较结果所对应的目标标注图片放入至对应的新建的结果文件夹中。
[0034]进一步地,选取预设的数据清洗方式对所述目标标注图片进行清洗,包括:
[0035]选取跨域清洗方式对所述目标标注图片进行清洗,其中,所述跨域清洗方式包括:
[0036]确定所述目标标注图片中属于购买数据的图片,将所述属于购买数据的图片作为初测试集;
[0037]对所述初测试集进行指标质量的测试,根据测试结果清洗所述初测试集中的图片。
[0038]根据本申请又一个方面,还提供了一种对人体属性数据进行处理的设备,所述设备包括:
[0039]一个或多个处理器;以及
[0040]存储有计算机可读指令的存储器,所述计算机可读指令在被执行时使所述处理器执行如前述所述方法的操作。
[0041]根据本申请再一个方面,还提供了一种计算机可读介质,其上存储有计算机可读
media),如调制的数据信号和载波。
[0055]图1示出根据本申请的一个方面提供的一种对人体属性数据进行处理的方法流程示意图,该方法包括:步骤S11~步骤S14,
[0056]在步骤S11中,通过人体检测模型从获取到的图片中获取人体框信息,基于所述人体框信息进行抠图,得到抠图图片;在此,人体检测模型用来检测图片中的人体,输入一张图片后输出图片中所有人体的坐标框信息,从而通过人体检测模型可得到图片中人体框信息,可使用的人体检测模型包括不限于Faster RCNN,Retinanet,Yolov3等。对得到的人体框信息进行抠图,得到抠出人体框图片,即标注图片,如图2所示在大图中截取出人体框图片,得到小图即为抠图图片。
[0057]在步骤S12中,对所述抠图图片进行特征提取,通过聚类算法得到不同行人标识的聚类簇,其中,所述聚类簇包括一簇标注图片;在此,对得到的抠图图片进行特征提取,该特征提取是指人体属性信息的特征提取,用于后续聚类算法得到不同行人标识的聚类簇,可使用DBSCAN密度聚类算法聚类;比如对抠图图片进行行人重识别提取,提取出行人的眼睛是大眼睛还是小眼睛,所穿衣服的颜色和类型等特征,得到所有抠出图片的特征,把特征相似的放到一起,就构成一个簇,每个不同的行人都有不同的标识(id),因此,聚类簇为一簇图片,每一簇里面的图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对人体属性数据进行处理的方法,其特征在于,所述方法包括:通过人体检测模型从获取到的图片中获取人体框信息,基于所述人体框信息进行抠图,得到抠图图片;对所述抠图图片进行特征提取,通过聚类算法得到不同行人标识的聚类簇,其中,所述聚类簇包括一簇标注图片;从每个聚类簇中选取类别中心的标注图片以及按照预设比例选取剩余标注图片,得到目标标注图片;选取预设的数据清洗方式对所述目标标注图片进行清洗,得到清洗后的人体属性数据。2.根据权利要求1所述的方法,其特征在于,通过人体检测模型从获取到的图片中获取人体框信息之前,包括:对通过摄像头获取到的视频进行间隔抽帧后得到至少一张图片。3.根据权利要求1所述的方法,其特征在于,对所述抠图图片进行特征提取,通过聚类算法得到不同行人标识的聚类簇,包括:通过人体重识别模型对所述抠图图片进行特征提取,输出特征图;通过聚类算法对所述特征图进行聚类,得到不同行人标识的聚类簇。4.根据权利要求1所述的方法,其特征在于,选取预设的数据清洗方式对所述目标标注图片进行清洗,包括:选取数据可视化清洗方式对所述目标标注图片进行清洗,其中,所述数据可视化清洗方式包括:将所述目标标注图片按照属性标签分别放入至对应的属性文件夹中;建立第一结果文件夹和第二结果文件夹,分别遍历每个属性文件夹中含有的图片,判断遍历到的图片中的属性与当前遍历的属性是否一致;若所述图片中的属性无法判断,则将所述图片放入至所述第一结果文件中,若所述图片中的属性与当前遍历的属性不一致,则将所述图片放入至所述第二结果文件中。5.根据权利要求1所述的方法,其特征在于,选取预设的数据清洗方式对所述目标标注图片进行清洗,包括:选取互斥清洗方式对所述目标标注图片进行清洗,其中,所述互斥清洗方式包括:对所述目标标注图片的每一属性进行赋值,得到属性值;遍历采集到的...

【专利技术属性】
技术研发人员:蔡涛段魁陈新泽黄冠都大龙
申请(专利权)人:上海芯翌智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1