【技术实现步骤摘要】
一种行人属性识别中的图像数据均衡方法
[0001]本专利技术属于计算机视觉及行人属性识别
,具体涉及一种行人属性识别中的图像数据均衡方法。
技术介绍
[0002]作为计算机视觉领域的重要研究内容之一,行人属性识别是对视频图片中的行人目标的外观属性,如上衣颜色、裤子颜色、是否带帽子、是否带眼镜等进行识别。行人属性信息是行人的高层语义信息,将行人属性信息集成到行人检测、行人重识别等任务中,可以获得更好的性能,为智能视频分析提供重要支撑。
[0003]现有的行人属性识别技术中,常用的数据集包括PETA,RAP,PA
‑
100K等,表现SOTA的算法主要包括ALM,Strong BaseLine等。由于行人属性包含种类较多,且诸如年龄属性中幼儿数据,颜色属性中银色、紫色等属性数据较难采集,现有的数据集存在属性分布不均衡的问题,因此,当采用基于深度学习的行人属性识别算法时,由于数据集属性分布不均衡,导致行人属性识别准确率差异较大。
[0004]因此,数据分布不均衡问题,是行人属性识别领域亟待解决 ...
【技术保护点】
【技术特征摘要】
1.一种行人属性识别中的图像数据均衡方法,其特征在于,包括以下步骤:步骤1,预定义m种行人属性,对m种行人属性的出现概率进行统计,按出现概率由低到高的顺序,对m种行人属性进行排序,由此形成行人属性集合S=[s1,s2,...,s
m
];其中,s1,s2,...,s
m
分别代表一种行人属性,m代表行人属性的数量;定义稀有属性阈值集合Y=[y1,y2,...,y
m
];其中,y1代表行人属性s1的稀有属性阈值,y2代表行人属性s2的稀有属性阈值,...,y
m
代表行人属性s
m
的稀有属性阈值;其中,y1,y2,...,y
m
按从小到大的顺序排列;步骤2,选择w张图片,由此形成图片集合U=[u1,u2,...,u
w
],其中,u1,u2,...,u
w
分别代表一张图片;步骤3,对于图片集合U中的每张图片,表示为:u
i
,i=1,2,...,w,均对其m种行人属性s1,s2,...,s
m
的属性正负性进行标注,形成图片u
i
的图片标签S
i
=[s
i1
,s
i2
,...,s
im
];其中,s
i1
代表图片u
i
的行人属性s1的属性正负性,即:如果图片u
i
符合行人属性s1,则s
i1
为正,相反,s
i1
为负;s
i2
代表图片u
i
的行人属性s2的属性正负性,...,s
im
代表图片u
i
的行人属性s
m
的属性正负性;步骤4,对图片集合U中的每张图片完成行人属性正负性标注后,在图片集合U中,统计每种行人属性的分布比例,进而判断每种行人属性是否为稀有属性;具体的,对于行人属性集合S=[s1,s2,...,s
m
]中的每种行人属性,表示为s
j
,j=1,2,...,m,采用以下方法判断其是否为稀有属性:步骤4.1,在图片集合U中,统计行人属性s
j
为正的图片数量,为n
j
;采用下式,计算得到行人属性s
j
的正样本数量比例ρ
j
:ρ
j
=n
j
/w步骤4.2,比较比例ρ
j
和行人属性s
j
的稀有属性阈值y
j
;如果ρ
j
小于y
j
,则认为行人属性s
j
为稀有属性;否则,认为行人属性s
j
为非稀有属性;步骤5,如果行人属性s
j
为稀有属性,则采用下式,计算得到增强次数d
j
:d
j
=y
j
/ρ
j
步骤6,由此得到稀有属性集合V0;其中,稀有属性集合并且,得到稀有属性集合中每种稀有属性的增强次数,形成稀有属性增强次数表;步骤7,预建立初始为空的训练集train_set和初始为空的测试集test_set;步骤8,以图片集合U为原始的图片,采用...
【专利技术属性】
技术研发人员:李晋军,瞿洪桂,孙家乐,高云丽,
申请(专利权)人:北京中电兴发科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。