【技术实现步骤摘要】
人群视频图像中行人图像属性的精确标注方法及系统
本专利技术涉及图像处理技术,具体为人群视频图像中行人图像属性的精确标注方法及系统。
技术介绍
行人图像属性主要包括性别、年龄、是否戴眼镜、随身携带物品(比如背包、挎包、手提包、行李箱、打伞等)类型和颜色、衣着颜色和样式等。随着大数据、云计算技术的发展,行人图像属性识别技术广泛应用于视频图像结构化检索、大数据分析、视频治安防控、图侦破案等。因此,对行人图像属性的资源和结构化描述信息的需求是海量的。目前,对视频图像的行人图像属性的识别多采用机器学习的方法,需要先进行大量的、精确的行人图像属性标注,生成训练样本数据用于模型的训练和优化。随着大数据、深度学习技术的发展,多目标行人图像属性识别的技术也逐渐转向深度学习。深度学习的网络模型训练需要大量、高质量的行人图像属性标注数据,而这些属性标注数据目前大多采用人工手动标注。人工手动标注数据存在以下的缺点:1)标注工作量大、效率低,特别是针对视频的行人图像属性标注,如果每一帧图像都采用人工手动标注,需要标注的数据更是海量;2)采用人工标注的行人图像属性存在一定的主观性、不一致性, ...
【技术保护点】
1.人群视频图像中行人图像属性的精确标注方法,其特征在于,包括以下步骤:S1、对视频数据的每一帧图像进行行人目标定位,得到行人粗略位置和相应的置信度信息,利用行人目标的位置信息、行人目标位置结果置信度和行人目标的唯一性标识号表示行人目标的检测位置信息;S2、根据行人目标位置结果置信度,进行行人位置的向外扩展,得到行人目标的扩大位置信息;S3、利用基于深度学习的语义分割模型,对向外扩展后得到的行人位置区域进行图像分割,得到行人目标与背景的各分割目标图像层;S4、根据行人目标的位置信息,以行人目标的扩大位置的最大值为中心位置,行人位置宽高的λ倍为宽高确定行人目标区域搜索窗口,并 ...
【技术特征摘要】
1.人群视频图像中行人图像属性的精确标注方法,其特征在于,包括以下步骤:S1、对视频数据的每一帧图像进行行人目标定位,得到行人粗略位置和相应的置信度信息,利用行人目标的位置信息、行人目标位置结果置信度和行人目标的唯一性标识号表示行人目标的检测位置信息;S2、根据行人目标位置结果置信度,进行行人位置的向外扩展,得到行人目标的扩大位置信息;S3、利用基于深度学习的语义分割模型,对向外扩展后得到的行人位置区域进行图像分割,得到行人目标与背景的各分割目标图像层;S4、根据行人目标的位置信息,以行人目标的扩大位置的最大值为中心位置,行人位置宽高的λ倍为宽高确定行人目标区域搜索窗口,并统计搜索窗口内各分割目标图像层的像素个数总和,则像素个数总和最大的分割目标图像层确定为行人目标图像层;S5、根据行人目标图像层,确定行人目标区域的最小矩形框,完成行人位置框的精确定位,得到行人目标的精确位置。2.根据权利要求1所述的精确标注方法,其特征在于,步骤S2进行行人位置的向外扩展时,行人位置的扩大数值根据行人目标位置结果置信度进行计算;行人目标位置结果置信度越大,行人位置的扩大数值就越小。3.根据权利要求2所述的精确标注方法,其特征在于,行人位置的扩大数值δx、δy的取值范围分别在和δx、δy的计算公式如下:其中行人目标位置结果置信度confi∈(0.5,1)。4.根据权利要求1所述的精确标注方法,其特征在于,步骤S4所述λ的取值范围为:0.2﹤λ﹤0.6。5.根据权利要求1所述的精确标注方法,其特征在于,步骤S3采用RACSIS语义分割方法,把行人位置扩展后的图片区域作为输入,通过改进空间维度上的金字塔空洞池化结构的方法,得到行人目标与背景的各分割目标图像层。6.根据权利要求3所述的精确标注方法,其特征在于,步骤S4中行人目标图像层的确定及各分割目标图像层的像素个数统计方法如下:1)以中心位置为起始点,标记该起始点所在的图像层为第一图层,并记录起始点的像素值为(r1,g1,b1),像素和为1,记为sum(ri,gi,bi)=1,i为图层标记号;2)采用回字形的搜索路径,分别取右、右下、下、左下、左、左上、上、右上各8个邻域点的像素值与起始点的像素值进行比较,相同则跟随起始点,并标记相应的邻域点所在的图像层为第一图层,像素和sum(ri,gi,bi)加1,否则标记相应的邻域点所在的图像层为新的图层,图层标记号为i+1,像素和sum(ri+1...
【专利技术属性】
技术研发人员:潘新生,梁添才,金晓峰,赵清利,徐天适,
申请(专利权)人:广州广电银通金融电子科技有限公司,广州广电运通金融电子股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。