一种用于对目标对象的属性特征进行识别的方法及装置制造方法及图纸

技术编号:20390369 阅读:34 留言:0更新日期:2019-02-20 03:02
本发明专利技术公开了一种用于对目标对象的属性特征进行识别的方法、装置、系统以及计算机程序产品,其中方法包括:将所获取的包含不同属性特征标签的图像数据集作为深度卷积神经网络的训练数据;使用所述训练数据对所述深度卷积神经网络进行训练;在对所述深度卷积神经网络进行训练的过程中,根据所述训练数据的多个属性特征的正样本和负样本的比值来动态调整所述损失函数;以及对待检测的视频流数据进行解码和图像选取,使用经过训练的深度卷积神经网络对所述待识别的目标对象的属性特征进行识别,输出所述待识别的目标对象的多个属性特征。

【技术实现步骤摘要】
一种用于对目标对象的属性特征进行识别的方法及装置
本申请涉及信息处理领域,并且具体的涉及一种用于对目标对象的属性特征进行识别的方法、装置、系统以及计算机程序产品。
技术介绍
视频监控被广泛应用于各种领域,在智能交通、银行、平安城市、公共安全等行业中有着重要的作用,为人类生活的多个方面带来了方便和保障,但同时,海量的视频监控流使得有效信息的快速搜索变得十分困难,需耗费大量的人力物力。对目标对象的属性特征进行有效的识别,不仅能提高视频监控人员的工作效率,对视频的检索、目标对象行为解析等也具有重要意义。目标对象的属性识别的难点主要在于,在目标对象的属性特征的正负样本的比值严重失调的情况下,损失函数使用固定的正负样本的比值,导致识别准确率低的问题。
技术实现思路
本申请提供的用于对目标对象的属性特征进行识别的方法,解决了识别过程中,在目标对象的属性特征的正负样本的比值严重失调的情况下,损失函数使用固定的正负样本的比值,导致识别准确率低的问题。本申请提供一种用于对目标对象的属性特征进行识别的方法,其特征在于,包括:将所获取的包含不同属性特征标签的图像数据集作为深度卷积神经网络的训练数据;使用所述训练数据对所述深度卷积神经网络进行训练,根据所述训练数据的多个属性特征的正样本和负样本的比值来动态调整所述损失函数,使得所述训练数据的多个属性特征的损失函数的加权和达到最小化状态或收敛状态;获得包括待识别的目标对象的图像数据,使用经过训练的深度卷积神经网络对所述待识别的目标对象的属性特征进行识别,输出所述待识别的目标对象的多个属性特征。优选的,其中所述目标对象为行人,并且所述所获取的包含不同属性特征标签的图像数据集包括:行人的图像数据;以及行人的不同属性特征标签。优选的,所述行人的不同属性特征标签包括:性别、是否带帽子、是否戴眼镜、是否背单肩包、是否背双肩包、是否拎手提包、是否拿东西、以及是否打电话。优选的,所述使用所述训练数据对所述深度卷积神经网络进行训练,包括:根据预先设置的尺寸并使用归一化方法对所述训练数据进行处理,以将图像数据集中的所有图像数据转换为相同尺寸的图像数据;使用所述相同尺寸的图像数据对深度卷积神经网络进行训练。优选的,当所述训练数据的多个属性特征的损失函数的加权和达到最小化状态或收敛状态时,能够缩小输出值与真实值之间的差距。优选的,其中根据所述训练数据的多个属性特征的正样本和负样本的比值来动态调整所述损失函数,包括:动态损失函数为:当正样本的数量与负样本的数量的比值小于1:3时:当正样本数量与负样本的数量的比值大于3时:当正样本数据与负样本的数量的比值是除上述两个比值之外的比值时:wl=1其中,E是整个网络的总的损失函数,是样本,xi是属性l的置信度,yil表征样本xi是否具有属性l的真实标签,n表示样本数,wl是计算损失函数时所使用的权重,表示属性l的正样本数目,表示属性l的负样本数目,a∈(0,1],每次迭代时随机获取。优选的,所述获得包括待识别的目标对象的图像数据,包括:对视频流数据进行解码以获得视频数据,按照预定帧率从所述视频数据中选择多个图像数据,从多个图像数据选择包含不同属性特征的待识别的目标对象的图像数据。优选的,所述使用经过训练的深度卷积神经网络对所述待识别的目标对象的属性特征进行识别,包括:将所述待识别的目标对象经过所述深度卷积神经网络的输入层、卷积层、池化层和全连接层对所述属性特征进行识别。优选的,还包括,确定所述深度卷积神经网络的参数信息,具体为:确定所述卷积层的个数、每个卷积层的卷积核大小、所述池化层的个数、每个池化层的大小、所述全连接层的个数以及每个全连接层的大小。优选的,所述输出所述待识别的目标对象的多个属性特征,包括:将所述识别的行人图像数据的性别、是否带帽子、是否戴眼镜、是否背单肩包、是否背双肩包、是否拎手提包、是否拿东西、以及是否打电话的多个不同属性特征,在所述深度卷积神经网络的输出层进行输出。本申请同时提供一种计算机程序产品,其包括处理器可执行的程序,其特征在于,该程序被处理器执行时实现以下步骤:将所获取的包含不同属性特征标签的图像数据集作为深度卷积神经网络的训练数据;使用所述训练数据对所述深度卷积神经网络进行训练,根据所述训练数据的多个属性特征的正样本和负样本的比值来动态调整所述损失函数,使得所述训练数据的多个属性特征的损失函数的加权和达到最小化状态或收敛状态;获得包括待识别的目标对象的图像数据,使用经过训练的深度卷积神经网络对所述待识别的目标对象的属性特征进行识别,输出所述待识别的目标对象的多个属性特征。本申请同时提供一种用于对目标对象的属性特征进行识别的系统,其特征在于,所述系统包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:执行权利要求1-6任意一项所述的方法。本申请同时提供一种用于对目标对象的属性特征进行识别的装置,所述装置包括:训练数据获取单元,用于将所获取的包含不同属性特征标签的图像数据集作为深度卷积神经网络的训练数据;训练单元,用于使用所述训练数据对所述深度卷积神经网络进行训练,根据所述训练数据的多个属性特征的正样本和负样本的比值来动态调整所述损失函数,使得所述训练数据的多个属性特征的损失函数的加权和达到最小化状态或收敛状态;输出单元,用于获得包括待识别的目标对象的图像数据,使用经过训练的深度卷积神经网络对所述待识别的目标对象的属性特征进行识别,输出所述待识别的目标对象的多个属性特征。优选的,其中所述目标对象为行人,并且所述训练数据获取单元,包括:获取子单元,用于获取行人的图像数据;标签获取子单元,用于获取行人的图像数据。优选的,所述标签获取子单元,包括:标签特征单元,用于获取所述行人的不同属性特征标签,其中所述行人的不同属性特征标签包括:性别、是否带帽子、是否戴眼镜、是否背单肩包、是否背双肩包、是否拎手提包、是否拿东西、以及是否打电话。优选的,所述训练单元,包括:预处理子单元,用于将所述训练数据进行预处理,以将图像数据集中的所有图像数据转换为相同尺寸的图像数据;以及训练子单元,用于使用所述相同尺寸的图像数据对深度卷积神经网络进行训练。优选的,所述预处理子单元,包括:方法处理子单元,用于将所述训练数据根据预先设置的尺寸使用归一化方法进行处理,获取相同尺寸的图像数据。优选的,所述训练单元,还包括:设计子单元,用于对动态的损失函数loss设计如下:当正样本的数量与负样本的数量的比值小于1:3时:当正样本数量与负样本的数量的比值大于3时:当正样本数据与负样本的数量的比值是除上述两个比值之外的比值时:wl=1其中,E是整个网络的总的损失函数,是样本,xi是属性l的置信度,yil表征样本xi是否具有属性l的真实标签,n表示样本数,wl是计算损失函数时所使用的权重,表示属性l的正样本数目,表示属性l的负样本数目,a∈(0,1],每次迭代时随机获取。优选的,所述输出单元,还包括:识别子单元,用于将所述待识别的目标对象经过所述深度卷积神经网络的输入层、卷积层、池化层和全连接层对所述属性特征进行识别。优选的,所述识别子单元,还包括:确定子单元,用于确定所述卷积层的个数、每个卷积层的卷积核大小、所述池化层的个数、每个池化层的大小、所述本文档来自技高网...

【技术保护点】
1.一种用于对目标对象的属性特征进行识别的方法,其特征在于,包括:将所获取的包含不同属性特征标签的图像数据集作为深度卷积神经网络的训练数据;使用所述训练数据对所述深度卷积神经网络进行训练,根据所述训练数据的多个属性特征的正样本和负样本的比值来动态调整所述损失函数,使得所述训练数据的多个属性特征的损失函数的加权和达到最小化状态或收敛状态;获得包括待识别的目标对象的图像数据,使用经过训练的深度卷积神经网络对所述待识别的目标对象的属性特征进行识别,输出所述待识别的目标对象的多个属性特征。

【技术特征摘要】
1.一种用于对目标对象的属性特征进行识别的方法,其特征在于,包括:将所获取的包含不同属性特征标签的图像数据集作为深度卷积神经网络的训练数据;使用所述训练数据对所述深度卷积神经网络进行训练,根据所述训练数据的多个属性特征的正样本和负样本的比值来动态调整所述损失函数,使得所述训练数据的多个属性特征的损失函数的加权和达到最小化状态或收敛状态;获得包括待识别的目标对象的图像数据,使用经过训练的深度卷积神经网络对所述待识别的目标对象的属性特征进行识别,输出所述待识别的目标对象的多个属性特征。2.根据权利要求1所述的方法,其特征在于,其中所述目标对象为行人,并且所述所获取的包含不同属性特征标签的图像数据集包括:行人的图像数据;以及行人的不同属性特征标签。3.根据权利要求2所述的方法,其特征在于,所述行人的不同属性特征标签包括:性别、是否带帽子、是否戴眼镜、是否背单肩包、是否背双肩包、是否拎手提包、是否拿东西、以及是否打电话;其中输出所述待识别的目标对象的多个属性特征,包括:将所述识别的行人图像数据的性别、是否带帽子、是否戴眼镜、是否背单肩包、是否背双肩包、是否拎手提包、是否拿东西、以及是否打电话的多个不同属性特征,在所述深度卷积神经网络的输出层进行输出。4.根据权利要求1所述的方法,其特征在于,所述使用所述训练数据对所述深度卷积神经网络进行训练,包括:根据预先设置的尺寸并使用归一化方法对所述训练数据进行处理,以将图像数据集中的所有图像数据转换为相同尺寸的图像数据;使用所述相同尺寸的图像数据对深度卷积神经网络进行训练。5.根据权利要求1所述的方法,其特征在于,其中根据所述训练数据的多个属性特征的正样本和负样本的比值来动态调整所述损失函数,包括:动态损失函数为:当正样本的数量与负样本的数量的比值小于1:3时:当正样本数量与负样本的数量的比值大于3时:当正样本数据与负样本的数量的比值是除上述两个比值之外的比值时:wl=1其中,E是整个网络的总的损失函数,是样本,xi是属性l的置信度,yil表征样本xi是否具有属性l的真实标签,n表示样本数,wl是计算损失函数时所使用的权重,表示属性l的正样本数目,表示属性l的负样本数目,a∈(0,1],每次迭代时随机获取。6.根据权利要求1所述的方法,其特征在于,所述获得包...

【专利技术属性】
技术研发人员:邹博李昕冯莹莹潘自兴孙登蕊
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1