目标对象识别方法、装置和电子系统制造方法及图纸

技术编号:27492344 阅读:22 留言:0更新日期:2021-03-02 18:11
本发明专利技术提供了一种目标对象识别方法、装置和电子系统,涉及图像处理技术领域,该方法包括:获取待识别的视频帧序列中同一目标对象的检测框集合和检测框集合中每个检测框的图像质量分值;基于每个检测框的图像质量分值,从检测框集合中选择第一检测框和第二检测框;基于第一检测框的第一检索特征向量、第一检测框的第一跟踪特征向量和第二检测框的第二跟踪特征向量确定第二检测框的第二检索特征向量;融合第一检索特征向量和第二检索特征向量,得到同一目标对象的最优特征向量;基于最优特征向量和预存的目标对象底库确定同一目标对象的识别结果。本发明专利技术缓解了CNN网络提取到的特征泛化能力较差的问题,提升目标对象的检索准确率。确率。确率。

【技术实现步骤摘要】
目标对象识别方法、装置和电子系统


[0001]本专利技术涉及图像处理
,尤其是涉及一种目标对象识别方法、装置和电子系统。

技术介绍

[0002]行人重识别(ReID)技术,可应用于视频结构化,该技术在安防、智能交通等领域应用广泛。目前现有的行人ReID技术,通常采用以下方式进行行人检索:应用检测模型检测行人所在的位置,然后行人检测区域的图片送入CNN网络(即卷积神经网络)提取出待检索行人的特征向量,比对待检索行人的特征向量和检索库中行人图片的特征向量,选择与待检索行人向量相似的其它向量,并按照相似度进行排序,即可获得行人检索结果。
[0003]由于同一行人图片存在不同的拍摄角度、光照情况、行驶姿态等,这些不确定因素加大了CNN网络提取图片特征的难度,使得CNN网络提取到的特征缺乏泛化能力,进而影响后续的检索排序结果,检索准确率较低。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种目标对象识别方法、装置和电子系统,以缓解CNN网络提取到的特征泛化能力较差的问题,提升目标对象的检索准确率。
[0005]为了实现上述目的,本专利技术实施例采用的技术方案如下:
[0006]第一方面,本专利技术实施例提供了一种目标对象识别方法,该方法应用于电子设备,包括:获取待识别的视频帧序列中同一目标对象的检测框集合和检测框集合中每个检测框的图像质量分值;基于每个检测框的图像质量分值,从检测框集合中选择第一检测框和第二检测框;基于第一检测框的第一检索特征向量、第一检测框的第一跟踪特征向量和第二检测框的第二跟踪特征向量确定第二检测框的第二检索特征向量;其中,第一检索特征向量的维度大于第一跟踪特征向量;第二检索特征向量的维度大于第二跟踪特征向量;融合第一检索特征向量和第二检索特征向量,得到同一目标对象的最优特征向量;基于最优特征向量和预存的目标对象底库确定同一目标对象的识别结果。
[0007]结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,其中,获取待识别的视频帧序列中同一目标对象的检测框集合和检测框集合中每个检测框的图像质量分值的步骤,包括:对待识别的视频帧序列中的视频帧进行目标对象检测,得到包含有目标对象的检测框;对每个检测框进行图像质量评分和跟踪特征向量提取,得到每个检测框的跟踪特征向量和图像质量分值;基于每个检测框的跟踪特征向量确定同一目标对象的检测框集合。
[0008]结合第一方面,本专利技术实施例提供了第一方面的第二种可能的实施方式,其中,对每个检测框进行图像质量评分和跟踪特征向量提取的步骤,包括:将每个检测框分别输入质量评分模型和第一卷积神经网络模型,得到每个检测框的图像质量评分和跟踪特征向量;其中,质量评分模型用于对输入的检测框进行图像质量评分;第一卷积神经网络模型用
于对输入的检测框进行跟踪特征向量提取。
[0009]结合第一方面,本专利技术实施例提供了第一方面的第三种可能的实施方式,其中,基于每个检测框的图像质量分值,从检测框集合中选择第一检测框和第二检测框的步骤,包括:基于每个检测框的图像质量分值大小对检测框集合中的检测框排序;基于排序选择第一检测框和第二检测框,其中,第一检测框的图像质量分值和第二检测框的图像质量分值均大于未被选中的检测框的图像质量分值。
[0010]结合第一方面,本专利技术实施例提供了第一方面的第四种可能的实施方式,其中,从检测框集合中选择第一检测框和第二检测框的步骤之后,方法还包括:将第一检测框输入第二卷积神经网络模型,得到第一检测框的第一检索特征向量;其中,第二卷积神经网络模型用于对输入的检测框进行检索特征向量提取。
[0011]结合第一方面,本专利技术实施例提供了第一方面的第五种可能的实施方式,其中,基于第一检测框的第一检索特征向量、第一检测框的第一跟踪特征向量和第二检测框的第二跟踪特征向量确定第二检测框的第二检索特征向量的步骤,包括:将第一检测框的第一检索特征向量、第一检测框的第一跟踪特征向量和第二检测框的第二跟踪特征向量输入预先训练好的特征升级网络模型,得到第二检测框的第二检索特征向量;其中,特征升级网络模型是基于标注有对象标签的图像样本训练卷积神经网络模型得到的。
[0012]结合第一方面,本专利技术实施例提供了第一方面的第六种可能的实施方式,其中,特征升级网络模型的训练过程包括:将标注有对象标签的图像样本集合分别输入第三卷积神经网络模型和第四卷积神经网络模型,得到每个对象标签对应的跟踪特征向量和检索特征向量;其中,第三卷积神经网络模型用于对输入的图像样本进行跟踪特征向量提取,第四卷积神经网络模型用于对输入的图像样本进行检索特征向量提取;基于对象标签选择两个对象的多个图像样本对,其中,每一个图像样本对包含两个不同的对象,对于每一个图像样本对,均执行以下训练操作:将每个图像样本对中的第一图像样本的检索特征向量、跟踪特征向量和第二图像样本的跟踪特征向量均输入预设的卷积神经网络模型,得到输出向量;以第二图像样本的检索特征向量作为标准向量,计算卷积神经网络模型的输出向量与标准向量的损失值;基于损失值调整卷积神经网络模型的参数,继续执行训练操作,直至损失值收敛至预设阈值,将训练好的卷积神经网络模型作为特征升级网络模型。
[0013]结合第一方面,本专利技术实施例提供了第一方面的第七种可能的实施方式,其中,融合第一检索特征向量和第二检索特征向量,得到同一目标对象的最优特征向量的步骤,包括:对第一检索特征向量和第二检索特征向量进行均值融合,得到同一目标对象的最优特征向量。
[0014]第二方面,本专利技术实施例提供一种目标对象识别装置,该装置应用于电子设备,包括:获取模块,用于获取待识别的视频帧序列中同一目标对象的检测框集合和检测框集合中每个检测框的图像质量分值;检测框选择模块,用于基于每个检测框的图像质量分值,从检测框集合中选择第一检测框和第二检测框;向量确定模块,用于基于第一检测框的第一检索特征向量、第一检测框的第一跟踪特征向量和第二检测框的第二跟踪特征向量确定第二检测框的第二检索特征向量;其中,第一检索特征向量的维度大于第一跟踪特征向量;第二检索特征向量的维度大于第二跟踪特征向量;特征融合模块,用于融合第一检索特征向量和第二检索特征向量,得到同一目标对象的最优特征向量;识别模块,用于基于最优特征
向量和预存的目标对象底库确定同一目标对象的识别结果。
[0015]第三方面,本专利技术实施例提供一种电子系统,包括:图像采集设备、处理设备和存储装置。图像采集设备,用于获取待识别的视频帧序列;存储装置上存储有计算机程序,计算机程序在被处理设备运行时执行如前述实施例中任一项所述的目标对象识别方法。
[0016]第四方面,本专利技术实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理设备运行时执行前述实施例中任一项所述的目标对象识别方法的步骤。
[0017]本专利技术实施例带来了以下有益效果:
[0018]本专利技术实施例提供了一种目标对象识别方法、装置和电子系统,首先获取待本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标对象识别方法,其特征在于,所述方法应用于电子设备,包括:获取待识别的视频帧序列中同一目标对象的检测框集合和所述检测框集合中每个检测框的图像质量分值;基于每个所述检测框的图像质量分值,从所述检测框集合中选择第一检测框和第二检测框;基于所述第一检测框的第一检索特征向量、所述第一检测框的第一跟踪特征向量和所述第二检测框的第二跟踪特征向量确定所述第二检测框的第二检索特征向量;其中,所述第一检索特征向量的维度大于所述第一跟踪特征向量;所述第二检索特征向量的维度大于所述第二跟踪特征向量;融合所述第一检索特征向量和所述第二检索特征向量,得到所述同一目标对象的最优特征向量;基于所述最优特征向量和预存的目标对象底库确定所述同一目标对象的识别结果。2.根据权利要求1所述的方法,其特征在于,获取待识别的视频帧序列中同一目标对象的检测框集合和所述检测框集合中每个检测框的图像质量分值的步骤,包括:对待识别的视频帧序列中的视频帧进行目标对象检测,得到包含有所述目标对象的检测框;对每个所述检测框进行图像质量评分和跟踪特征向量提取,得到每个所述检测框的跟踪特征向量和图像质量分值;基于每个所述检测框的跟踪特征向量确定同一目标对象的检测框集合。3.根据权利要求2所述的方法,其特征在于,对每个所述检测框进行图像质量评分和跟踪特征向量提取的步骤,包括:将每个所述检测框分别输入质量评分模型和第一卷积神经网络模型,得到每个所述检测框的图像质量评分和跟踪特征向量;其中,所述质量评分模型用于对输入的检测框进行图像质量评分;所述第一卷积神经网络模型用于对输入的检测框进行跟踪特征向量提取。4.根据权利要求1所述的方法,其特征在于,基于每个所述检测框的图像质量分值,从所述检测框集合中选择第一检测框和第二检测框的步骤,包括:基于每个所述检测框的图像质量分值大小对所述检测框集合中的检测框排序;基于所述排序选择第一检测框和第二检测框,其中,所述第一检测框的图像质量分值和所述第二检测框的图像质量分值均大于未被选中的检测框的图像质量分值。5.根据权利要求1所述的方法,其特征在于,从所述检测框集合中选择第一检测框和第二检测框的步骤之后,所述方法还包括:将所述第一检测框输入第二卷积神经网络模型,得到所述第一检测框的第一检索特征向量;其中,所述第二卷积神经网络模型用于对输入的检测框进行检索特征向量提取。6.根据权利要求1所述的方法,其特征在于,基于所述第一检测框的第一检索特征向量、所述第一检测框的第一跟踪特征向量和所述第二检测框的第二跟踪特征向量确定所述第二检测框的第二检索特征向量的步骤,包括:将所述第一检测框的第一检索特征向量、所述第一检测框的第一跟踪特征向量和所述第二检测框的第二跟踪特征向量输入预先训练好的特征升级网络模型,得到所述第二检测框的第二检索特征向量...

【专利技术属性】
技术研发人员:陈军如姚皓天
申请(专利权)人:北京迈格威科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1