人脸或场景识别数据分类的竞争和协同表示方法及系统技术方案

技术编号:20273474 阅读:49 留言:0更新日期:2019-02-02 04:00
本发明专利技术属于数据处理技术领域,公开了一种基于竞争与协同表示的人脸或场景识别方法及系统,推荐的竞争约束模型能利用合适的样本对测试样本进行表达,并且减少其他非正确类别中的样本对编码的贡献,从而使分类编码对正确的类别更有倾向性,同时各类样本之间相互竞争,希望用更少类的样本来表示测试样本;本发明专利技术根据训练样本数据的局部结构信息定义了自适应的竞争权重;这个竞争权重会根据测试样本与训练样本的距离及训练样本的分布情况进行自动的更新,从而使得与测试样本较近的训练样本对其编码作出更大的贡献;本发明专利技术在吸取了前人的经验与教训的基础上,引入了竞争与协同的概念,提出了新的L2范数正则化项以及自适应的竞争权重,完善了模型,使其更稳定,更有竞争力,并且更实用。

【技术实现步骤摘要】
人脸或场景识别数据分类的竞争和协同表示方法及系统
本专利技术属于数据处理
,尤其涉及一种人脸或场景识别数据分类的竞争和协同表示方法及系统。同时也适用于场景识别。
技术介绍
目前,业内常用的现有技术主要分成两种。一种是基于线性表达模型构建的分类识别系统,该类识别系统通常依据L1范数正则化的稀疏表示和L2范数正则化的协同表达对测试样本进行编码,但由于对L1范数进行优化求解的方法较为复杂费时,所以业界通常选用协同表达的方式构建真实的识别系统。另外一种识别系统主要利用了深度学习的方式进行模型训练,但是由于深度模型有大量的模型参数需要训练,所以系统针对性不强,现主要应用在安防系统和智慧城市等方面。近期,神经网络模型在图像分类和人脸识别上取得了突破进展。深度网络学习使图像学习与分类学习成为一体并且能够从原始数据中学习仿真。但是在训练深度模型的过程中,有大量的参数需要学习,所以需要大量的数据参与训练。然而在实际的应用场景中,一个小型的公司通常有几百人,然而模型训练需要几万或者几十万的训练数据,这对于采集数据造成了巨大的困难。除此之外,随着模型参数增多,需要训练的时间也会成倍增加,进而不能很好的响应用户需求。然而,在数据库比较小或者训练样本不够充分的情况下,基于线性表达的分类器也许是一个很好的选择。传统的线性分级器,比如最近邻分类器,最近特征线分类器,限行回归分类器,仅仅采用了一小部分的训练样本去表达查询数据。但是,这些方法并不能强健的处理噪声数据,同时,这也存在着不同的线性组合训练样本去重建一个测试样本的问题。因此Wright等人利用范数正则化的稀疏性质,提出了基于稀疏表达分类器SRC的稀疏表达,该方法针对查询样本能够用相对稀疏的编码对其进行表达。但是Zhang等人认为,当训练样L1本之间的相关性很高时,稠密的编码比稀疏的编码更好,并能充分展现分类的的协调一致性,从而依据L2范数的协同性质提出了协同表达的方法,该方法能让更多的样本对查询样本进行编码,从而获得与查询样本最一致的编码表达。随后Akhtar等人认为稀疏表达和协同表达对于分级都很重要。但是这些方法在训练的过程中,通常是将训练样本分开对待,从而忽视了训练数据的空间结构信息。随后Wang等人利用了训练数据的标记信息改进模型,使得识别正确率有所提升,但是该方法却忽视了训练数据本身的性质。由此可见,基于线性表达的分类模型的优劣主要取决于是否能利用类标信息或数据结构信息准确地捕获训练样本间的关系,并利用这些关系对查询样本进行准确唯一的编码。因此,本专利技术提出了一种竞争和协同表达的方法,一方面能自动地发现训练样本间的关系,另一方面还可以利用新的L范数正则化项在编码的过程中创造竞争表达,进而获得较为稀疏的编码,同时也能得到准确的编码解。综上所述,现有技术存在的问题是:(1)传统的线性分类器,比如最近邻分类器,最近特征线分类器,限行回归分类器,仅仅采用了一小部分的训练样本去表现查询数据,并且,这些方法并不能强健的处理噪声数据,同时,这也存在着不同的线性组合训练样本去重建一个测试样本的问题。(2)现有技术都把训练样本分开对待,忽视了潜伏的训练数据的结构。现有技术改进的方法忽视了数据的局部构造。其他改进的方法,虽然利用了训练数据的标记信息,但却忽视了训练数据本身所包含的信息。(3)现有的方法很难有效地发现训练样本间的关系,并自动地选择稀疏或稠密的编码方式对查询样本进行编码。(4)现有的稀疏编码方式通常是使用基于L1范数的正则化,但是这种约束方式会使得求解不稳定且训练费时,所以需要提出一种易于快速求解且能得到唯一准确解的方法。解决上述技术问题的难度和意义:(1)本专利技术提出了新的L2范数正则化项,该正则化项利用不同类别数据间的差异性创造一种竞争表达的编码方式,该种竞争表达的方式能够自动地发现训练样本间的关系,从而自动地选择稀疏或者稠密的编码方式。因此该方法有效地解决了基于线性表达模型无法自动选择稀疏或者稠密编码的问题。(2)由于在本专利技术所提出模型中,只使用了L2范数的正则项约束,从而使得模型既能快速求解训练,还能得到相对稀疏准确的编码解。因此该专利技术解决了基于线性表达模型中既要获得稀疏解又要快速计算的问题。(3)本专利技术提出的模型巧妙地使用了样本间的空间结构信息,进而能够加强模型对稀疏编码或稠密编码的选择能力。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种人脸或场景识别数据分类的竞争和协同表示方法及系统。本方法创造性地提出了一种新的L2范数正则化项,该正则化项利用不同类别数据间的差异性创造一种竞争表达的编码方式,该种竞争表达的方式能够自动地发现训练样本间的关系,从而自动地选择稀疏或者稠密的编码方式。除此之外,由于该方法只使用了L2范数的正则项约束,从而使得模型既能快速求解训练,还能得到相对稀疏准确的编码解。最后,本专利技术提出的模型巧妙地使用了样本间的空间结构信息,进而能够加强模型对稀疏编码或稠密编码的选择能力。本专利技术是这样实现的,一种人脸或场景识别数据分类的竞争和协同表示方法,包括:以公司门禁人脸识别系统为例对该方法进行详细地阐述。首先,需要对公司内所有员工进行图像采集工作,进而得到了模型的训练样本,也称之为训练数据库。之后,在系统使用的过程中,一个员工在通过门禁系统时,系统会对员工进行摄像,该张图像也称为测试样本,然后利用训练数据库中的样本对该张图像进行表达。最后,挑选出训练样本中表达系数最大的样本所属的类别作为该员工的识别结果。本专利技术所提出的方法构建了一个新的L2范数正则化项一方面要求模型能够根据训练样本间的关系自动地选择协同或者稀疏表达,另一方面使得模型能够快速训练,并求得最优编码结果。最后,该方法依据测试样本和训练样本间的结构信息创造性地设计了竞争权重,加强模型对稀疏或稠密编码的方式选择的能力,具体步骤如下:A)竞争约束:建立最佳函数在这里,y代表系统新摄像得到的图像的向量表达,X代表模型所用的训练样本构成的矩阵,X-i表示训练数据中除去第i个人所用样本构成的矩阵,u-i是对应于X-i的编码系数,ωi是定义的对应于第i类样本的竞争权重,C是整个训练样本中所包含的总人数,λ是模型参数。B)设置竞争权重在这里,ri表示测试样本与第i类样本的欧式距离,rmax表示在所用的ri最大的值。C)建立最优化Co-CRC模型,求解出u,在这里,y代表系统新摄像得到的图像的向量表达,X代表模型所用的训练样本构成的矩阵,X-i表示训练数据中除去第i个人所用样本构成的矩阵,u-i是对应于X-i的编码系数,ωi是定义的对应于第i类样本的竞争权重,C是整个训练样本中所包含的总人数,λ是模型参数。进一步,所述人脸或场景识别数据分类的竞争和协同表示方法具体包括:输入:将采集到的每个员工的图像转化成向量表达,然后将采集到的所有数据拼接成一个矩阵X作为训练样本集,然后将系统再次摄像到的人脸图像转化成向量作为测试样本y,规定模型中的系数为λ,δ;由于原始采集的图像数据是由0-255之间的数值进行表示的,所以本专利技术需要将原始图像数据标准化到0-1的范围之间;按照训练样本的个数构建单位矩阵,然后将第i类样本所对应的列去除,然后得到P-i,最终得到所有类别的按照计算新拍摄的图像(测试样本)y和训练数本文档来自技高网
...

【技术保护点】
1.一种人脸或场景识别数据分类的竞争和协同表示方法,其特征在于,所述人脸或场景识别数据分类的竞争和协同表示方法包括:构建的新的L2范数正则化项根据训练样本间的关系自动地选择协同或者稀疏表达,并对新的L2范数正则化项进行训练,求得最优编码结果;利用新的L2范数正则化项,依据测试样本和训练样本间的结构信息设计竞争权重,对稀疏或稠密编码的方式进行选择。

【技术特征摘要】
1.一种人脸或场景识别数据分类的竞争和协同表示方法,其特征在于,所述人脸或场景识别数据分类的竞争和协同表示方法包括:构建的新的L2范数正则化项根据训练样本间的关系自动地选择协同或者稀疏表达,并对新的L2范数正则化项进行训练,求得最优编码结果;利用新的L2范数正则化项,依据测试样本和训练样本间的结构信息设计竞争权重,对稀疏或稠密编码的方式进行选择。2.如权利要求1所述的人脸或场景识别数据分类的竞争和协同表示方法,其特征在于,对新的L2范数正则化项进行训练,求得最优编码结果,包括:A)竞争约束:建立最佳函数其中,y代表系统新摄像得到的图像的向量表达,X代表模型所用的训练样本构成的矩阵,X-i表示训练数据中除去第i个人所用样本构成的矩阵,u-i是对应于X-i的编码系数,ωi是定义的对应于第i类样本的竞争权重,C是整个训练样本中所包含的总人数,λ是模型参数;B)设置竞争权重在这里,ri表示测试样本与第i类样本的欧式距离,rmax表示在所用的ri最大的值;C)建立最优化Co-CRC模型。3.如权利要求2所述的人脸或场景识别数据分类的竞争和协同表示方法,其特征在于,建立最优化Co-CRC模型包括:求解出的u,在这里,y代表系统新摄像得到的图像的向量表达,X代表模型所用的训练样本构成的矩阵,X-i表示训练数据中除去第i个人所用样本构成的矩阵,P-i表示除去第i类的对角矩阵,u-i是对应于X-i的编码系数,ωi是定义的对应于第i类样本的竞争权重,C是整个训练样本中所包含的总人数,λ是模型参数。4.如权利要求1所述的人脸或场景识别数据分类的竞争和协同表示方法,其特征在于,所述人脸或场景识别数据分类的竞争和协同表示方法具体包括:输入:将采集到的每个员工的图像转化成向量表达,将采集到的所有数据拼接成一个矩阵X作为训练样本集,再将系统再次摄像到的人脸图像转化成向量作为测试样本,模型中的系数为λ,δ;原始采集的y图像数据由0-255之间的数值进行表示,将原始图像数据标准化到0-1的范围之间...

【专利技术属性】
技术研发人员:池红梅赵逸之汤鑫张英豪夏海峰
申请(专利权)人:华中农业大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1