模式识别模型的构建方法和装置及模式识别方法制造方法及图纸

技术编号:20589654 阅读:30 留言:0更新日期:2019-03-16 07:23
本发明专利技术涉及模式识别模型的构建方法和装置及模式识别方法。该构建方法包括:将给定训练集里的多个样本分为两组,多个样本中的每个样本具有各自对应的类;训练用于区分两组样本的二类分类器;重复上述步骤N次,得到N个二类分类器,N为任意正整数;以及将N个二类分类器进行组合来构建组合分类器用于模式识别。与传统方法相比,根据本发明专利技术的方法和装置构建的组合分类器能够在不降低性能的同时,大大缩短特征匹配时间。

【技术实现步骤摘要】
模式识别模型的构建方法和装置及模式识别方法
本专利技术涉及模式识别领域,更具体地涉及一种模式识别模型的构建方法和装置及模式识别方法和模式识别装置。
技术介绍
当前的模式识别技术大都面向固定的类别数进行识别。例如,传统的文字识别系统将待识别样本归类为在训练集里学习过的众多文字中的一种。然而,在很多实际应用中,可能遇到的类别数不是固定的。例如,在人脸识别应用中,模式识别系统不仅需要识别已经见过的人脸,而且需要拒绝从未见过的人脸。如果一个模式识别系统不仅能够识别有限数量的已知类,而且能够拒绝无限数量的未知类,它就是一个开放集识别系统。更进一步,人们还希望开放集识别系统能够对被拒绝的未知类样本进行聚类,以形成新的类别。模式识别领域目前的主流方法是卷积神经网络(CNN)。以人脸识别为主要应用的传统开放集识别方法使用CNN的倒数第二层输出作为特征向量,并使用某种度量标准来确定两个样本是否属于同一类。其中,余弦相似度是最常用的度量标准。然而,余弦相似度的计算中需要进行大量的平方和乘法运算,而且还要进行开方和除法运算,计算量较大。在对未知类样本进行聚类时,需要进行大量的特征匹配计算,导致聚类时间非常漫长。如何得到一种效率更高的特征和度量标准,从而有效地缩短特征匹配时间和聚类时间,是一个亟待解决的问题。因此,需要一种能够解决上述问题的模式识别模型的构建方法和装置及模式识别方法。
技术实现思路
在下文中给出关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。本专利技术的一个主要目的在于,提供了一种模式识别模型的构建方法,包括:将给定训练集里的多个样本分为两组,多个样本中的每个样本具有各自对应的类;训练用于区分两组样本的二类分类器;重复上述步骤N次,得到N个二类分类器,N为任意正整数;以及将N个二类分类器进行组合来构建组合分类器用于模式识别。根据本专利技术的一个方面,提供一种模式识别模型的构建装置,包括:分组单元,被配置为将给定训练集里的多个样本分为两组,多个样本中的每个样本具有各自对应的类;二类分类器训练单元,被配置为训练用于区分两组样本的二类分类器;重复控制单元,被配置为重复分组单元和二类分类器训练单元的操作N次,得到N个二类分类器,N为任意正整数;以及组合分类器构建单元,被配置为将N个二类分类器进行组合来构建组合分类器用于模式识别。根据本专利技术的又一个方面,提供一种模式识别方法,包括:将待识别样本输入根据以上的方法构建的模式识别模型;用模式识别模型中的N个二类分类器对待识别样本进行处理,得到用于描述待识别样本的、长度为N的特征串,特征串的每一位为1或0;计算待识别样本的特征串与模式识别模型中每个类的特征概率串的相似度或距离,或者计算待识别样本的特征串与模式识别模型中每个类的特征串的相似度或距离;以及根据所计算出的相似度或距离和模式识别模型中的每个类的相似度阈值或距离阈值,对待识别样本是否属于该类做出判断,根据每个类的判断结果得到待识别样本的识别结果。根据本专利技术的再一个方面,提供一种模式识别装置,包括:输入单元,被配置为将待识别样本输入根据以上的方法构建的模式识别模型;待识别样本处理单元,被配置为用模式识别模型中的N个二类分类器对待识别样本进行处理,得到用于描述待识别样本的、长度为N的特征串,特征串的每一位为1或0;相似度或距离计算单元,被配置为计算待识别样本的特征串与模式识别模型中每个类的特征概率串的相似度或距离,或者计算待识别样本的特征串与模式识别模型中每个类的特征串的相似度或距离;以及识别单元,识别单元根据所计算出的相似度或距离和模式识别模型中的每个类的相似度阈值或距离阈值,对待识别样本是否属于该类做出判断,根据每个类的判断结果得到待识别样本的识别结果。另外,本专利技术的实施例还提供了用于实现上述方法的计算机程序。此外,本专利技术的实施例还提供了至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述方法的计算机程序代码。通过以下结合附图对本专利技术的最佳实施例的详细说明,本专利技术的这些以及其他优点将更加明显。附图说明参照下面结合附图对本专利技术实施例的说明,会更加容易地理解本专利技术的以上和其它目的、特点和优点。附图中的部件只是为了示出本专利技术的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。图1示出了根据本专利技术的一个实施例的模式识别模型的构建方法100的示例性过程的流程图;图2是示出了步骤S110的一种示例性过程的流程图;图3是示出了步骤S110的另一种示例性过程S110’的流程图;图4是示出根据本专利技术的另一个实施例的模式识别模型的构建装置400的示例性配置的框图;图5是示出了根据本专利技术的一个实施例的利用上述模式识别模型的构建方法和装置构建的模式识别模型进行模式识别的方法的示例性过程的流程图;图6是示出了根据本专利技术的另一个实施例的利用上述模式识别模型的构建方法和装置构建的模式识别模型进行模式识别的装置600的示例性配置的框图;以及图7是示出可以用于实施本专利技术的基于神经网络的开放集模式识别模型的训练方法和装置的计算设备的示例性结构图。具体实施方式在下文中将结合附图对本专利技术的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本专利技术,在附图中仅仅示出了与根据本专利技术的方案密切相关的设备结构和/或处理步骤,而省略了与本专利技术关系不大的其他细节。本专利技术通过引入一种新的框架来解决现有技术中的问题。在该框架中,利用CNN构建许多独立的二类分类器,来形成强大的组合分类器。该组合分类器与传统框架下适当规模的单个CNN多分类器在开放集识别方面的性能相当,但是能够提供一种效率非常高的特征表述,在这种特征表述下,能够使用汉明距离和/或柔性汉明距离实现快速的特征匹配,从而能够大大加速后续的聚类过程。除此之外,这种新方案还可能带来以下好处。1.采用这种框架,可以方便地实现增量学习,即逐渐增加已知类或用于训练的已知类样本的数量。2.利用组合分类器获得的特征表述,在不同类之间混淆程度较低,因而可能带来更好的聚类性能。3.除了分类和预测,如果想要根据不同类型的特征索引或搜索数据库,可以通过将基本的CNN划分成组,然后用不同类型的特征来训练每组CNN,来在新的框架下实现。不同类型的特征可以为线条组合、颜色模式或纹理等。由于在这种新的框架下实现了特征解耦,甚至可能实现某些高级的特征搜索,例如在人脸数据库中搜索具有大鼻子的人脸。下面结合附图详细说明根据本专利技术实施例基于神经网络的开放集模式识别模型的训练方法和装置。下文中的描述按如下顺序本文档来自技高网...

【技术保护点】
1.一种模式识别模型的构建方法,包括:将给定训练集里的多个样本分为两组,所述多个样本中的每个样本具有各自对应的类;训练用于区分所述两组样本的二类分类器;重复上述步骤N次,得到N个二类分类器,N为任意正整数;以及将所述N个二类分类器进行组合来构建组合分类器用于模式识别。

【技术特征摘要】
1.一种模式识别模型的构建方法,包括:将给定训练集里的多个样本分为两组,所述多个样本中的每个样本具有各自对应的类;训练用于区分所述两组样本的二类分类器;重复上述步骤N次,得到N个二类分类器,N为任意正整数;以及将所述N个二类分类器进行组合来构建组合分类器用于模式识别。2.根据权利要求1所述的方法,还包括确定每个类的阈值的步骤,包括:对于所述训练集里的每个样本,用所述N个二类分类器分别对其进行处理,得到用于描述该样本的、长度为N的特征串,所述特征串的每一位为1或0;基于每个类的所有样本的特征串,计算该类的特征概率串,所述特征概率串为实数序列,长度为N,其第k个实数元素代表该类的样本被第k个二类分类器处理得到1的概率,其中,k大于或等于1且小于或等于N;准备验证集,所述验证集包括多个类别已知的样本,并且所述验证集里的样本不同于所述训练集里的样本,所述验证集里的样本包括属于所述训练集里某个类的已知类样本和不属于所述训练集里任何类的未知类样本;对所述验证集里的每个样本,用所述N个二类分类器分别对其进行处理,得到所述验证集里每个样本的特征串,所述特征串的长度为N,其每一位为1或0;将所述训练集里每个类的特征概率串与所述验证集里每个样本的特征串进行比较并计算其之间的相似度或距离;以及对所述训练集里每个类确定相似度阈值或距离阈值,使得已知类识别正确率与未知类识别正确率之和达到最高,其中,所述已知类识别正确率是正确识别的已知类样本在验证集里所有已知类样本中占的比例,所述未知类识别正确率是被判断为未知类的未知类样本在验证集里所有未知类样本中占的比例。3.根据权利要求1所述的方法,还包括确定每个类的阈值的步骤,包括:对于所述训练集里的每个样本,用所述N个二类分类器分别对其进行处理,得到用于描述该样本的、长度为N的特征串,其每一位为1或0;基于每个类的所有样本的特征串,计算该类的特征概率串,所述特征概率串为实数序列,长度为N,其第k个实数元素代表该类的样本被第k个二类分类器处理得到1的概率,其中,k大于或等于1且小于或等于N;对于所述训练集里的每个类,基于该类的特征概率串得到该类的特征串,类的特征串的长度为N,其每一位为1或0;准备验证集,所述验证集包括多个类别已知的样本,并且所述验证集里的样本不同于所述训练集里的样本,所述验证集里的样本包括属于所述训练集里某个类的已知类样本和不属于所述训练集里任何类的未知类样本;对所述验证集里的每个样本,...

【专利技术属性】
技术研发人员:肖晗于小亿孙俊
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1