模式识别模型的构建方法和装置及模式识别方法制造方法及图纸

技术编号：20589654 阅读：30 留言：0更新日期：2019-03-16 07:23

本发明专利技术涉及模式识别模型的构建方法和装置及模式识别方法。该构建方法包括：将给定训练集里的多个样本分为两组，多个样本中的每个样本具有各自对应的类；训练用于区分两组样本的二类分类器；重复上述步骤N次，得到N个二类分类器，N为任意正整数；以及将N个二类分类器进行组合来构建组合分类器用于模式识别。与传统方法相比，根据本发明专利技术的方法和装置构建的组合分类器能够在不降低性能的同时，大大缩短特征匹配时间。

全部详细技术资料下载

【技术实现步骤摘要】
模式识别模型的构建方法和装置及模式识别方法
本专利技术涉及模式识别领域，更具体地涉及一种模式识别模型的构建方法和装置及模式识别方法和模式识别装置。
技术介绍
当前的模式识别技术大都面向固定的类别数进行识别。例如，传统的文字识别系统将待识别样本归类为在训练集里学习过的众多文字中的一种。然而，在很多实际应用中，可能遇到的类别数不是固定的。例如，在人脸识别应用中，模式识别系统不仅需要识别已经见过的人脸，而且需要拒绝从未见过的人脸。如果一个模式识别系统不仅能够识别有限数量的已知类，而且能够拒绝无限数量的未知类，它就是一个开放集识别系统。更进一步，人们还希望开放集识别系统能够对被拒绝的未知类样本进行聚类，以形成新的类别。模式识别领域目前的主流方法是卷积神经网络(CNN)。以人脸识别为主要应用的传统开放集识别方法使用CNN的倒数第二层输出作为特征向量，并使用某种度量标准来确定两个样本是否属于同一类。其中，余弦相似度是最常用的度量标准。然而，余弦相似度的计算中需要进行大量的平方和乘法运算，而且还要进行开方和除法运算，计算量较大。在对未知类样本进行聚类时，需要进行大量的特征匹配计算，导致聚类时间非常漫长。如何得到一种效率更高的特征和度量标准，从而有效地缩短特征匹配时间和聚类时间，是一个亟待解决的问题。因此，需要一种能够解决上述问题的模式识别模型的构建方法和装置及模式识别方法。
技术实现思路
在下文中给出关于本专利技术的简要概述，以便提供关于本专利技术的某些方面的基本理解。应当理解，这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分，也不是意图...

【技术保护点】
1.一种模式识别模型的构建方法，包括：将给定训练集里的多个样本分为两组，所述多个样本中的每个样本具有各自对应的类；训练用于区分所述两组样本的二类分类器；重复上述步骤N次，得到N个二类分类器，N为任意正整数；以及将所述N个二类分类器进行组合来构建组合分类器用于模式识别。

【技术特征摘要】
1.一种模式识别模型的构建方法，包括：将给定训练集里的多个样本分为两组，所述多个样本中的每个样本具有各自对应的类；训练用于区分所述两组样本的二类分类器；重复上述步骤N次，得到N个二类分类器，N为任意正整数；以及将所述N个二类分类器进行组合来构建组合分类器用于模式识别。2.根据权利要求1所述的方法，还包括确定每个类的阈值的步骤，包括：对于所述训练集里的每个样本，用所述N个二类分类器分别对其进行处理，得到用于描述该样本的、长度为N的特征串，所述特征串的每一位为1或0；基于每个类的所有样本的特征串，计算该类的特征概率串，所述特征概率串为实数序列，长度为N，其第k个实数元素代表该类的样本被第k个二类分类器处理得到1的概率，其中，k大于或等于1且小于或等于N；准备验证集，所述验证集包括多个类别已知的样本，并且所述验证集里的样本不同于所述训练集里的样本，所述验证集里的样本包括属于所述训练集里某个类的已知类样本和不属于所述训练集里任何类的未知类样本；对所述验证集里的每个样本，用所述N个二类分类器分别对其进行处理，得到所述验证集里每个样本的特征串，所述特征串的长度为N，其每一位为1或0；将所述训练集里每个类的特征概率串与所述验证集里每个样本的特征串进行比较并计算其之间的相似度或距离；以及对所述训练集里每个类确定相似度阈值或距离阈值，使得已知类识别正确率与未知类识别正确率之和达到最高，其中，所述已知类识别正确率是正确识别的已知类样本在验证集里所有已知类样本中占的比例，所述未知类识别正确率是被判断为未知类的未知类样本在验证集里所有未知类样本中占的比例。3.根据权利要求1所述的方法，还包括确定每个类的阈值的步骤，包括：对于所述训练集里的每个样本，用所述N个二类分类器分别对其进行处理，得到用于描述该样本的、长度为N的特征串，其每一位为1或0；基于每个类的所有样本的特征串，计算该类的特征概率串，所述特征概率串为实数序列，长度为N，其第k个实数元素代表该类的样本被第k个二类分类器处理得到1的概率，其中，k大于或等于1且小于或等于N；对于所述训练集里的每个类，基于该类的特征概率串得到该类的特征串，类的特征串的长度为N，其每一位为1或0；准备验证集，所述验证集包括多个类别已知的样本，并且所述验证集里的样本不同于所述训练集里的样本，所述验证集里的样本包括属于所述训练集里某个类的已知类样本和不属于所述训练集里任何类的未知类样本；对所述验证集里的每个样本，...

【专利技术属性】
技术研发人员：肖晗，于小亿，孙俊，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：日本,JP

全部详细技术资料下载我是这个专利的主人