基于统计学习的生物特征识别性能指标预测方法技术

技术编号:6531756 阅读:316 留言:0更新日期:2012-04-11 18:40
一种基于统计学习的生物特征识别性能指标预测方法,包括步骤:对生物特征训练样本进行质量评价;计算生物特征识别系统在训练数据库上的真匹配分数;拟合各种质量组合生物特征样本之间真匹配分数的高斯分布;抽样统计应用环境中各种质量等级生物特征样本的构成比例;根据步骤c和d构建混合高斯模型估计生物特征识别系统在应用环境中真匹配分数的分布;预测生物特征识别系统的性能指标和置信区间。本发明专利技术计算简单、预测精确、适用于多种生物特征模态、实现通用的生物特征识别性能预测。

【技术实现步骤摘要】

本专利技术涉及生物特征识别、图像处理、模式识别和统计学,特别是生物特征识别性能测评领域。
技术介绍
安全是全球普遍关注的重大问题,可靠的个人身份识别是保障个人安全和公共安全的一项重要技术手段。正是在这种背景下,各种各样的生物识别技术例如虹膜、人脸、指纹识别纷纷发展起来。生物识别技术已被越来越多地应用于各种关系到国家和社会安全的领域,如公安、边检、金融、社保、门禁等。由于不同时刻、不同环境、不同姿态、不同设备采集的生物特征数据存在一定的变化,生物特征比对又是基于概率和统计科学,所以识别算法一般都有出错的可能。作为模式识别学科的尖端应用技术,生物特征识别的技术含量高,不同的实现方法设计的核心算法的精确性和安全性会参差不齐,对于不同应用的满足程度也会千差万别。目前市场上生物特征识别技术和产品的性能良莠不齐,在小规模数据库和限定应用环境下可以取得理想的实验效果,但是在大规模数据库和未知的应用场景中往往出现大幅度的性能下降,造成严重的安全隐患。因此为了保障生物特征识别的可靠运行,必须对相关技术和产品的性能进行测评认证,从而实现技术监督管理。此外生物特征识别的技术生产商和销售商以及生物特征识别的使用者也关心生物特征识别技术和产品在实际应用场景中的性能指标和可靠性,他们也希望获得生物特征识别性能测评工具的技术支持。任何的生物特征识别系统或者方法都有出错的可能,对识别精度进行客观、准确的评估其实是一个很复杂的问题,它受测试样本的数量、质量、评估指标等因素的影响,特别是在实际的测评工作中,由于数据库资源的稀缺以及大规模测试对于人力以及物力耗费的巨大,我们无法穷举所有可能的变化,采集包含所有变量的生物特征数据,从而使测评工作难于进行。测评机构很难有足够的资源建设模仿实际应用场景的大规模测试数据库,因此只能建设小规模的固定场景下的测试数据库来做测评实验。为了使有限规模、有限变量数据库上的实验结果能够估计和预测生物特征识别技术和产品在真实应用环境中的性能指标,需要一套简单、精确、普适的生物特征识别性能指标预测方法,不仅有助于全面测试评估生物特征识别技术和产品,而且可以节省大量的人力物力。生物特征识别的性能指标主要有错误接收率和错误拒绝率,其中错误接收率指标相对稳定,受测试数据的影响较小;但是生物特征识别的错误拒绝率指标受测试数据的变化影响较大。所以本专利技术主要针对生物特征识别错误拒绝率的预测。现有的生物特征识别预测模型主要是基于小样本上的结果来预测被测系统在大样本集上的性能。相关的研究基本上都是构建在二项分布的基础上。对于基于样本质量的预测模型研究刚刚起步,如针对人脸识别算法的性能预测,但是模型涉及复杂的统计分布函数,模型参数计算相当困难,且不具有普适性,无法适应于生物特征识别性能测评任务的需求。
技术实现思路
本专利技术的目的是提供一种。为实现上述目的,一种包括以下步骤a.对生物特征训练样本进行质量评价;b.计算生物特征识别系统在训练数据库上的真匹配分数;c.拟合各种质量组合生物特征样本之间真匹配分数的高斯分布;d.抽样统计应用环境中各种质量等级生物特征样本的构成比例;e.根据步骤c和d构建混合高斯模型估计生物特征识别系统在应用环境中真匹配分数的分布;f.预测生物特征识别系统的性能指标和置信区间。本专利技术计算简单、预测精确、适用于多种生物特征模态、实现通用的生物特征识别性能预测。附图说明图1是的流程图;图2通过四种图形证明由质量预测匹配分数的高斯模型存在的合理性,从上到下,从左到右,四个图分别为序列图、延迟图、直方图、正态概率图;图3是指纹识别系统在测试数据库匹配分数分布的预测流程图;图4对指纹图像训练集四类真匹配分数分布进行高斯验证。具体实施例方式下面结合附图以某个指纹识别系统的性能预测流程为例来详细说明本专利技术技术方案中所涉及的各个细节问题。应指出的是,所描述的实施例仅旨在便于对本专利技术的理解, 而对其不起任何限定作用。问题描述某指纹识别公司C开发了一套指纹识别系统FS,在研发过程中建设了一个内部的指纹数据库FD,存储了该公司所有员工的指纹图像。FS在FD上的测试结果良好,但是C希望把FS用于建筑工人考勤管理。显然建筑工人人群的指纹图像特点和高科技公司员工群体的指纹图像特征相差甚远,因此C希望通过FD的测试结果预测FS在建筑工人人群使用的性能指标。采用本专利技术的,包括步骤如下1.生物特征样本质量评价首先对指纹数据库FD中的每一幅指纹图像进行质量评价,指纹图像的质量评价指标主要是依据指纹图像中细节点的个数、有效区域面积、指纹干湿程度等,可以通过自动质量评价算法获得,例如参考文献[F. Alonso-Femandez,J. Fierrez, J. Ortega-Garcia, J. Gonzalez-Rodriguez,et al. ,“ A Comparative Study of Fingerprint Image-Quality Estimation Methods , IEEE Transactions on Information Forensics and Security, Volume 2,Issue 4,Dec. 2007,pp. 734-743.]介绍并比较了各种自动指纹图像质量评价方法。经过自动质量评价,指纹数据库FD中的每幅指纹图像的质量分数被评为五个等级{1,2,3 ,4,5} 。2.计算生物特征识别系统在训练库的真匹配分数给定两幅指纹图像Pi,Pj,指纹识别系统FS可以输出它们之间的匹配分数f(Pi, Pj),如果这两幅指纹图像来自同一个手指,则为真匹配分数,否则为假匹配分数。指纹识别系统FS可以计算指纹数据库FD中所有同一类指纹图像之间的匹配分数,得到大量的真匹配分数。3.各种质量组合生物特征样本之间真匹配分数的高斯拟合考虑到匹配分数的不确定性和众多随机因素的影响,最佳方法是采用统计分析方法来对真匹配分数进行建模。本专利技术假设真匹配分数f(Pi,Pj)和Pi,Pj的质量分数Qj 相关并满足正态分布。对生物特征识别性能预测的基础就是存在一个数学模型建立生物特征图像匹配分数和图像质量之间的对应关系。我们在指纹识别领域的权威测试数据库 FVC2002进行了实验,通过四种图形(见图2)证明了此预测模型的存在性以及选取高斯拟合分布的合理性。图2的上左为序列图,其反映出数据具有确定的均值及确定的方差;上右为延迟图,证明了数据的随机性;第二排的两幅图分别为直方图与正态分布证明图,分别证明了数据大致服从正态分布。因此我们可以把第2步获得的真匹配分数按照图像质量组合进行分类,对于每一类匹配分数可以通过极大似然估计方法估计高斯函数的均值和方差。这样每一种质量组合指纹图像之间的匹配分数就可以用一个高斯函数拟合。由于指纹图像数据库中质量小于3 的指纹图像样本比较少,为了便于统计分析,我们将质量小于等于3的指纹图片归为一类, 这样可以简化模型分析。最终质量对的组合数为四种,分别为(5,5)、(5,4)34,4)、(参与匹配的任意一幅指纹图像的质量小于或等于3)。图3给出了指纹图像真匹配分数按照4 种质量组合进行分类以及四种真匹配分数的拟合过程,最终可以得到4个高斯函数的参数 (μι,σ1;μ2,σ2;μ3,σ3;μ4,04)。本文档来自技高网
...

【技术保护点】
1.一种基于统计学习的生物特征识别性能指标预测方法,包括步骤:a.对生物特征训练样本进行质量评价;b.计算生物特征识别系统在训练数据库上的真匹配分数;c.拟合各种质量组合生物特征样本之间真匹配分数的高斯分布;d.抽样统计应用环境中各种质量等级生物特征样本的构成比例;e.根据步骤c和d构建混合高斯模型估计生物特征识别系统在应用环境中真匹配分数的分布;f.预测生物特征识别系统的性能指标和置信区间。

【技术特征摘要】
1.一种基于统计学习的生物特征识别性能指标预测方法,包括步骤a.对生物特征训练样本进行质量评价;b.计算生物特征识别系统在训练数据库上的真匹配分数;c.拟合各种质量组合生物特征样本之间真匹配分数的高斯分布;d.抽样统计应用环境中各种质量等级生物特征样本的构成比例;e.根据步骤c和d构建混合高斯模型估计生物特征识别系统在应用环境中真匹配分数的分布;f.预测生物特征识别系统的性能指标和置信区间。2.按权利要求1所述的方法,其特征在于所述对生物特征样本进行质量评价是通过质量评价算法对每一个生物特征样本自动评定一个质量等级。3.按权利要求1所述的方法,其特征在于所述的拟合各种质量组合生物特征样本之间真匹配分数的高斯分布是用高斯函数对每种质量组合生物特征样本之间的真匹配分数的概率分布进行数学建模,然后采用极大似然估计方法将生物特征识...

【专利技术属性】
技术研发人员:谭铁牛孙哲南何倩
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1