使用GABOR函数的模式识别系统及方法技术方案

技术编号:14697349 阅读:79 留言:0更新日期:2017-02-24 02:08
公开了一种模式识别系统及方法,其通过将图像向量与稀疏矩阵相乘来生成特征向量。稀疏矩阵是根据Gabor函数生成的,Gabor函数是被乘以高斯函数的正弦波。Gabor函数是包括如下项的参数集的函数:与正弦波的方向相关的参数、与Gabor函数的中心相关的参数以及与正弦波的波长相关的参数。波长取至少两个值,其中,第一波长值小于或大体上等于Gabor函数的两个相邻中心之间的距离,并且第一波值长小于第二波长值且大于或大体上等于第二波长值的二分之一。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种模式识别系统。更具体地,本专利技术涉及一种使用Gabor函数的模式识别系统。
技术介绍
模式识别系统可以是光学字符识别(OCR)系统。公知各种OCR系统。这些OCR系统使用字符识别过程将文本的图像转化成机器可读代码。在OCR识别系统中,将可能是字符的图像分离并且使用字符识别过程来对字符进行识别。公知的光学字符识别过程通常包括:·归一化步骤,其用于根据输入图像生成归一化矩阵;·特征提取步骤;以及·归类步骤,其用于识别字符。特征提取步骤生成用于表征输入图像的特征向量,以及归类步骤根据该特征向量来识别字符。在一些OCR过程中,特征提取步骤涉及使用Gabor滤波器进行滤波。Gabor滤波器的选择对于OCR处理非常关键,因为Gabor滤波器决定了用以识别字符的特征向量。特征向量必须包含用以高度准确地识别字符的必要信息。太大的特征向量会造成计算缓慢,而太小的特征向量则会降低特征识别的准确度。公知的使用Gabor滤波器的OCR过程太慢或者准确度太低。这对亚洲字符的识别来说尤其如此,因为亚洲字符的数量非常多。公知的Gabor滤波器的另一缺点在于:这些Gabor滤波器在后续的归类步骤中并不能很好地起作用。US7174044B2公开了一种公知的基于Gabor滤波器进行字符识别的方法,该方法提取了字符的特定方向的信息。该方法使用Gabor滤波器的区域的平均值(average)并且涉及大量的计算和大的特征向量。这使得使用该方法执行OCR过程会非常慢。QiangHuo、YongGe以及Zhi-DanFeng在2001年IEEEInternationalConferenceonAcoustics,Speech,andSignalProcessing(IEEE声学、语音学以及信号处理国际会议)第3卷上发表的论文“HighperformanceChineseOCRbasedonGaborfeatures,discriminativefeatureextractionandmodeltraining(基于Gabor特征、区别特征提取以及模型训练的高性能中文OCR)”描述了一种公知的关于中文字符的OCR过程。该方法较快但是识别准确性并不是特别高。来自上海交通大学的DaiWei(戴维)的题目为“ChineseOCRSystemBasedonGaborFeaturesandSVM(基于Gabor特征与SVM的汉字识别系统)”的学位论文描述了另一种OCR过程。SVM表示“支持向量机”,是一种使用了用于数据分析的相关学习算法和识别算法的监督学习模型。这种SVM系统需要超大型学习集,而这种超大型学习集使得该系统要么不切实际要么不准确。
技术实现思路
本专利技术的目的在于提供一种模式识别方法,该模式识别方法提供了快速且准确的模式识别。本专利技术的另一目的在于提供一种用于执行模式识别系统的计算机程序产品。根据本专利技术的实施例,这些目的均得以实现。在一个实施例中,一种用于识别输入图像的模式的方法包括如下步骤:a)将输入图像归一化为表示归一化图像的归一化矩阵;b)根据所述归一化矩阵生成图像向量;c)使用矩阵向量乘法来将所述图像向量与稀疏矩阵相乘以生成特征向量,其中,所述稀疏矩阵是根据Gabor函数生成的,所述Gabor函数是被乘以高斯函数的正弦波,以及,其中,所述Gabor函数是用于指示归一化矩阵中的位置的至少一个变量以及参数集的函数,所述参数集包括:与正弦波的方向相关的参数、与Gabor函数的中心相关的参数以及与所述正弦波的波长相关的参数;d)使用特征向量为预定模型列表创建概率密度;e)将具有最大概率密度的模型选为最佳模型;以及f)将最佳模型归类为所述输入图像的模式,其中,Gabor函数具有至少两个中心,以及,其中,波长取至少两个值,第一波长值小于或大体上等于Gabor函数的两个相邻中心之间的距离,并且第一波长值小于第二波长值且大于或大体上等于第二波长值的二分之一。已经发现通过这些步骤的组合可以实现一种快速且准确的模式识别方法。具体地,原因在于:步骤c)中所生成的特征向量大到足以使识别更为准确,而同时步骤c)中所生成的特征向量又小到足以使模式识别方法的计算较快。此外,按照较短的波长大于或等于较长的波长的二分之一,并且小于或等于Gabor函数的两个中心之间的距离来选取两个波长是一种有利的权衡:既保证了波长的数量(从而特征向量的大小)较小,同时仍然使得特征向量略微冗余。特征向量的这种冗余使得即使特征向量的所给定的元素的值被损坏也仍能够使字符被识别出。在本专利技术的一个实施例中,模型通过协方差矩阵和均值向量来表征,概率密度通过如下公式来计算:其中,符号r表示特征向量,符号∑表示协方差矩阵,符号μ表示均值向量以及k等于特征向量的元素个数。在另一实施例中,协方差矩阵是近似的。在一个实施例中,所有模型的协方差矩阵的迹(trace)相等。在一个实施例中,可以将协方差矩阵的所有非对角元素设置为零。已经发现,结合上述方法,通过这样的协方差矩阵和均值向量来表征模型以及通过上述公式来计算概率密度会使得识别更为准确且尤其快。在根据本专利技术的一个实施例中,与正弦波的方向相关的参数使得正弦波的可能的方向间的角度大体上相等。在本专利技术的一个实施例中,与正弦波的方向相关的参数是角度。在另一实施例中,角度的最大值与角度的最小值之和等于π弧度。在一个实施例中,角度取6个值。这种关于与正弦波的方向相关的参数的值的选择给出了良好的权衡(trade-off):既实现了归一化图像的足够角采样,又保证了特征向量的大小小到足以使所述方法得到快速计算。在根据本专利技术的另一实施例,Gabor函数是与Gabor函数的中心相关的至少两个参数的函数。在一个实施例中,与Gabor函数的中心相关的参数使得Gabor函数的中心被均匀地间隔。在本专利技术的一个实施例中,与Gabor函数的中心相关的一个参数可以对应于归一化矩阵中的竖直方向,而与Gabor函数的中心相关的另一个参数可以对应于归一化矩阵中的水平方向。在一个实施例中,Gabor函数的第一中心与归一化矩阵的边的距离可以大体上等于Gabor函数的两个相邻中心之间的距离的二分之一。这种关于Gabor函数的中心的选择给出了归一化图像的良好角采样,并且保证了特征向量的大小小到足以使所述方法得到快速计算。在根据本专利技术的另一实施例中,Gabor函数包括与高斯函数的宽度相关的参数,该参数可以是高斯函数的标准差。在一个实施例中,高斯函数的标准差小于Gabor函数的两个相邻的中心之间的距离且大于Gabor函数的两个相邻中心之间的距离的二分之一。这种关于高斯函数的宽度的选择给出了归一化图像的良好角采样,并且保证了特征向量的大小小到足以使所述方法得到快速计算。在根据本专利技术的一个实施例,模式是两种颜色模式、字符、亚洲字符、字符组、标志、图片、设计、声音序列、影片片段或三维模式。在根据本专利技术的另一实施例中,归一化矩阵表示归一化图像,归一化矩阵的每个元素对应于归一化图像上的位置。归一化图像包括待识别的模式,并且归一化矩阵是表示归一化图像的数学对象。可以通过数学方法对归一化矩阵进行处理以便于提取归一化图像的特征,这些特征使得能够识别出模式。在根据本专利技术的一个实施例中,将输入图像归一化为归一化本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201580021728.html" title="使用GABOR函数的模式识别系统及方法原文来自X技术">使用GABOR函数的模式识别系统及方法</a>

【技术保护点】
一种用于识别输入图像的模式的方法,包括如下步骤:a)将所述输入图像归一化为表示归一化图像的归一化矩阵;b)根据所述归一化矩阵生成图像向量;c)使用矩阵向量乘法来将所述图像向量与稀疏矩阵相乘以生成特征向量,其中,所述稀疏矩阵是根据Gabor函数生成的,所述Gabor函数是被乘以高斯函数的正弦波,以及,其中,所述Gabor函数是用于指示所述归一化矩阵中的位置的至少一个变量以及参数集的函数,所述参数集包括:与所述正弦波的方向相关的参数、与所述Gabor函数的中心相关的参数以及与所述正弦波的波长相关的参数;d)使用所述特征向量为预定模型列表创建概率密度;e)将具有最大概率密度的模型选为最佳模型;以及f)将所述最佳模型归类为所述输入图像的模式,其中,所述Gabor函数具有至少两个中心;以及其中,所述波长取至少两个值,第一波长值小于或大体上等于所述Gabor函数的两个相邻中心之间的距离,并且所述第一波长值小于第二波长值且大于或大体上等于所述第二波长值的二分之一;其中,所述模型通过协方差矩阵和均值向量来表征,其中,所述概率密度通过如下公式来计算:p(r)=1(2π)k|Σ|exp&lsqb;-(r-μ)tΣ(r-μ)2]]]>其中,符号r表示所述特征向量,符号∑表示所述协方差矩阵,符号μ表示所述均值向量以及k等于所述特征向量中的元素的个数;其中,所述Gabor函数的所述参数集包括所述高斯函数的标准差,所述标准差所取的值小于所述Gabor函数的两个相邻的中心之间的距离且大于所述Gabor函数的两个相邻中心之间的距离的二分之一。...

【技术特征摘要】
【国外来华专利技术】2014.04.16 US 14/254,0391.一种用于识别输入图像的模式的方法,包括如下步骤:a)将所述输入图像归一化为表示归一化图像的归一化矩阵;b)根据所述归一化矩阵生成图像向量;c)使用矩阵向量乘法来将所述图像向量与稀疏矩阵相乘以生成特征向量,其中,所述稀疏矩阵是根据Gabor函数生成的,所述Gabor函数是被乘以高斯函数的正弦波,以及,其中,所述Gabor函数是用于指示所述归一化矩阵中的位置的至少一个变量以及参数集的函数,所述参数集包括:与所述正弦波的方向相关的参数、与所述Gabor函数的中心相关的参数以及与所述正弦波的波长相关的参数;d)使用所述特征向量为预定模型列表创建概率密度;e)将具有最大概率密度的模型选为最佳模型;以及f)将所述最佳模型归类为所述输入图像的模式,其中,所述Gabor函数具有至少两个中心;以及其中,所述波长取至少两个值,第一波长值小于或大体上等于所述Gabor函数的两个相邻中心之间的距离,并且所述第一波长值小于第二波长值且大于或大体上等于所述第二波长值的二分之一;其中,所述模型通过协方差矩阵和均值向量来表征,其中,所述概率密度通过如下公式来计算:p(r)=1(2π)k|Σ|exp[-(r-μ)tΣ(r-μ)2]]]>其中,符号r表示所述特征向量,符号∑表示所述协方差矩阵,符号μ表示所述均值向量以及k等于所述特征向量中的元素的个数;其中,所述Gabor函数的所述参数集包括所述高斯函数的标准差,所述标准差所取的值小于所述Gabor函数的两个相邻的中心之间的距离且大于所述Gabor函数的两个相邻中心之间的距离的二分之一。2.根据权利要求1所述的方法,其中,所有的非对角元素为零。3.根据权利要求1所述的方法,其中,与所述正弦波的方向相关的所述参数是角度。4.根据权利要求1所述的方法,至少两个参数与所述Gabor函数的中心相关,其中,与所述Gabor函数的中心相关的所述参数使得所述Gabor函数的中心被均匀...

【专利技术属性】
技术研发人员:费雷德里克·科利特乔迪·奥多米歇尔·多夫皮埃尔·德·姆勒娜瑞奥利维尔·杜邦甘特·亨格斯
申请(专利权)人:工业研究与信息服务处
类型:发明
国别省市:比利时;BE

相关技术
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1