基于笔画片段和轮廓特征的笔迹识别方法技术

技术编号:9113712 阅读:237 留言:0更新日期:2013-09-05 02:55
本发明专利技术涉及一种基于笔画片段和轮廓特征的笔迹识别方法,首先需要将书写人书写的笔迹用扫描仪扫描成静态图像,然后利用图像处理技术将笔迹图像进行二值化和边缘提取得到相应的二值图像和轮廓图像,然后利用本发明专利技术提出的特征提取方法分别对二值图像和轮廓图像进行特征提取,最后利用模式识别技术对提取的特征进行身份识别。本发明专利技术提取了一种新的基于笔画片段和码书技术的特征提取方法和新的基于笔画轮廓的特征提取方法。并将两个提出的特征进行融合,进一步提高了识别精度。

【技术实现步骤摘要】

【技术保护点】
一种基于笔画片段和轮廓特征的笔迹识别方法,其特征在于,方法如下:(1)笔迹图像的获取要求书写人在颜色单一的纸上书写任意一段文字,然后利用扫描仪将纸上的文字扫描到电脑中,得到静态的笔迹图像;(2)笔迹图像二值化和边缘提取扫描得到的笔迹图像为灰度图像,利用大津法对原始的灰度图像进行自适应二值化处理,得到二值图像,然后根据连通体的面积将二值图像中小的连通体去除,最后利用传统的边缘检测方法提取笔迹轮廓图像;(3)笔画分割及码书构造首先对笔画进行定义,将笔迹二值图像中的每一个连通体作为一个笔画,采用不同的笔画片段在笔迹图像中出现的频率作为特征来区分每个书写人的身份,首先要进行笔迹分割过程来提取笔画片段,采用基于滑动窗口的笔迹分割方法分为以下几个步骤:3.1)获取笔迹图像中所有的连通体;3.2)对每一连通体,计算保护它的最小矩形,设该矩形的宽为WCC,高为HCC;3.3)根据最小矩形,构造一个滑动窗口,该窗口的宽为WSW=30,高为最小矩形的高HCC;3.4)在最小矩形上,以步长为Gap,从左到右的移动滑动窗口,每次滑动窗口里的都是一个片段,得到多个片段;3.5)对每一片段,将其归一化到大小为30×30,并保持原始片段中连通体的长宽比,把归一化后的片段称之为一个笔画片段,最后用一个由0和1组成的大小为900的向量来表示每一个笔画片段;利用自组织神经网络聚类算法,从训练样本的笔画片段中构造一个笔画片段的码书,码书由少数量的通用的笔画片段组成,其中每一个通用的笔画片段被称之为一个码字;(4)基于笔画片段的特征提取构造完码书之后,从笔迹图像中提取一种笔画片段直方图特征,称为SFH特征,用SF={f1,f2,...,fn}记为n个从笔迹图像中分割得到的笔画片段,并用 C={c1,c2,...,cN}记为大小为N的一个笔画片段码书。SFH特征的提取过程如下:4.1)初始化大小为N的SFH特征向量,如SFH=[0,0,...,0]。4.2)对每一个笔画片段fi∈SF,计算它和每一个码字cj∈C之间的欧式距离,如下:EDij=Σk=1900(fik-cjk)2.计算完之后,对每一个笔画片段fi,我们将得到一个欧式距离向量EDVi,如下:EDVi=[EDi1,EDi2,...,EDiN].4.3)对EDVi进行升序排序,并得到排序后EDVi中的钱t个元素的索引,记为:IDX={idx1,idx2,...,idxt}.4.4)对前t个元素进行指数变换和归一化过程,并得到一个响应向量RVi,计算过程如下:vik=exp(-delta×EDi,idxk)SVi=Σk=1tvikrvik=vikSViRVi=[rvi1,rvi2,...,rvit]其中delta是一个常数;4.5)对每一个idxk∈IDX,用如下方式更新SFH特征向量:SFHidxk=SFHidxk+rvik.4.6)重复步骤4.2到步骤4.5,使所有的笔画片段都被处理;4.7)计算最终的SFH特征向量,如下:SFHi=SFHiΣj=1NSFHj.(5)基于轮廓的特征提取针对笔迹轮廓图像提出了一种局部轮廓模型直方图特征,简称为LCPH特征,LCPH特征提取过程需要跟踪笔迹轮廓图像中的每一个轮廓点;局部轮廓模型定义为每个轮廓点的一个n×n的邻域,n=17时,识别精度最高,因此局部轮廓模型的带下为17×17;为了能具体表述局部轮廓模型,将局部轮廓模型划分为多个大小为3×3的小块,并且在水平和垂直方向相邻的两个小块重叠一个像素。在每个小块中,用1表示轮廓点,0表示背景点,这样每个小块将会由9个由0或1组成的二进制串,因此在每个小块中存在29=512不同的情况出现;给定一个笔迹图像和局部轮廓模型的大小n×n,将有个小块,LCPH特征的提取过程如下:5.1)利用经典的边缘提取算子提取笔迹图像的轮廓,并用CP={p1,p2,...,pM}记为所有的M个轮廓点;5.2)对每一个小块Bi=[bi1,bi2,...,bi9],bik∈{0,1},1≤i≤m,初始化它相应的大小为512的直方图Hi=[0,0,...,0],因此将存在m个这样的直方图;5.3)对每一个轮廓点pj∈CP,有m个小块在它的局部轮廓模型中,并得到m个小块中所有元素的值,接着对一个小块串联块中的所有元素生成一个二进制字符串,记为:BSi=bi1bi2...bi9,并且将二进制字符串BSi转化为一个十进制数Si用来决定该小块属于哪种情况;5.4)对每个小块Bj,用如下方式更新它相应的直方图Hi:...

【技术特征摘要】

【专利技术属性】
技术研发人员:邬向前卜薇唐有宝
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1