基于模糊熵的Congealing方法构造汉字字符及识别的方法技术

技术编号:10711969 阅读:127 留言:0更新日期:2014-12-03 16:32
本发明专利技术涉及一种基于模糊熵的Congealing方法构造汉字字符及识别的方法,首次将图像校正技术——Congealing方法应用到手写汉字字符识别问题上,提出了基于模糊熵Congealing算法的手写汉字识别方法,能够获得很好的字符识别率。本发明专利技术完全由数据驱动的方法被应用到手写汉字字符识别过程中,被证明能够得到很好的识别率。

【技术实现步骤摘要】

本专利技术属于计算机图像处理,涉及一种构造汉字字符及识别的方法,尤其涉及一种基于模糊熵的Congealing方法构造汉字字符及识别的方法
技术介绍
手写汉字识别方法在机器学习和人工智能领域被广泛研究着。目前,手写汉字识别方法被分为在线识别和离线识别。其中,离线识别方法研究的对象是分离的、孤立的手写汉字图像,利用机器学习的技术通过训练和分类过程,将待识别的手写汉字字符分类到正确的类别中。 由于汉字字符的巨大数量,多样的汉字结构,以及各异的手写风格,使得手写汉字识别十分困难。目前的手写汉字识别系统主要采用特征提取技术,然而特征提取的过程会受到人为主观因素的影响,导致提取到的特征不能很好地表示该字符。因此成为基于特征提取方法的手写汉字识别方法的一个缺点。 文献“Learned-Miller,Erik G.\Data driven image models through continuous joint alignment.\Journal IEEE Transactions on Pattern Analysis and Machine Intelligence 28.2(2006):236-250”中公开了一种图像校正技术——Congealing算法,该算法的目标是校正一组同类图像,减小该类图像间的差异,使之趋于相同。被校正的图像可以作为分类的模型用于识别过程。这是一个完全数据驱动的算法过程,避免了特征提取可能存在的缺点。 文献“Mac Parthalain,Neil,and Harry Strange.\Fuzzy-entropy based image congealing.\Fuzzy Systems(FUZZ),2013 IEEE International Conference on”中提出一种基于模糊熵的Congealing算法,这是对原Congealing算法的一种改进,用模糊熵代替信息熵,作为目标函数,被证明能够获得更好的校正结果。
技术实现思路
要解决的技术问题 为了避免现有技术的不足之处,本专利技术提出一种基于模糊熵的Congealing方法构造汉字字符及识别的方法,克服由于特征提取造成的对手写汉字字符不能很好地表示的问题。 技术方案 一种基于模糊熵的Congealing方法构造汉字字符的方法,其特征在于:随机选取某个字符类中的N张图像作为训练样本,训练步骤如下: 步骤1:对N张训练字符图像分别初始化变换参数向量 vj=(tx,ty,θ,sx,sy,hx,hy)=0(j=1toN),其中tx表示x方向的平移变换,ty表示y方向的平移变换,θ表示旋转变换,sx表示x方向的尺度变换,sy表示y方向的尺度变换,hx表示x方向的剪切变换,hy表示y方向的剪切变换。 然后计算出相应的变换矩阵Uj: U j = F ( v j ) = F ( t x , t y , θ , s x , s y , h x , h y ) = 1 0 t x 0 1 t y 0 0 1 cos θ - 本文档来自技高网
...
基于模糊熵的Congealing方法构造汉字字符及识别的方法

【技术保护点】
一种基于模糊熵的Congealing方法构造汉字字符的方法,其特征在于:随机选取某个字符类中的N张图像作为训练样本,训练步骤如下:步骤1:对N张训练字符图像分别初始化变换参数向量vj=(tx,ty,θ,sx,sy,hx,hy)=0(j=1toN),其中tx表示x方向的平移变换,ty表示y方向的平移变换,θ表示旋转变换,sx表示x方向的尺度变换,sy表示y方向的尺度变换,hx表示x方向的剪切变换,hy表示y方向的剪切变换。然后计算出相应的变换矩阵Uj:Uj=F(vj)=F(tx,ty,θ,sx,sy,hx,hy)=10tx01ty001cosθ-sin0sinθcosθ0001·esx000esy00011hx0010001100hy10001]]>步骤2:计算N张训练字符图像样本的模糊熵,步骤如下:1)图像栈IS中N张图像,每张有M个像素,表示图像栈中一个像素的值,xi表示一个像素栈图像栈中的每一张图像I∈IS被变换矩阵独立的改变,Uj表示第j个变换矩阵,xj′表示变换后的像素栈,i∈[1,M],j∈[1,N];2)利用模糊相似性关系,得到关于像素栈xi的关系矩阵M(R):3)由关系矩阵M(R)可得到像素栈xi的模糊熵为H(xi)H(xi)=-1NΣj=1Nlogλj]]>其中:λj=|[xij]R|N;]]>4)训练字符图像的模糊熵为一个字符训练样本中的所有像素栈的模糊熵的和:E=Σi=1MH(xi′);]]>步骤3:进行如下迭代过程,直至模糊熵收敛或迭代达到上限K为止:1)对N个训练样本的每一张图像的每个参数vj(k),k=1to7,j=1toN,微调其参数值vj(k),令vjnew(k)=vj(k)+δ(k),k=1to7,j=1toN,计算新的变换矩阵,并计算得到变换后的图像,然后重复步骤2计算当前的模糊熵Enew;2)如果模糊熵减少,则修正模糊熵E=Enew及变换向量的值vj(k)=vjnew(k),修改下一个参数,令k=k+1。如果模糊熵未减少,则进行下一步;3)微调其参数值vj(k),vjnew(k)=vj(k)‑δ(k),k=1to7,j=1toN,计算新的变换矩阵,并计算得到变换后的图像,然后重复步骤2计算当前的模糊熵Enew;如果模糊熵减少,则修正模糊熵E=Enew及变换向量的值vj(k)=vjnew(k),修改下一个参数,令k=k+1;如果模糊熵未减少,则进行下一步;4)参数值不变修改下一个参数,令k=k+1;步骤4:当Congealing过程结束,用原始图像乘以对应的变换矩阵Uj,分别得到Congealed的图像结果;每迭代一次结束,计算得到一张均值图像:当Congealing算法结束后,得到K张均值图像;对每个字符重复步骤1~步骤4,训练过程结束时,每个汉字字符将分别保存K张对应的均值图像。...

【技术特征摘要】
1.一种基于模糊熵的Congealing方法构造汉字字符的方法,其特征在于:随机选取
某个字符类中的N张图像作为训练样本,训练步骤如下:
步骤1:对N张训练字符图像分别初始化变换参数向量
vj=(tx,ty,θ,sx,sy,hx,hy)=0(j=1toN),其中tx表示x方向的平移变换,ty表示y方向
的平移变换,θ表示旋转变换,sx表示x方向的尺度变换,sy表示y方向的尺度变换,
hx表示x方向的剪切变换,hy表示y方向的剪切变换。
然后计算出相应的变换矩阵Uj: U j = F ( v j ) = F ( t x , t y , θ , s x , s y , h x , h y ) = 1 0 t x 0 1 t y 0 0 1 cos θ - sin 0 sin θ cos θ 0 0 0 1 · e s x 0 0 0 e s y 0 0 0 1 1 h x ...

【专利技术属性】
技术研发人员:李映李方轶
申请(专利权)人:西北工业大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1