【技术实现步骤摘要】
本专利技术属于计算机图像处理,涉及一种构造汉字字符及识别的方法,尤其涉及一种基于模糊熵的Congealing方法构造汉字字符及识别的方法。
技术介绍
手写汉字识别方法在机器学习和人工智能领域被广泛研究着。目前,手写汉字识别方法被分为在线识别和离线识别。其中,离线识别方法研究的对象是分离的、孤立的手写汉字图像,利用机器学习的技术通过训练和分类过程,将待识别的手写汉字字符分类到正确的类别中。 由于汉字字符的巨大数量,多样的汉字结构,以及各异的手写风格,使得手写汉字识别十分困难。目前的手写汉字识别系统主要采用特征提取技术,然而特征提取的过程会受到人为主观因素的影响,导致提取到的特征不能很好地表示该字符。因此成为基于特征提取方法的手写汉字识别方法的一个缺点。 文献“Learned-Miller,Erik G.\Data driven image models through continuous joint alignment.\Journal IEEE Transactions on Pattern Analysis and Machine Intelligence 28.2(2006):236-250”中公开了一种图像校正技术——Congealing算法,该算法的目标是校正一组同类图像,减小该类图像间的差异,使之趋于相同。被校正的图像可以作为分类的模型用于识别过程。这是一个完全 ...
【技术保护点】
一种基于模糊熵的Congealing方法构造汉字字符的方法,其特征在于:随机选取某个字符类中的N张图像作为训练样本,训练步骤如下:步骤1:对N张训练字符图像分别初始化变换参数向量vj=(tx,ty,θ,sx,sy,hx,hy)=0(j=1toN),其中tx表示x方向的平移变换,ty表示y方向的平移变换,θ表示旋转变换,sx表示x方向的尺度变换,sy表示y方向的尺度变换,hx表示x方向的剪切变换,hy表示y方向的剪切变换。然后计算出相应的变换矩阵Uj:Uj=F(vj)=F(tx,ty,θ,sx,sy,hx,hy)=10tx01ty001cosθ-sin0sinθcosθ0001·esx000esy00011hx0010001100hy10001]]>步骤2:计算N张训练字符图像样本的模糊熵,步骤如下:1)图像栈IS中N张图像,每张有M个像素,表示图像栈中一个像素的值,xi表示一个像素栈图像栈中的每一张图像I∈IS被变换矩阵独立的改变,Uj表示第j个变换矩阵,xj′表示变换后的像素栈,i∈[1,M],j∈[1,N];2)利 ...
【技术特征摘要】
1.一种基于模糊熵的Congealing方法构造汉字字符的方法,其特征在于:随机选取
某个字符类中的N张图像作为训练样本,训练步骤如下:
步骤1:对N张训练字符图像分别初始化变换参数向量
vj=(tx,ty,θ,sx,sy,hx,hy)=0(j=1toN),其中tx表示x方向的平移变换,ty表示y方向
的平移变换,θ表示旋转变换,sx表示x方向的尺度变换,sy表示y方向的尺度变换,
hx表示x方向的剪切变换,hy表示y方向的剪切变换。
然后计算出相应的变换矩阵Uj: U j = F ( v j ) = F ( t x , t y , θ , s x , s y , h x , h y ) = 1 0 t x 0 1 t y 0 0 1 cos θ - sin 0 sin θ cos θ 0 0 0 1 · e s x 0 0 0 e s y 0 0 0 1 1 h x ...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。