一种点密度非线性归一化文字识别方法和装置制造方法及图纸

技术编号:4039463 阅读:423 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种点密度非线性归一化文字识别方法和装置,所述方法包括:针对用户输入的当前文字的手写轨迹,获取该手写轨迹的外接矩形;判断所述外接矩形的宽高比是否在预置比值范围之内;若是,则将外接矩形扩大为正方形,并在该正方形的二维坐标平面内对手写轨迹的各个像素点进行点密度非线性归一化处理,获得各个像素点归一化后的坐标;若否,则直接在所述外接矩形的二维坐标平面内对手写轨迹的各个像素点进行点密度非线性归一化处理,获得各个像素点归一化后的坐标。通过本发明专利技术能够减少文字识别中的变形、失真,提高识别的可靠性。

【技术实现步骤摘要】

本专利技术涉及手写识别
,特别是涉及一种点密度非线性归一化文字识别方 法和装置。
技术介绍
在手写识别中,需要对用户输入的汉字进行预处理,由于字符大小不一,为了便于 提取字符特征,需要对样本进行大小归一化。归一化可分为线性归一化和非线性归一化两 种方法。线性归一化就是将文字图像按照一定的比例系数线性放大或缩小,其中X方向和 Y方向的比例系数可以相同也可以不同。一般的做法是将每一个字符块调节到一个正方形 内,即先用一个框将字符块围起来,然后将方框拉伸为正方形,此方法主要是基于汉字为方 块字的假设。这种方法采用的算法简单、失真较小,但是无法调整手写汉字的中心位置和笔 划密度。“人”是一个标准的方块汉字,一般而言不同的两个人书写出的这个汉字只有大小 之分,在做完线性归一化将字符归一化到相同尺寸,比如说100*100的范围,从ζ轴上看它 们的重合程度非常大,用一个非常简单的判别算法也能够判断出这两个字是非常相似的。 不同人的书写习惯不同,有的人写得胖,有的人写的瘦,经线性归一化后,仍然可以看到很 大的重合度。但有些人写字非常拖,一捺拉得很长,一撇只能占到整个字符的三分之一宽 度,这时如果经采用线性归一化,再从ζ轴上看,就会发现只有一撇的收笔部分会有些重 合。为了解决这个问题,可以采用基于点密度的非线性归一化算法。非线性归一化强调按照手写汉字的特征分布来处理,它是在一个二维平面上,沿 着X轴和y轴分别计算每个坐标点上的点密度,然后利用映射函数,可以计算原坐标(X,y) 在平面上新的坐标点(χ’,y’)。这种点密度的非线性归一化算法,能够一定程度上消除不 同人,不同时间,不同设备环境下书写出的相同汉字的变形,从而为识别算法减轻压力。但在非线性归一化方法也会带来汉字的变形问题。比如“ I,,“一”等非标准的方 块字符,如果是严格的印刷体汉字,经非线性归一化算法,得到的仍是竖或者横。但是在手 写识别中,由于用户手写轨迹不规则,那么,在竖和横稍有倾斜的情况下,“ I ”经非线性归一 化后得到的是撇或者捺,“一”经非线性归一化得到的则是提或者捺。又如,撇和捺等非标准 的方块汉字,经非线性归一化后得到的是严格意义上45°或者135°倾斜的撇或者捺,原 有的倾斜角度差异不再出现。此外,又如“日”等汉字,经非线性归一化得到的是一个满格 的“曰”字,最后识别时将无法区分“日,,和“曰”。总之,需要本领域技术人员迫切解决的一个技术问题就是如何能够提供一种文 字识别技术,可以减少文字的变形失真,提高识别的可靠性。
技术实现思路
本专利技术所要解决的技术问题是提供一种点密度非线性归一化文字识别方法和装 置,能够减少文字的变形、失真,提高识别的可靠性。为了解决上述问题,本专利技术公开了一种点密度非线性归一化文字识别方法,包 括针对用户输入的当前文字的手写轨迹,获取该手写轨迹的外接矩形;判断所述外接矩形的宽高比是否在预置比值范围之内;若是,则将外接矩形扩大为正方形,并在该正方形的二维坐标平面内对手写轨迹 的各个像素点进行点密度非线性归一化处理,获得各个像素点归一化后的坐标;若否,则直接在所述外接矩形的二维坐标平面内对手写轨迹的各个像素点进行点 密度非线性归一化处理,获得各个像素点归一化后的坐标。进一步,所述点密度非线性归一化处理包括将手写轨迹的各个像素点分别向X轴和Y轴投影,计算X轴上投影到各个坐标点 的点密度fm,以及Y轴上投影到各个坐标点的点密度gn ;其中,按照正方形或外接矩形的宽 度在X轴上依次取M个坐标点,按照正方形或外接矩形的高度在Y轴上依次取N个坐标点; m = 1,2,3......M ;η = 1,2,3......N ;依次计算X轴上各个坐标点对应的横向归一密度Hm,以及Y轴上各个点对应的纵 向归一密度 Vn ;其中,Hm = f\+f2+......+fffl ;Vn = gl+g2+......+gn;依次计算手写轨迹的各个像素点归一化后的横坐标X和纵坐标Y ;其中,X(m,n)= W1 (Hm-H1) /Hm ;Y (m, n) = W2 (Vn-V1) /Vn 和W2为非线性归一化后正方形的宽度和高度。优选的,正方形或外接矩形的左下顶点位于二维坐标平面上的(1,1)点;则按照 正方形或外接矩形的宽度在X轴上从(1,0)点开始依次取M个坐标点;按照正方形或外接 矩形的高度在Y轴上从(0,1)点开始依次取N个坐标点。优选的,所述点密度为坐标点上投影得到像素点的个数加上密度系数;其中,所 述密度系数的取值范围为1 2。优选的,所述预置比值的范围为大于等于第一预置比值,以及小于等于第二预置 比值;其中,所述第一预置比值的范围为2 3,所述第二预置比值的范围为0. 5 0. 333。进一步,将外接矩形扩大为正方形具体为当所述外接矩形的宽高比大于等于第一预置比值时,外接矩形的宽度不变,高度 增大至与宽度等值;当所述外接矩形的宽高比小于等于第一预置比值时,外接矩形的高度不变,宽度 增大至与高度等值。此外,本专利技术还公开了一种点密度非线性归一化文字识别装置,包括外接矩形获取单元,用于针对用户输入的当前文字的手写轨迹,获取该手写轨迹 的外接矩形;宽高比判断单元,用于判断所述外接矩形的宽高比是否在预置比值范围之内;若 是,则触发矩形扩大单元;若否,则触发非线性归一化单元;矩形扩大单元,用于将外接矩形扩大为正方形,并触发非线性归一化单元;非线性归一化单元,用于在正方形或外接矩形的二维坐标平面内对手写轨迹的各 个像素点进行点密度非线性归一化处理,获得各个像素点归一化后的坐标。进一步,所述非线性归一化单元包括点密度计算子单元,用于将手写轨迹的各个像素点分别向X轴和Y轴投影,计算X轴上投影到各个坐标点的点密度fm,以及Y轴上投影到各个坐标点的点密度gn ;其中,按照 正方形或外接矩形的宽度在X轴上依次取M个坐标点,按照正方形或外接矩形的高度在Y 轴上依次取N个坐标点;m= 1,2,3......M;n = 1,2,3......N ;归一密度计算子单元,用于依次计算X轴上各个坐标点对应的横向归一密 度民,以及Y轴上各个点对应的纵向归一密度Vn;其中,Hm = f\+f2+......+fm;Vn =gl+g2+......+gn ;归一坐标计算子单元,用于依次计算手写轨迹的各个像素点归一化后的横坐标X 和纵坐标 Y ;其中,X (m,n) = W1 (Hm-H1) /Hm ;Y (m, η) = W2 (Vn-V1) /Vn 和 W2 为非线性归一化 后正方形的宽度和高度。优选的,所述点密度为坐标点上投影得到像素点的个数加上密度系数;其中,所 述密度系数的取值范围为1 2。优选的,所述预置比值的范围为大于等于第一预置比值,以及小于等于第二预置 比值;其中,所述第一预置比值的范围为2 3,所述第二预置比值的范围为0. 5 0. 333。与现有技术相比,本专利技术具有以下优点本专利技术获得当前文字的手写轨迹的外接矩形后,不同于现有技术,直接在手写轨 迹的外接矩形框内对各个像素点进行非线性归一化处理,而是计算该外接矩形的宽高比, 以宽高比作为判断条件,执行不同的操作步骤当宽高比不在预置比值范围之内时,该手写 轨迹的宽度和高度相差不大,则直接进行点密本文档来自技高网
...

【技术保护点】
一种点密度非线性归一化文字识别方法,其特征在于,包括:针对用户输入的当前文字的手写轨迹,获取该手写轨迹的外接矩形;判断所述外接矩形的宽高比是否在预置比值范围之内;若是,则将外接矩形扩大为正方形,并在该正方形的二维坐标平面内对手写轨迹的各个像素点进行点密度非线性归一化处理,获得各个像素点归一化后的坐标;若否,则直接在所述外接矩形的二维坐标平面内对手写轨迹的各个像素点进行点密度非线性归一化处理,获得各个像素点归一化后的坐标。

【技术特征摘要】

【专利技术属性】
技术研发人员:李健张连毅武卫东
申请(专利权)人:北京捷通华声语音技术有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1