文字辨识系统数据库的组建方法技术方案

技术编号:2890785 阅读:184 留言:0更新日期:2012-04-11 18:40
一种文字辨识系统数据库的组建方法,该系统主要包括信号输入装置、中央处理单元、主存储器、磁盘存储器及图象/声音输出介面;其数据库的组建方法包括以下步骤:输入每类字的训练样本;对每一训练样本抽取特征向量;对每类字元选取适当的参考模型个数及初始位置以及当训练样本比接近其真实字元的参考模型更接近某一错误字元的参考模型时,相关的参考模型的特征值向量被适当改变。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一套利用事先建构好的标准模型来辨认经由光学扫描器所输入的手写或印刷字形的系统与方法。特别是一种。字形识别通常被用于处理欲输入的人类眼睛可阅读的文字(那就是机器印刷或人类手写字形)。例如,许多电脑是以键盘敲打输入数据,其它电脑系统则以光学扫描机接收文件式输入数据。更有一些电脑系统是以光笔和数字板接收手写输入信号。这样的文字和手写输入装置可能为了各种原因而被提供出来。例如,使用者较习惯用手写方式输入而不愿使用键盘式输入。另外,键盘需要占用很大的空间,这使得它不能安装在小型、可携式电脑上(例如个人数字辅助器)。附图说明图1显示一套传统文字辨识系统10,其包括一个数字板和光笔18,一个光学扫描器16,或者两者都有。假如是前者,使用者将在数字板表面移动光笔,以图形表现的二维化数据。亦即,假如使用笔和纸,此动作将在纸上产生符号,而数字板及光笔18则以数字形式产生点数化影像。若辨识系统包含一个光学扫描器16,则可置放存有手写或机器印刷文字的纸张于其上,并产生以图形表现纸张上文字的二维化数据。数字板及光笔18或光学扫描器16数据输至输出输入介面14,而介面再将数据转输至系统10的总线12。文字辨识系统10包括一处理器(processor)或中央处理单元(CPU)20,一个主记忆体22,一个磁盘存储器24及一个视听输出装置26。任何一个装置20、22、24、26均连接到总线12以传输数据并从其他的装置或输出输入介面接收数据。视听输出装置26是以图象或声音的形式将信号传达给使用者。为此,视听输出装置26可以为一个阴极射线管、液晶显示器LCD显示板或扩音器。主存储器22及磁碟存储器24是做数据及程序储存用,而处理器20用来产生数据,处理器20在连接其他装置如12、14、16、18、22、24及26执行步骤以从输入的数据辨识文字。图2说明一个以图1的文字辨识系统10来执行的传统手写辨识过程。第一步骤32将接收输入的手写或机器印刷文字,例如,数字板18及光笔将使用者所写一个或更多的文字传输到输出输入介面14。或者,使用者将已有手写或机器印刷文字的纸张输入到光学扫描器16。再依序移转这些文字数据到输出输入介面14,而介面将经由系统总线12移转文字数据到,相应装置,如主存储器22。在步骤34中,处理器20将事先储存在主存储器22的输入文字数据进行处理。例如,处理器20可以经由丢弃小于最小临界值的小区块图象来除去杂信,处理器20也可能对输入字形图象做平滑化处理。接下来,在步骤36中,处理器20可选择性地将输入字形图象细化,然后将细化后的图象转换成具平均笔画宽度的图象。在步骤38中,处理器20分割文字图象成为大小不同的小区域范围以进行文字特征抽取。在此,“特征”代表任何有助于分辨不同文字的定量图象图形特性。在美国专利申请序号08/313,686中描述一种根据输入字形图象分布来进行文字分割的方法。例如,输入文字为手写数字“8”,则此输入方案“8”的图形可能被分割成如图3,4或5所示部分。在图形3中,8个区域321,322,326,327,341,342,346和347被形成。在图形4中,8个区域352,354,356,358,372,374,376和378被形成。在图5中,4个区域332,334,336和338被形成。在步骤40中,处理器20对每个输入图象抽取特征向量。美国专利申请序号08/313,686提供由图3到图5所分割的图象文字特征范例。这些说明性的特征被简单地描述如下。事实上,对每个文字图象同样方式的文字特征向量将被抽取出来。图6表示可用来描述笔画密度函数(SDF)的特征抽取法。首先处理器20在每一个待产生密度函数的区域中投射某一数目的扫描线,然后再计算在这区域中扫描线穿过文字笔画的次数。最后此区域的密度函数特征即为总穿越次数除以扫描线数目。图7描述周边背景面积(PBA)特征的抽取方法。首先处理器20计算下列方程式PBA=Σn=1NλnXm*Ym(1)]]>此处n为水平垂直轴点数指标,其值由1到输入文字在此n所对应轴的最大维次N。λn为于指标n由字形图象的外框矩形在水平或垂直方向扫描直到碰到第一个笔画点的空白点素数长度值。就如图7所示,处理器20从相对应的座标轴垂直地测量λn,变数m为一数值用来指示那一特殊区域正在计算PBA值。Xm表示这个区域m的水平长度,而Ym表示区域m的垂直长度。处理器20对每一区域321,322,326,327,341,342,346和347计算其垂直方向的PBA,同时对区域352,354,356,358,372,374,376和378计算水平方向的PBA。所以,共有16个特征值被抽取出来。参考图8,轮廓线特征(CLL)可由公式(2)计算得到,Δλn=λn+1-λnCLL1=Σn=1NΔλnXm+Ym]]>对每一个Δλn<0(2)CLL2=Σn=1NΔλnXm+Ym]]>,封每一個Δλn>0其中变数m’n’Xm’Ym’和λn已描述于PBA特征抽取段落中。处理器20对每一垂直和水平区域324,328,344和348得出的二个CLL(即CCL1和CLL2)特征值。所以,亦有16个特征值被抽取出来。参考图4,倾斜度特征(Gradient)被抽取出来。首先,处理器20对输入图象的第i行及第j列的图象点计算出其方向码Dirij。变数i和j分别表示水平轴(X)和垂直轴(y)的位置指标。这方向码为对应此图象点的法线向量。如图9所示,共有8个可能的方向码,每一个对应45度的角度,那就是0对应从337.5度到22.5度,1对应从22.5度到67.5度,2对应从67.5度到112.5度,3对应从112.5到157.5度,4对应从157.5度到202.5度,5对应从202.5度到247.5度,6对应从247.5度到292.5度,7对应从292.5度到337.5度。所以,处理器20以下列公式对每一区域产生一个长度向量Len(Dirij)Len=X2+Y2---(3a)]]>(Dirij-1)·π8≤tan-1(YX)≤(Dirij)·π8---(3b)]]>Σi=1IΣj=1JLenij(Dirij)Bddm(Dirij)]]>,封每一Dirij(3c)此处Bddm(Dirij)代表于第m区域中与方向Dirij垂直的边界宽度,而X和Y是经由下列二个3×3矩阵与图象做运算产生。 X Y(3d)处理器20以这二个矩阵对输入图象做运算则可获得Len和Dirij。然后再以方程式(3c)计算出每一区域中每一方向的长度值。例如倾斜度特征可从8个区域352,354,356,358,372,374,376和378抽取出来,而每一个区域包含有8个方向码的长度特征,故将产生64个特征值。在对一输入图象进行特征抽取以后,处理器20执行步骤42。在此步骤中,处理器20以本文档来自技高网...

【技术保护点】
一种文字辨识系统数据库的组建方法,其特征在于,包括以下步骤: 输入每类字的训练样本; 对每一训练样本抽取特征向量; 对每类字元,选取适当的参考模型个数及初始位置;以及 当训练样本比接近其真实字元的参考模型更接近某一错误字元的参考模型时,相关的参考模型的特征值向量会被适当的改变。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:黄雅轩
申请(专利权)人:财团法人工业技术研究院
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1