一种文字识别的方法和系统技术方案

技术编号：2941103 阅读：169 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种文字识别的方法和系统，首先获取变形图像矫正所需的几何特征参数；在变形图像上等距离绘制网格，并将网格点投影到成像平面；对每一个网格进行四边形变换，获得网格的矫正图像，并将所有网格的矫正图像拼接成最终矫正图像；确定要识别的文字段落区域，对应到最终矫正图像区域进行预处理，切分得到独立文字；对独立文字图像，采用基于灰度的识别算法进行识别。采用了本发明专利技术的技术方案，可以将变形图像复原成为原始状态，然后再进行图像文字提取并实现变形图像的识别。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理
，尤其涉及一种文字识别的方法和系统。
技术介绍
目前光学字符识别(OCR)技术已经非常成熟并形成了一系列的产品，其中中文OCR识别技术己经在生产生活中得到广泛应用，中文印刷体的识别率可以达到98%以上。但是目前的OCR技术只能处理从扫描仪得到的高清晰度图像，从扫描仪获取的图像，是在源文档完全平整的条件下获取的，因此几乎不会存在几何失真，所得图像值可能在角度上存在一定的倾斜，对于这种倾斜的校正处理实际上已经相当成熟，几乎所有针对扫描仪的商业化OCR软件或者文档采集软件都具备相应的功能。一个汉字识别系统大体上可分为输入、预处理、识别、后处理和输出共五个部分。脱机汉字识别系统的对象是印(写)在纸上的文字。它的输入装置可以是扫描仪、传真机、一般摄像机或数字相机等。这些输入装置通常把印在纸上的图文整页地输入计算机。预处理的主要作用不但要把页面上的图文分开，还必须把所有文字逐个分离。在正常情况下，各行文字的投影之间有一空隙。利用这些间隔可以实现行切割，把各行文字分开。同理把每一行文字向垂直方向投影也可以得到投影图。汉字通常是矩形，彼此间有间隔，因此利用各行的垂直投影进行字切割也不困难。对某一待识字进行识别时，一般必须将该字按一定准则，与存储在机内的每一个标准汉字模板逐一比较，找出其中最相似的字，作为识别的结果。显然，4汉字集合的字量越大，识别速度越低。为了提高识别速度，常采用树分类，即多级识别方法，先进行粗分类，再进行单字识别。因此识别模块包含粗分类和单字识别两部分。粗分类的作用是把整个汉字集合划分为若干个较小的子集，叫做候选集。...

【技术保护点】
一种文字识别的方法，其特征在于，包括以下步骤：　Ａ、获取变形图像矫正所需的几何特征参数；　Ｂ、在所述变形图像上等距离绘制网格，并将网格点投影到成像平面；　Ｃ、对每一个网格进行四边形变换，获得所述网格的矫正图像，并将所有网格的矫正图像拼接成最终矫正图像；　Ｄ、确定要识别的文字段落区域，对应到最终矫正图像区域进行预处理，切分得到独立文字；　Ｅ、对所述独立文字图像，采用基于灰度的识别算法进行识别。

【技术特征摘要】

【专利技术属性】
技术研发人员：张岩，于啸，
申请(专利权)人：北京文通科技有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人