【技术实现步骤摘要】
本专利技术属于模式识别、人工智能和文字信息处理领域,特别涉及一种基于拟合函数的文字识别方法。
技术介绍
随着计算机技术的推广应用,尤其是互联网的日益普及,人类越来越多地依靠计 算机获得各种信息。大量地信息处理工作也都转移到计算机上进行。在日常的生活和工作 中,存在着大量的文字信息处理问题,因而将文字信息快速输入到计算机这一要求变得非 常迫切。 现在一般的文字识别算法是基于对待识别图形的点阵分析,对构成文字的线条较 复杂的文字进行识别有很大的局限性,例如对汉字有专门的汉字识别方法,对字母有专门 的字母识别方法,即使用同一类算法思想也是需要不同的程序来实现。尤其将多种类型符 号混在一起时,大部分算法都很难识别出来。如果是手写输入,识别的难度就更大。 现有的通用文字识别算法,例如模板匹配算法, 一般用训练样本特征的平均值来 描述,分类器根据输入样本特征与各个文字的参照特征的距离进行识别。由于汉字存在各 种各样字体,手写汉字中还存在各种各样的变形,因此文件的任何特征都存在一个分布空 间。只有把这些分布考虑进去,才能更精确地进行分类识别,因此只用特征平均值来描述特 征 ...
【技术保护点】
一种基于拟合函数的文字识别方法,其特征在于包括如下步骤:(1)在联机或者在离线的情况下读入待识别的文字样本;(2)文字图像预处理:首先将步骤(1)所述的待识别的文字样本图像二值化,然后线条消抖,再进行断点连接,最后把文字图像规范化;(3)分析样本:先从步骤(2)所述的规范化后的待识别的文字样本图像中拆分出文字笔画,然后将拆分出的每个笔画归类到笔画集中,并以此生成可识别的符号序列;对笔画集中的每条线段寻找特征点,根据特征点集拟合多项式找出最佳拟合函数,选取最佳拟合函数的系数作为最佳拟合向量;用最佳拟合向量匹配笔画写入符号向量;(4)识别样本:首先根据步骤(3)所述的符号序列在 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:皮德常,彭立勋,王明涛,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:84
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。