残缺印刷体数字字符的识别方法技术

技术编号：2932377 阅读：375 留言：0更新日期：2012-04-11 18:40

一种残缺印刷体数字字符的识别方法，用于图像识别领域。方法如下：先将整个字符轮廓分解为上、下、左和右四个局部轮廓，并用图像边框到字符轮廓的轮廓像素点的位置坐标集合表示轮廓，分别对上、左和右的轮廓轮廓像素点的位置坐标进行一次离散微分，根据一次离散微分分析轮廓曲线的趋势变化，从剩余的上、左和右轮廓中提取集元结构特征，此外，利用左右轮廓统计字符的宽度，利用上下轮廓统计字符高度，统计字符的高宽比和在０．５Ｈ范围内统计笔画数目，字符的轮廓结构特征和统计特征相结合，为数字字符建立模型后，采用结构语句识别方法残缺数字字符。该方法能够实现底部残缺和完整数字字符的正确识别，提高了实际应用中数字字符识别的正确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及的是一种文字识别方法，特别是一种。用于图像识别领域。
技术介绍
近年来文字识别技术广泛运用于各个工程领域，文字识别的研究业取得了巨大的成就，印刷体的文字识别正确率高达99％。但是，实际应用中存在着部分残缺的字符，残缺字符和完整字符混合在一起，给文字识别造成了困难。经文献检索发现，Pasquale Foggia等人在《Image and Vision Computing》(1999，17(9)，701-711.)(《图像与视觉计算机》)上发表的“Combining statisticaland structural approaches for handwritten character description”(“统计与结构方法相结合的手写体字符描述”)，该文中所提出的方法，先先从手写体字符中提取结构基元，然后用统计的方法对结构基元进行特征描述，最后采用神经网络进行手写体识别。该文涉及的技术主要存在以下缺陷和不足(1)算法仅适用于手写体的文字识别，虽然能有效克服手写体的字符变形，但对于残缺字符的变形无能为力；(2)残缺字符的笔画丢失会减少字符原有的结构基元；(3)残缺字符的笔画丢失同时还会改变字符原本的结构基元，使得用统计方法对基元特征进行描述的时候发生畸变；(4)神经网络的识别方法必须事先确定输入特征向量的维数，但残缺字符的残缺程度不同会影响特征向量的维数。
技术实现思路
本专利技术的目的在于克服现有文字识别技术中的不足，提供一种，使其能够对残缺的印刷体数字字符进行准确的识别。本专利技术是通过以下技术方案实现的，本专利技术方法如下先将整个字...

【技术保护点】
一种残缺印刷体数字字符的识别方法，其特征在于，将整个字符轮廓分解为上、下、左和右四个局部轮廓，并用图像边框到字符轮廓的轮廓像素点的位置坐标集合表示轮廓，分别对上、左和右的轮廓像素点的位置坐标进行一次离散微分，根据一次离散微分分析轮廓曲线的趋势变化，定义５个结构集元，包括竖直Ｖ、左斜Ｌ、右斜Ｒ、圆弧Ｃ和突变Ｐ，并从剩余的上、左和右轮廓中提取集元结构特征，此外，利用左右轮廓统计字符的宽度Ｗ，利用上下轮廓统计字符高度Ｈ，最后在０．５Ｈ范围内统计笔画数目，字符的轮廓结构特征和统计特征相结合，为数字字符建立模型后，采用结构语句识别方法残缺数字字符。

【技术特征摘要】

【专利技术属性】
技术研发人员：胡小锋，叶庆泰，徐榕，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：31[中国|上海]

全部详细技术资料下载我是这个专利的主人