用于图像文字识别的字符图片自动切分系统技术方案

技术编号：15280345 阅读：270 留言：0更新日期：2017-05-05 08:08

本发明专利技术涉及图像识别处理领域，特别涉及用于图像文字识别的字符图片自动切分系统；包含图像输入模块，二值化转化模块和字符切分模块；图像输入模块将需要识别的图像输入到二值化转化模块中进行二值化转化后输入字符切分模块中，所述字符切分模块在进行字符切分时，采用层层判断过滤切分的方式，对于粘连的字符和左右结构的字符进行自动判断和切分，在进行粘连字符切分时，将切分位置与字符边缘的距离作为了确定切分点的考虑因素；切分的准确率更高；对于左右结构的汉字字符本发明专利技术系统能够自动进行识别和合并，字符的切分结果更加合理准确。用户自需要将待识别字符输入本系统中就能完成图像文字字符的自动切分，为图像文字识别和处理提供有力工具。

Character image automatic segmentation system for image character recognition

The present invention relates to image processing field, especially for character image automatic segmentation system of image character recognition; image input module, binarization transformation module and character segmentation module; the image input module will need to identify the input image binarization transformation binarization transformation input character segmentation module module and the character segmentation module in character segmentation, the segmentation layers determine the filter, automatic judgment and segmentation of adhesion for the characters and about the structure character, the character segmentation, the segmentation position and character edge distance as determined considering the segmentation points; the accuracy of segmentation more about the structure of the Chinese characters; character system of the invention can automatically identify and merge, character segmentation is more accurate and rational . The user needs to be able to recognize the characters into the system can be completed in the automatic segmentation of the image text characters, image text recognition and processing to provide a powerful tool.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术图像识别领域，特别涉及用于图像文字识别的字符图片自动切分系统。
技术介绍
随着社会的发展和科技的进步，人类创造的知识正以指数级的数量增加，在电子书籍出现之前，大部分的知识是以图书的方式进行传承，中华上下五千年，产生了大量优秀书籍，这些书籍在历史的长河中，或多或少都遭到了不同程度的损坏，因此对这些书籍进行数字化存储迫在眉睫；在图书管理领域，书籍内容的快速搜索对于快速定位书籍很有帮助，而由于书籍数量太多，加上早期印刷的图书没有作者的电子文稿，因此纸质书籍的电子化很有必要。光学字符识别软件就是处理这种纸质图书到电子文档转化的利器，其主要利用大量的字符样本，经过复杂网络的学习，生成相应的模型文件，从而达到识别图片中字符的目的。光学字符识别软件主要功能是识别拍摄、扫描图片中的字符，现有技术中在进行图像中文字的识别时，首先需要将图像中的字符串切分开，形成包含单个文字的小图片，然后使用一定的方法对切分后的文字进行识别。而进行文字切分最常用的方法为投影法，即是将图像文字二值化处理后，通过垂直投影法找到两个文字之间的分界线，根据分界线将文字切分开来。然而当图像中的文字之...
用于图像文字识别的字符图片自动切分系统

【技术保护点】
用于图像文字识别的字符图片自动切分系统，其特征在于，包含图像输入模块，二值化转化模块和字符切分模块；图像输入模块将需要识别的图像输入到二值化转化模块中进行二值化转化后输入字符切分模块中；所述字符切分模块在进行字符切分时包含以下实现过程：(1)使用投影法待识别图像文字进行切分，切分成子图片序列；将其中的数字、字母和标点符号标记出来；(2)对未标记的子图片进行判断：是否满足L≤M*h，L为子图片字符投影的宽度，M为系数，h为行高；对于不满足条件的子图片进行切分，切分位置根据以下公式进行确定：f(x)＝g(x)t(x)g(x)=11+e-0.01|x-h|]]>重复执行步骤(2)，直到序列中未标记的...

【技术特征摘要】
1.用于图像文字识别的字符图片自动切分系统，其特征在于，包含图像输入模块，二值化转化模块和字符切分模块；图像输入模块将需要识别的图像输入到二值化转化模块中进行二值化转化后输入字符切分模块中；所述字符切分模块在进行字符切分时包含以下实现过程：(1)使用投影法待识别图像文字进行切分，切分成子图片序列；将其中的数字、字母和标点符号标记出来；(2)对未标记的子图片进行判断：是否满足L≤M*h，L为子图片字符投影的宽度，M为系数，h为行高；对于不满足条件的子图片进行切分，切分位置根据以下公式进行确定：f(x)＝g(x)t(x)g(x)=11+e-0.01|x-h|]]>重复执行步骤(2)，直到序列中未标记的子图片均满足条件：L≤M*h；(3)对于序列中数字、字母和标点字图片以外的相邻两子图片的总宽度进行判断：是否满足L合≤M*h；如果满足，依序对满足条件的相邻子图片进行合并；重复执行步骤(3)直到除数字、字母和标点以外的相邻子图片总宽度均...

【专利技术属性】
技术研发人员：景亮，刘世林，唐涔轩，康青杨，
申请(专利权)人：成都数联铭品科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人