图像文字识别系统技术方案

技术编号:15392157 阅读:378 留言:0更新日期:2017-05-19 05:08
本发明专利技术涉及图像识别处理领域,特别涉及图像文字识别系统;包含图像文字切分模块,特征图片生成模块,存储模块,归一化处理模块和图像文字识别模块;所述图像文字切分模块将待处理图像切分成各个仅包含单个字符的子图片存储于存储模块中;所述特征图片生成模块,根据用户选择的待识别图像文字的字体,制作出对应的字符特征图片存储于所述存储模块中;所述归一化处理模块提取存储于存储模块中的特征图片和待识别子图片,根据对应的类型,进行归一化处理,并将处理后的图片信息存储于存储模块中;所述图像文字识别模块,提取存储模块中的子图片,采用异或算法计算子图片与特征图片的符合程度,进而实现子图片字符内容的识别,并将识别结果输入。

Picture character recognition system

The present invention relates to image processing field, in particular to the text image; image contains text segmentation module, feature image generation module, memory module, normalization processing module and image character recognition module; the image character segmentation module will be processed into each image contains only a single character sub images are stored in a memory module; the characteristics of image generation module, according to the user to select the image text font, making out the corresponding character images stored in the memory module; the normalization module extraction are stored in a memory module features pictures and pictures Besshi unknown, according to the corresponding types, and are normalized. The processed image information stored in the storage module; the image character recognition module, storage module sub extraction The algorithm uses XOR algorithm to calculate the degree of coincidence between the sub pictures and the feature pictures, and then realizes the recognition of the content of the sub picture characters, and inputs the recognition results.

【技术实现步骤摘要】
图像文字识别系统
本专利技术图像识别领域,特别涉及图像文字识别系统。
技术介绍
随着社会的发展和科技的进步,人类创造的知识正以指数级的数量增加,在电子书籍出现之前,大部分的知识是以图书的方式进行传承,中华上下五千年,产生了大量优秀书籍,这些书籍在历史的长河中,或多或少都遭到了不同程度的损坏,因此对这些书籍进行数字化存储迫在眉睫;在图书管理领域,书籍内容的快速搜索对于快速定位书籍很有帮助,而由于书籍数量太多,加上早期印刷的图书没有作者的电子文稿,因此纸质书籍的电子化很有必要。光学字符识别软件就是处理这种纸质图书到电子文档转化的利器,其主要利用大量的字符样本,经过复杂网络的学习,生成相应的模型文件,从而达到识别图片中字符的目的。光学字符识别软件主要功能是识别拍摄、扫描图片中的字符,现有技术中在进行图像中文字的识别时,首先需要将图像中的字符串切分开,形成包含单个文字的小图片,然后使用一定的方法对切分后的文字进行识别。而进行文字切分最常用的方法为投影法,即是将图像文字二值化处理后,通过垂直投影法找到两个文字之间的分界线,根据分界线将文字切分开来。然而当图像中的文字之间具有粘连,且图像中包含左右结构的汉字时,简单的投影方法就很难实现较好的切分效果;正是因为这个原因使得切分一直是OCR识别的难点,切分的质量将直接影响到文字的识别效果。此外光学字符识别软件主要功能是识别拍摄、扫描图片中的字符,对于一些特殊字体的扫描件,公章,拍照,比如早期印刷的书籍,政府单位制作的证件等,由于历史原因以及保密与安全需要,其字体往往是特制的,现有的光学字符识别软件主要集中于机器学习的方法,模型运算量大,而且由于训练字体样本没有覆盖到特殊字体,导致特殊字体的识别准确率不高,严重影响纸质文档的电子化。现有技术大多采用神经网络机器学习算法对字符进行识别,需要制作大量的样本,耗费大量的时间进行训练,且生成的模型文件非常庞大,且对于不同字体的字符,识别率不尽相同,对于某些特殊字体字符,识别率比较低,很难满足一些特殊场景下的字符识别。
技术实现思路
本专利技术的目的在于克服现有技术中所存在的上述不足,提供图像文字识别系统,根据用户选择的字体生成对应的特征图片,在对待识别图像文字进行有效切分的基础上,结合针对性的字符特征图片实现待识别图像文字的自动识别。为图像文字识别提供快捷工具。为了实现上述专利技术目的,本专利技术提供了以下技术方案:图像文字识别系统,所述系统图像文字识别包含以下实现步骤:(1)将待识别图像文字切分成仅包含单个字符的子图片;将其中的数字、字母和标点符号,文字子图分别标记出来;(2)在每个数字、字母和标点对应的子图片中选择一张子图片,将子图中的字符,分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;根据待识别图像选择对应字体,生成样本图片,对样本图片中的字符分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;(3)将特征图片和待识别图片进行归一化处理:将特征图片和待识别子图片的图片尺寸调整成相同大小,并对各图片中的各个像素灰度值根据设置的阈值分别转化成0或者1(将图片中0-255的灰度值,根据设置的阈值,转化为0或1)将转化后的像素值按位置存储于存储模块中;(4)将待识别子图片与对应类型的特征图片进行对比,同一像素位置的值执行异或处理,统计1出现的次数,记为误差频次,将误差频次最小的特征图片对应的标注作为识别结果进行输出。具体的,所述系统在所述步骤(4)中,将待识别的数字、字母和标点子图片与数字、字母和标点特征图片进行对比,同一像素位置的值执行异或处理,统计1出现的次数,记为误差频次,将误差频次最小的特征图片对应的标注作为识别结果进行输出;对待识别文字字符子图片与对应的文字特征图片进行对比,同一像素位置的值执行异或处理,统计1出现的次数,记为误差频次,将误差频次最小的特征图片对应的标注作为识别结果进行输出。进一步的,n*h<l<N*h。进一步的,n≤1/4。进一步的,文字字符图片的切分包含以下实现过程:使用投影法找出文字字符图片的初始切分位置,根据初始切分位置将待识别图像片切分成初始子图片序列;对序列中的初始子图片使用如下规则进行处理:A、使用投影法待识别图像文字进行切分,切分成子图片序列;将其中的数字、字母和标点符号标记出来;B、对未标记的子图片进行判断:是否满足L≤M*h,L为子图片字符投影的宽度,M为系数,h为行高;对于不满足条件的子图片进行切分,切分位置根据以下公式进行确定:f(x)=g(x)t(x)重复执行步骤B,直到序列中未标记的子图片均满足条件:L≤M*h;C、对于序列中数字、字母和标点字图片以外的相邻两子图片的总宽度进行判断:是否满足L合≤M*h;如果满足,依序对满足条件的相邻子图片进行合并;重复执行步骤C直到除数字、字母和标点以外的相邻子图片总宽度均不满足L合≤M*h;D、对序列中未标记的子图片进行判断:如果序列中存在三个相邻的子图片,且三个子图片满足:第一子图片和第三子图片的宽度L≤0.5h,且中间子图片的宽度L≥h,则将中间子图片根据公式:f(x)=g(x)t(x)所确定的切分点进行切分;根据确定的切分点,将中间子图片切分成第一中间子图片和第二中间子图片;将第一子图片和第一中间子图片合并;将第二中间子图片和第三子图片合并。进一步的,0.9≤M≤1.3。作为一种优选:M=1.2。进一步的,所述系统为加载有上述图像文字识别功能程序的计算机或服务器。与现有技术相比,本专利技术的有益效果:本专利技术提供图像文字识别系统,根据用户选择的字体,构造原始特征图片,在原始特征图片的基础上,将图片中的字符分别向不同方向移动设定的距离,制成对应的特征模板;这样制成的特征模板能够更好的适应字符图片切分不完美的情况,因而具有更好的容错性。在特征图片的基础上,用异或算法来识别待识别子图片与特征模板的相似程度,计算过程简单方法,识别效率和可靠性较高。此外,本专利技术采用了逐级的来判断切分后的子图片的切分质量,并对切分后的子图片进行相应的处理,层层筛选和处理的方式,保证子图片的切分质量;为最终的识别率,进一步准备了条件。此外相比于传统的切分方法,本专利技术系统在幅值的基础上引入了修正值,将切分位置与字符边缘的距离作为了确定切分点的考虑因素,因此具有更高的准确性,而且当遇到特殊结构字符时出现多个较小值,或者极值点时,通过本公式可以快速的找出最优化的切分点,增加了切分的准确性,提高了切分的效率;对粘连字符的切分效果更好。在特征图片和图像字符的基础上,采用异或算法来识别待识别子图片与特征模板的相似程度,计算过程简单方法,识别效率和可靠性较高。附图说明:图1为本图像文字识别系统的系统结构示意图。图2为本系统的图像文字识别的实现步骤或信号流程示意图。图3为数字模板的制作示意图。图4为文字模板的制作示意图。具体实施方式下面结合试验例及具体实施方式对本专利技术作进一步的详细描述。但不应将此理解为本专利技术上述主题的范围仅限于以下的实施例,凡基于本
技术实现思路
所实现的技术均属于本专利技术的范围。本专利技术系统提供图像文字识别系统,如图1所示,包含图像文字切分模块,特征图片生本文档来自技高网
...
图像文字识别系统

【技术保护点】
图像文字识别系统,其特征在于,所述系统实现图像文字识别包含以下实现步骤:(1)将待识别图像文字切分成仅包含单个字符的子图片;将其中的数字、字母和标点符号,文字子图分别标记出来;(2)在每个数字、字母和标点对应的子图片中选择一张子图片,将子图中的字符,分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;根据待识别图像选择对应字体,生成样本图片,对样本图片中的字符分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;(3)将特征图片和待识别图片进行归一化处理,并将各图片的像素对应值,按位存储于存储模块中;(4)将待识别子图片与对应类型的特征图片进行对比,同一像素位置的值执行异或处理,统计1出现的次数,记为误差频次;将误差频次最小的特征图片对应的标注作为识别结果进行输出。

【技术特征摘要】
1.图像文字识别系统,其特征在于,所述系统实现图像文字识别包含以下实现步骤:(1)将待识别图像文字切分成仅包含单个字符的子图片;将其中的数字、字母和标点符号,文字子图分别标记出来;(2)在每个数字、字母和标点对应的子图片中选择一张子图片,将子图中的字符,分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;根据待识别图像选择对应字体,生成样本图片,对样本图片中的字符分别向上、下、左、右、左上、左下、右上和右下移动设定距离l,制成对应的特征图片,并对制成的特征图片进行对应的标注;(3)将特征图片和待识别图片进行归一化处理,并将各图片的像素对应值,按位存储于存储模块中;(4)将待识别子图片与对应类型的特征图片进行对比,同一像素位置的值执行异或处理,统计1出现的次数,记为误差频次;将误差频次最小的特征图片对应的标注作为识别结果进行输出。2.如权利要求1所述的系统,其特征在于,n*h<l<N*h。3.如权利要求2所述的系统,其特征在于,n≤1/4。4.如权利要求1所述的系统,其特征在于,所述系统,中的归一化处理过程包括:将特征图片和待识别子图片的图片尺寸调整成相同大小;对各图片中的各个像素灰度值根据设置的阈值分别转化成0或者1,将转化后的像素值按位置存储于存储模块中。5.如权利要求1至4之一所述的系统,其特征在于,文字字符图片的切分包含以下实现过程:...

【专利技术属性】
技术研发人员:景亮康青杨唐涔轩刘世林
申请(专利权)人:成都数联铭品科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1