基于OCR识别的文本字符分割方法及系统技术方案

技术编号：32106645 阅读：19 留言：0更新日期：2022-01-29 18:48

本发明专利技术特别涉及一种基于OCR识别的文本字符分割方法，包括如下步骤：S100、使用OCR算法对文本进行识别得到索引、内容和置信度信息；S200、对任一文本检测行，进行漏识别字符添加并确定所有字符索引位置；S300、对上述索引位置进行处理得到每个字符的位置信息；S400、对内容为符号的字符位置信息进行偏移调整；S500、根据相邻的两个位置信息计算分割位置；S600、根据分割位置对字符进行分割和切边得到每个字符的边框信息；S700、根据每个字符的置信度信息以及边框大小剔除噪点，余下的即为正确分割的字符。这里根据已有成熟算法的输出结果进行一系列处理，从而实现对文本中字符的准确分割，分割时不会遗漏字符且分割位置非常精准。准。准。

全部详细技术资料下载

【技术实现步骤摘要】
基于OCR识别的文本字符分割方法及系统

[0001]本专利技术涉及文本处理
，特别涉及一种基于OCR识别的文本字符分割方法及系统。

技术介绍

[0002]OCR（Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。
[0003]OCR技术非常的成熟，比如论文Detecting Text in Natural Image with Connectionist Text Proposal Network（Zhi Tian, Weilin Huang, Tong He, Pan He, Yu Qiao，ECCV (8) 2016:56
‑
72）中就公开了一种经典的文本检查算法，其在进行文本字符识别时，对任一文本检测行，其会分成多个一定宽度的小框，并对每个小框中的内容进行模板匹配，识别过程中会输出每个小框的索引、内容及置信度信息，然后根据这些信息识别文本并输出。并且，更多的人在此基础上进行改进，提供了更多可靠且有效的算法，使得文本字符的识别技术更加成熟。
[0004]针对文本的隐形水印技术，近些年开始逐渐成熟起来，其基本的原理就是通过对字符进行轻微变形，这种变形在肉眼上很难...

【技术保护点】

【技术特征摘要】
1.一种基于OCR识别的文本字符分割方法，其特征在于：包括如下步骤：S100、使用OCR算法对文本进行识别得到索引、内容和置信度信息；S200、对任一文本检测行，根据索引的内容及置信度信息对漏识别字符进行添加后再记录非空内容置信度最大处的索引位置；S300、对上述索引位置进行处理得到每个字符的位置信息；S400、根据字符内容对内容为符号的字符位置信息进行偏移调整，调整后的位置信息为；S500、根据位置信息和计算分割位置，其中；S600、根据行首位置、行尾位置以及步骤S400计算得到的分割位置对该行中的字符进行分割和切边得到每个字符的边框信息；S700、根据每个字符的置信度信息以及边框大小剔除噪点，余下的即为正确分割的字符。2.如权利要求1所述的基于OCR识别的文本字符分割方法，其特征在于：所述的步骤S200中：若连续出现a个置信度均低于设定阈值的索引位置，则判定其为漏识别字符；针对任一字符，记录该字符对应的多个置信度中置信度最大处的索引位置。3.如权利要求1所述的基于OCR识别的文本字符分割方法，其特征在于：所述的步骤S300中，根据神经网络LSTM时间长度以及文本检测行尺寸信息进行特征逆计算，将索引位置放大与文本检测行图像变换后的矫正图的尺寸信息形成映射关系，并根据该映射关系将索引位置处理成字符位置信息。4.如权利要求1所述的基于OCR识别的文本字符分割方法，其特征在于：所述的步骤S500中，包括如下步骤：S510、根据位置信息和计算中心位置；S520、记朝向一侧偏移的位置分别为，朝向一侧偏移的位置分别为；S530、计算所有位置处一列像素中空白位置像素的占比，其中；S540、取最大值时所对应的位置即为分割位置。5.如权利要求4所述的基于OCR识别的文本字符分割方法，其特征在于：所述的步骤S540替换为如下步骤：S550、为每个位置设定权重，权重由中间向两...

【专利技术属性】
技术研发人员：田辉，鲁国峰，郭玉刚，张志翔，
申请(专利权)人：合肥高维数据技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人