一种基于深度学习的汉字识别系统的实现方法技术方案

技术编号：15330471 阅读：242 留言：0更新日期：2017-05-16 13:55

本发明专利技术公开了一种基于深度学习的汉字识别系统的实现方法，属于图像处理技术领域，将包含文字的图片进行预处理、切分、识别，重组成一段文本，从而实现图片到文本的转换；包括：1）图片预处理：用于对输入的原始图片灰度化、二值化、倾斜校正，得到一张比较规整的图片；2）图片切分：用于对输入的大篇幅文字的图片切分，先切分成行，然后对每一行切分出单个的字；3）图片识别：用于识别切分出的单个字，将每个单字图片调用识别模块，得出识别文字结果；4）文本重组：用于对得到的单个字识别结果按照顺序组合，并进行校正，最终产出识别结果文本段。本发明专利技术使用图像处理技术完成灰度化、二值化，泛化能力强，抗干扰能力强。

Method for implementing Chinese character recognition system based on depth learning

The invention discloses a method for realizing Chinese characters recognition system based on deep learning, which belongs to the technical field of image processing, the picture that contains text preprocessing, segmentation, recognition, into a piece of text, so as to realize the image to text translation; including: 1) pretreatment picture: for the original image gray scale the input, binarization, tilt correction, get a regular picture; 2) for image segmentation on image segmentation: input the length of the text, the first cut into the line, and then on each line to separate a single word; 3) image recognition: the recognition for single word segmentation. Each word picture call recognition module, draw text recognition results; 4) for text Restructuring: isolated word recognition results obtained in accordance with the order, and then corrected the final output results Text segment. The invention adopts the image processing technology to accomplish the gradation, the two values, the strong generalization ability and the strong anti-interference ability.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的汉字识别系统的实现方法
本专利技术涉及图像处理
，具体地说是一种基于深度学习的汉字识别系统的实现方法。
技术介绍
随着互联网和人工智能的迅猛发展，交流和信息传递方式从文字向图片和语音的方式转变，图片文字信息的识别的成为一个重要需求。传统的文字信息识别方法，通过计算图片像素、图片中文字的外围结构、笔划方向等，生成单个文字特征库，识别环节通过与特征库比对找出最小距离，从而判断文字类别，对于不同字号、横纵拉伸及旋转的文字图片识别能力差。
技术实现思路
本专利技术的技术任务是针对以上不足之处，提供一种基于深度学习的汉字识别系统的实现方法，使用图像处理技术完成灰度化、二值化，泛化能力强，抗干扰能力强。本专利技术解决其技术问题所采用的技术方案是：一种基于深度学习的汉字识别系统的实现方法，将包含文字的图片进行预处理、切分、识别，重组成一段文本，从而实现图片到文本的转换；包括：1）图片预处理：用于对输入的原始图片灰度化、二值化、倾斜校正，得到一张比较规整的图片；2）图片切分：用于对输入的大篇幅文字的图片切分，先切分成行，然后对每一行切分出单个的字；3）图片识别：用于识别切分出的单个字，将每个单字图片调用识别模块，得出识别文字结果；4）文本重组：用于对得到的单个字识别结果按照顺序组合，并进行校正，最终产出识别结果文本段。汉字识别系统，使用图像处理技术完成灰度化、二值化，使用图片像素统计、分析，实现倾斜校正和行、字切分，引入深度学习，实现文字图片识别，引入自然语言处理，实现文本重组和校正。使用技术：基于汉字识别的图片质量和性能要求，整个识别系统采用C/C+...

【技术保护点】
一种基于深度学习的汉字识别系统的实现方法，其特征在于将包含文字的图片进行预处理、切分、识别，重组成一段文本，从而实现图片到文本的转换；包括：1）图片预处理：用于对输入的原始图片灰度化、二值化、倾斜校正，得到一张比较规整的图片；2）图片切分：用于对输入的大篇幅文字的图片切分，先切分成行，然后对每一行切分出单个的字；3）图片识别：用于识别切分出的单个字，将每个单字图片调用识别模块，得出识别文字结果；4）文本重组：用于对得到的单个字识别结果按照顺序组合，并进行校正，最终产出识别结果文本段。

【技术特征摘要】
1.一种基于深度学习的汉字识别系统的实现方法，其特征在于将包含文字的图片进行预处理、切分、识别，重组成一段文本，从而实现图片到文本的转换；包括：1）图片预处理：用于对输入的原始图片灰度化、二值化、倾斜校正，得到一张比较规整的图片；2）图片切分：用于对输入的大篇幅文字的图片切分，先切分成行，然后对每一行切分出单个的字；3）图片识别：用于识别切分出的单个字，将每个单字图...

【专利技术属性】
技术研发人员：衣秀，陈安猛，房善华，王本强，郭运艳，
申请(专利权)人：浪潮软件集团有限公司，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人