基于标准外围轮廓和深度学习的手写汉字句集识别方法技术

技术编号:19746073 阅读:34 留言:0更新日期:2018-12-12 04:53
本发明专利技术提供了一种基于标准外围轮廓和深度学习的手写汉字句集识别方法,包括如下步骤:(1)文字切割:将待识别的汉字句集写入带有标准外围轮廓的特定纸张上,并对其进行扫描,对扫描后的图片进行切割,得到带有标准外围轮廓的单字图片。(2)图片处理:去除切割后单字图片的标准外围轮廓,并对其进行放大、二值化处理。(3)文字识别:调用识别模块识别图片处理后的单字图片,得出识别结果。本发明专利技术文字切割部分引入了标准外围轮廓,有效避免了文字的误切割,提高了文字识别的准确率。

【技术实现步骤摘要】
基于标准外围轮廓和深度学习的手写汉字句集识别方法
本专利技术属于图像处理
,涉及手写汉子的识别,由其是一种基于标准外围轮廓和深度学习的手写汉字句集识别方法。
技术介绍
考试制度是我国人才选拔的一种重要机制,也是学生学习成果以及老师教学成果的一种客观体现。在众多的考试科目中,语文作文作为一种读写能力的体现成为了我国中小学学校中必不可少的考试科目。传统的语文作文阅卷采用纸质阅卷的方式。然而,随着“无纸化”时代的到来,传统的纸质阅卷方式已经不能满足各中小学学校的日常需求,其存在诸多的弊端,比如:由于装订不严实导致教师无意间看到学生信息,从而根据个人主观印象导致考试的不公平性;平时练习时,纸质评阅语文作文需要教师手写评语,这样就会造成阅卷周期长,导致学生练习的机会减少。为了应对以上这些问题,电子阅卷逐渐成为了一种主流的阅卷方式。电子阅卷因其省去了纸质答卷的装订环节,不仅提高了阅卷的效率,使学生得到了更多的练习机会,而且避免了纸质阅卷出现的考试不公平现象。传统的语文作文电子阅卷中,试卷经过扫描后教师直接开始评阅,所以教师看到的仍然是手写体汉字,而不同的人有不同的书写风格,当试卷数目庞大时就容易造成阅卷老师的视觉疲劳,从而大大增加了误判以及错判的概率。由此可见,为了缓解长时间阅卷带来的视觉疲劳,有必要寻找一种文字识别系统,使不同的手写体汉字句集转变为统一的印刷体。通常,大多数文字识别系统是基于单个文字来实现的,所以要识别手写汉字句集,首先就必须做好单个文字的切割。目前,国内外有许多针对文字切割的研究方法,主要包括基于识别的文字切割方法、基于投影法的文字切割方法以及以分析特定背景区域为主,针对具体黏连数字采用不同分割策略的切割方法等。然而,现有的这些文字切割方法仍然存在切割效率低,识别实时性差等缺点。因此,如何准确的切割出每个字符就成为了文字识别系统研究中的一个重要问题。
技术实现思路
为了解决相关领域现有技术的不足,本专利技术提供了一种基于标准外围轮廓和深度学习的手写汉字句集识别方法,其采用的技术方案是:文字切割:将待识别的汉字句集写入带有标准外围轮廓的特定纸张上,并对其进行扫描,对扫描后的图片进行切割,得到带有标准外围轮廓的单字图片。图片处理:去除切割后单字图片的标准外围轮廓,并对其进行放大、二值化处理。文字识别:调用识别模块识别图片处理后的单字图片,得出识别结果。本专利技术和现有技术相比,具有以下优势:(1)本专利技术文字切割部分引入了标准外围轮廓,有效避免了文字的误切割,提高了文字识别的准确率。(2)深度学习技术的引入在很大程度上弥补了传统文字识别技术的不足,不仅实现了手写汉字的识别,而且使文字识别的准确率大大提升,同时对于复杂背景、分辨率较低的文字具有很好的鲁棒性。(3)对深度卷积神经网络结构的改进,使网络复杂度降低,网络可移植性提高。附图说明图1为带有标准外围轮廓的特定纸张图;图2为待识别的手写汉字句集图;图3为文字切割后的单字图;图4为消去标准外围轮廓的单字图;图5为放大、二值化后的单字图;图6为文字识别结果图。具体实施方式下面结合附图并通过具体实施例对本专利技术作进一步详述。一种基于标准外围轮廓和深度学习的手写汉字句集识别方法,主要包括文字切割、图片处理、文字识别等部分,从而将图片信息转换成文本信息。其中,文字切割和图片处理部分通过在VisualStudio平台上调用opencv接口实现,文字识别模块采用Caffe开源框架下Alexnet模型的改进版本实现。文字切割:如图1所示为带有标准外围轮廓的特定纸张,在特定纸张上写入待识别的汉字句集,并对其进行扫描,如图2所示。用最小外接矩形法对扫描后的图片进行切割,将带有标准外围轮廓的手写汉字句集图片切割成带有标准外围轮廓的单字图片,并按顺序保存,如图3所示。图片处理:通过调整RGB颜色通道阈值,将图3中单字图片的标准外围轮廓去除,如图4所示;由于实际情况中,输入的手写汉字多为多通道图像,考虑到文字识别的准确率,将消去标准外围轮廓的单字图片进行放大处理并通过调整颜色通道阈值将其转化为二值化图片,然后将图片保存,如图5所示。文字识别:将每个单字图片顺序调用识别模块,得出识别结果,如图6所示。识别模块在被调用以前需要进行模型训练,可以通过以下步骤预先训练得到识别模块:步骤一:将HWDB1.1数据集的GNT格式数据进行解析并做二值化处理,然后将其中240×1000个手写体汉字样本分为训练集和测试集并转换为Caffe可用的lmdb格式数据集。步骤二:对卷积神经网络进行初始配置。步骤三:利用深度卷积神经网络Alexnet的改进版对1000类手写体汉字训练集进行重复监督学习,并在重复监督学习时根据学习误差不断调整网络各层之间的连接权重。同时,每重复学习设定次数时,将测试集送入网络进行测试并获取测试准确率。其中,对Alexnet模型的改进包括:将卷积层1中的卷积核个数由原来的96改为80,对应的池化层也做相应改进;去除第一个全连接层。步骤四:当卷积神经网络的学习误差低于第一预设值,且测试准确率高于第二预设值时,停止训练并保存当前网络各层之间连接权重,获得最优识别模型。以上所述的仅是本专利技术的优选实施方式,应当指出,对于本领域的普通技术人员来说,在不脱离专利技术构思的前提下,还可以做出若干变形和改进,这些都属于本专利技术的保护范围。本文档来自技高网
...

【技术保护点】
1.一种基于标准外围轮廓和深度学习的手写汉字句集识别方法,步骤如下:(1)准备带有标准外围轮廓的特定纸张,在特定纸张上写入待识别的汉字句集,并对其进行扫描;(2)用最小外接矩形法对扫描后的图片进行切割,将带有标准外围轮廓的手写汉字句集图片切割成带有标准外围轮廓的单字图片,并按顺序保存;(3)通过调整RGB颜色通道阈值,将单字图片的标准外围轮廓去除;(4)将去除标准外围轮廓的单字图片进行放大处理并通过调整颜色通道阈值将其转化为二值化图片,然后将图片保存;(5)按照每个单字图片顺序调用文字识别模块,得出识别结果。

【技术特征摘要】
1.一种基于标准外围轮廓和深度学习的手写汉字句集识别方法,步骤如下:(1)准备带有标准外围轮廓的特定纸张,在特定纸张上写入待识别的汉字句集,并对其进行扫描;(2)用最小外接矩形法对扫描后的图片进行切割,将带有标准外围轮廓的手写汉字句集图片切割成带有标准外围轮廓的单字图片,并按顺序保存;(3)通过调整RGB颜色通道阈值,将单字图片的标准外围轮廓去除;(4)将去除标准外围轮廓的单字图片进行放大处理并通过调整颜色通道阈值将其转化为二值化图片,然后将图片保存;(5)按照每个单字图片顺序调用文字识别模...

【专利技术属性】
技术研发人员:王琦琦尹成娟王以忠杨国威许素霞
申请(专利权)人:天津科技大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1