当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于CNN的手写中文文本识别方法技术

技术编号:21090941 阅读:89 留言:0更新日期:2019-05-11 10:27
本发明专利技术公开了一种基于CNN的手写中文文本识别方法,所述方法将单个手写中文识别与文字分割算法结合起来,实现了手写中文文本的自动识别,所述方法包括以下步骤:对文本图片进行灰度化、二值化处理,再利用直方图投影对中文文本进行分割;先通过横向扫描分割出单行文字,再利用纵向扫描分割出单个文字;对单个中文图片进行扫描处理,对中文进行正射纠正,并使其位于图片中间位置,上下左右各留出10个空白像素;基于TensorFlow框架构造一个包括:4个卷积层、4个池化层和2个全连接层的卷积神经网络,利用训练集进行训练;输入待测图片,根据构建的卷积神经网络进行识别。

A Handwritten Chinese Text Recognition Method Based on CNN

【技术实现步骤摘要】
一种基于CNN的手写中文文本识别方法
本专利技术涉及计算机图像处理领域,尤其涉及一种基于CNN(卷积神经网络)的手写中文文本识别方法。
技术介绍
手写中文识别是计算机图像和视觉研究领域的热点之一,在识别历史文档,邮件分类,手写笔记的转录等方面都得到了广泛地应用。尽管在过去的几十年中,国内外学者已经在该领域作了大量研究,但仍然有许多问题没有得到有效解决。手写中文识别的主要困难来自中文结构复杂,字符种类多,数据大,各人风格不同,手写失真等。在某些情况下,相似中文之间的无约束手写样本的差异可能非常小,例如字符“天”,“夫”和“夭”,“已”,“己”和“巳”,“目”,“白”和“自”等,使得识别任务更加具有挑战性。到目前为止,各国科研人员在手写中文识别领域已经进行了半个多世纪的研究,提出了许多离线识别方法来实现手写中文文本的机器识别,其中,以基于修改的二次判别函数(MQDF)[1]的方法最具代表性。此外,一些传统方法(如修改的二次判别函数MQDF、判别学习型二次判别函数DLQDF),对手写中文识别数据库CASIA-HWDB取得了较好的识别效果,但识别准确率仍然低于93%,与人类表现尚有一定差距。本文档来自技高网...

【技术保护点】
1.一种基于CNN的手写中文文本识别方法,其特征在于,所述方法将单个手写中文识别与文字分割算法结合起来,实现了手写中文文本的自动识别,所述方法包括以下步骤:对文本图片进行灰度化、二值化处理,再利用直方图投影对中文文本进行分割;先通过横向扫描分割出单行文字,再利用纵向扫描分割出单个文字;对单个中文图片进行扫描处理,对中文进行正射纠正,并使其位于图片中间位置,上下左右各留出10个空白像素;基于TensorFlow框架构造一个包括:4个卷积层、4个池化层和2个全连接层的卷积神经网络,利用训练集进行训练;输入待测图片,根据构建的卷积神经网络进行识别。

【技术特征摘要】
1.一种基于CNN的手写中文文本识别方法,其特征在于,所述方法将单个手写中文识别与文字分割算法结合起来,实现了手写中文文本的自动识别,所述方法包括以下步骤:对文本图片进行灰度化、二值化处理,再利用直方图投影对中文文本进行分割;先通过横向扫描分割出单行文字,再利用纵向扫描分割出单个文字;对单个中文图片进行扫描处理,对中文进行正射纠正,并使其位于图片中间位置,上下左右各留出10个空白像素;基于TensorFlow框架构造一个包括:4个卷积层、4个池化层和2个全连接层的卷积神经网络,利用训练集进行训练;输入待测图片,根据构建的卷积神经网络进行识别。2.根据权利要求1所述的一种基于CNN的手写中文文本识别方法,其特征在于,所述4个卷积层、4个池化层和2个全连接层的卷积神经网络具体为:layer1为卷积层,采用64个3×3的卷积核对输入图像做卷积,输出64个64×64的特征图像;layer2为池化层,输入layer1的输出图像,池化窗口大小为2×2,步长设为2×2,选择填充方式为SAME,故64个大小为64×64的图像,经layer2计算后输出为64个大小为32×32的特征图像;layer3为卷积层,采用128个3×3的卷积核对layer2的输出图像做卷积,输出是128个大小为32×32的特征图像;layer4为池化层,输入为layer3的输出图像,池化窗口大小为2×2,步长设为2×2,选择填充方式为SAME,故128个大小为32×32的图像,经la...

【专利技术属性】
技术研发人员:何凯黄婉蓉冯旭高圣楠
申请(专利权)人:天津大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1