一种基于卷积神经网络的单字图文字识别方法及装置制造方法及图纸

技术编号：16176070 阅读：35 留言：0更新日期：2017-09-09 03:20

本发明专利技术公开了一种基于卷积神经网络的单字图文字识别方法，该方法包括以下步骤：确定待进行文字识别的目标图像；在所述目标图像中定位字符信息，提取各个字符；根据提取到的各个字符，获得所述目标图像的多个单字图；分别将每个单字图输入到预先训练得到的目标卷积神经网络中，进行前向传播，获得每个单字图的文字识别结果。应用本发明专利技术实施例所提供的技术方案，目标卷积神经网络通过大量单字图样本训练得到，提高了对单字图的文字识别率，提升了泛化能力。本发明专利技术还公开了一种基于卷积神经网络的单字图文字识别装置，具有相应技术效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积神经网络的单字图文字识别方法及装置
本专利技术涉及计算机应用
，特别是涉及一种基于卷积神经网络的单字图文字识别方法及装置。
技术介绍
随着计算机技术的快速发展，模式识别技术也得到了快速发展，文字识别一直是模式识别领域的重要研究课题之一。图像中分离出的字符往往含有形变，如旋转、扭曲、倾斜等。现有的文字识别方法是，针对字符的结构特征，通过对字符的点阵采用非线性变换对变形字符进行校正，以减少类内方差。对于含有噪声的字符，采用中值滤波、高斯滤波等滤波算法对其进行去噪处理。然后将处理后的字符进行二值化，对二值化图像进行细化操作，提取文字的骨架特征。对细化后的文字提取特征向量，最后利用模板匹配、SVW、KNN等分类器进行文字识别。这种方法存在一定的缺点，特别是在对汉字识别时，尤其明显。因为汉字规模较大，同时相似汉字较多，从图像中提取的字符信息往往形变较大，形变的类型各异，容易出现扭曲、倾斜、弹性形变、噪声、笔画断裂缺失等现象。应用现有技术的这种文字识别方法进行文字识别，识别率不高，泛化能力较弱。
技术实现思路
本专利技术的目的是提供一种基于卷积神经网络的单字图文字识别方法及装置，以提高识别率，提升泛化能力。为解决上述技术问题，本专利技术提供如下技术方案：一种基于卷积神经网络的单字图文字识别方法，包括：确定待进行文字识别的目标图像；在所述目标图像中定位字符信息，提取各个字符；根据提取到的各个字符，获得所述目标图像的多个单字图；分别将每个单字图输入到预先训练得到的目标卷积神经网络中，进行前向传播，获得每个单字图的文字识别结果，所述目标卷积神经网络通过大量单字...
一种基于卷积神经网络的单字图文字识别方法及装置

【技术保护点】
一种基于卷积神经网络的单字图文字识别方法，其特征在于，包括：确定待进行文字识别的目标图像；在所述目标图像中定位字符信息，提取各个字符；根据提取到的各个字符，获得所述目标图像的多个单字图；分别将每个单字图输入到预先训练得到的目标卷积神经网络中，进行前向传播，获得每个单字图的文字识别结果，所述目标卷积神经网络通过大量单字图样本训练得到。

【技术特征摘要】
1.一种基于卷积神经网络的单字图文字识别方法，其特征在于，包括：确定待进行文字识别的目标图像；在所述目标图像中定位字符信息，提取各个字符；根据提取到的各个字符，获得所述目标图像的多个单字图；分别将每个单字图输入到预先训练得到的目标卷积神经网络中，进行前向传播，获得每个单字图的文字识别结果，所述目标卷积神经网络通过大量单字图样本训练得到。2.根据权利要求1所述的基于卷积神经网络的单字图文字识别方法，其特征在于，所述在所述目标图像中定位字符信息，提取各个字符，包括：在所述目标图像中定位字符信息；根据定位结果，对所述目标图像中的字符进行切割操作，获得所述目标图像包含的各个字符。3.根据权利要求1或2所述的基于卷积神经网络的单字图文字识别方法，其特征在于，所述根据提取到的各个字符，获得所述目标图像的多个单字图，包括：针对提取到的每个字符，对该字符进行二值化处理，并将该字符的尺寸大小调整为设定第一尺寸大小；将调整尺寸大小后的该字符放置于设定第二尺寸大小的背景图像的中心，并进行正则化处理，获得该字符对应的单字图。4.根据权利要求3所述的基于卷积神经网络的单字图文字识别方法，其特征在于，通过以下步骤预先训练得到所述目标卷积神经网络：获得训练数据集和测试数据集，所述训练数据集中包含设定第一数量的单字图样本，所述测试数据集中包含设定第二数量的单字图样本，每个单字图样本的尺寸大小相同，每个单字图样本中包含的字符的尺寸大小相同；初始化卷积神经网络；利用所述训练数据集对所述卷积神经网络进行训练，调整网络参数，确定训练过程中的误差；在所述卷积神经网络迭代设定次数时，将所述测试数据集输入到所述卷积神经网络中进行测试，获得测试正确率；重复执行所述利用所述训练数据集对所述卷积神经网络进行训练，调整网络参数，确定训练过程中的误差的步骤，直至所述卷积神经网络的误差低于预设第一阈值，且所述测试正确率高于预设第二阈值时，停止训练，获得所述目标卷积神经网络。5.根据权利要求4所述的基于卷积神经网络的单字图文字识别方法，其特征在于，所述目标卷积神经网络为多尺度卷积神经网络。6.一种基于卷积神经...

【专利技术属性】
技术研发人员：胡志成，蒋菲，
申请(专利权)人：金蝶软件中国有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人