一种基于参数重构网络的字符识别方法及系统技术方案

技术编号：33291112 阅读：9 留言：0更新日期：2022-05-01 00:10

本发明专利技术涉及一种基于参数重构网络的字符识别方法及系统，包括：获取待检测图像；利用特征金字塔网络对所述待检测图像进行拼接和提取，得到共享特征图；利用全卷积神经网络对所述共享特征图进行检测，得到带预测文本框的图像；对所述共享特征图和所述带预测文件框的图像进行仿射变换，得到水平特征图；对所述水平特征图进行识别，得到预测文本标签；根据所述带预测文本框的图像和所述预测文本标签得到字符识别结果。本发明专利技术能够提高字符识别的准确性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于参数重构网络的字符识别方法及系统

[0001]本专利技术涉及字符识别领域，特别是涉及一种基于参数重构网络的字符识别方法及系统。

技术介绍

[0002]光学字符识别(Optical Character Recognition，OCR)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题。
[0003]由于在文档分析、场景理解、机器人导航和图像检索中的大量实际应用，在自然场景中的光学字符识别已经引起了计算机视觉界越来越多的关注。自然场景中的光学字符识别提供了一种自动快速获取自然场景中体现的文本信息的方式，通常分为两个子问题：场景文本检测和场景文本识别。
[0004]得益于深度神经网络提供的强大表示能力，场景文本检测和识别取得了重大进展。自然场景文本定位旨在从自然图像中同时定位和识别文本，已经被广泛研究。遵循传统的方法分别处理文本检测和识别过程，其中文本检测首先被训练的文本检测器命中，然后被送到文本识别模型中。这个架构看起来简单明了，但是可能会导致检测和识别的次优性能，以为这两个任务是相关的，并且是相互补充的。最近，一些研究人员开始将文本检测和识别与端到端可训练网络相结合，该网络由两个子模型组成：用于提...

【技术保护点】

【技术特征摘要】
1.一种基于参数重构网络的字符识别方法，其特征在于，包括：获取待检测图像；利用特征金字塔网络对所述待检测图像进行拼接和提取，得到共享特征图；利用全卷积神经网络对所述共享特征图进行检测，得到带预测文本框的图像；对所述共享特征图和所述带预测文件框的图像进行仿射变换，得到水平特征图；对所述水平特征图进行识别，得到预测文本标签；根据所述带预测文本框的图像和所述预测文本标签得到字符识别结果。2.根据权利要求1所述的基于参数重构网络的字符识别方法，其特征在于，所述利用特征金字塔网络对所述待检测图像进行拼接和提取，得到共享特征图，具体包括：将所述待检测图像依次输入所述特征金字塔网络的卷积层、池化层和模型重构层，得到重构特征图；对所述重构特征图进行上采样，得到共享特征图。3.根据权利要求1所述的基于参数重构网络的字符识别方法，其特征在于，所述利用全卷积神经网络对所述共享特征图进行检测，得到带预测文本框的图像，具体包括：对所述共享特征图分别进行卷积处理和池化处理，得到池化特征图；对所述池化特征图进行上采样得到上采样结果；所述上采样结果和所述池化特征图进行叠加，得到分类输出结果和定位输出结果；根据所述分类输出结果和所述定位输出结果确定带预测文本框的图像。4.根据权利要求1所述的基于参数重构网络的字符识别方法，其特征在于，所述对所述共享特征图和所述带预测文件框的图像进行仿射变换，得到水平特征图，具体包括：根据所述带预测文件框的图像确定仿射变换参数；根据所述共享特征图和所述仿射变换参数确定水平特征图。5.根据权利要求1所述的基于参数重构网络的字符识别方法，其特征在于，所述对所述水平特征图进行识别，得到预测文本标签，具体包括：将所述水平特征图进行卷积处理和池化处理，得到高级特征图；将所述高级特征图进行置换，得到时间序列；根据双向LSTM和所述时间序列确定隐藏状态；将所述隐藏状态进行求和并将求和结果输入到全连接层，得到预测文本标签。6.一种基于参数重构网络的字符识别系统，其特征在于，包括：获取模块，用于获取待检测图像；拼接和提取模块，...

【专利技术属性】
技术研发人员：庞枫骞，康营营，赵鸿飞，
申请(专利权)人：北方工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人