字符识别方法及相关产品技术

技术编号：20797704 阅读：36 留言：0更新日期：2019-04-06 11:19

本发明专利技术实施例提供了字符识别方法及相关产品，所述方法包括：获取输入图像；对所述输入图像进行预处理，得到目标图像；基于特征金字塔网络FPN对所述目标图像进行特征提取，得到特征集，基于区域候选网络RPN对所述特征集进行处理，得到多个文本区域候选框；将所述多个文本区域候选框输入到预设定位网络，得到多个文本回归框，每一文本回归框包括四个顶点；将所述多个文本回归框输入到语义分割分支网络，得到多个文字分割图；对所述多文字分割图输入到预设角度回归网络，得到多个文字分割图的角度，并对每一文字分割图的角度进行矫正；对矫正后的所述多个文字分割图进行识别，得到目标字符。采用本发明专利技术实施例能够针对复杂环境，提升字符识别准确率。

Character Recognition Method and Related Products

The embodiment of the present invention provides a character recognition method and related products. The method includes: acquiring input image; preprocessing the input image to obtain target image; extracting features from the target image based on feature pyramid network FPN to obtain feature set; processing the feature set based on region candidate network RPN to obtain multiple text region candidate frames. The multiple text region candidate boxes are input into the preset position network to obtain multiple text regression boxes, each text regression box contains four vertices; the multiple text regression boxes are input into the semantic segmentation branch network to obtain multiple text segmentation maps; the multi-text segmentation maps are input into the preset angle regression network to obtain the angles of multiple text segmentation maps, and each of them has four vertices. The angle of a character segmentation map is corrected, and the target characters are obtained by recognizing the corrected multiple character segmentation maps. The embodiment of the present invention can improve the accuracy of character recognition for complex environment.

全部详细技术资料下载

【技术实现步骤摘要】
字符识别方法及相关产品
本专利技术涉及字符识别
，具体涉及一种字符识别方法及相关产品。
技术介绍
目前，利用图像识别(imageidentification)技术识别图像中包含的特定字符被应用于众多领域。例如，在一种示例性场景中，用户通过用户设备扫描获得某目标图像，并识别该目标图像中是否包含特定字符，例如，识别广告牌中的汉字，但是，在字体角度不正的情况下，字符识别准确率较低，降低了用户体验。
技术实现思路
本专利技术实施例提供了一种字符识别方法及相关产品，能够提高字符识别准确率。本专利技术实施例第一方面提供了一种字符识别方法，包括：获取输入图像；对所述输入图像进行预处理，得到目标图像；基于特征金字塔网络FPN对所述目标图像进行特征提取，得到特征集，基于区域候选网络RPN对所述特征集进行处理，得到多个文本区域候选框；将所述多个文本区域候选框输入到预设定位网络，得到多个文本回归框，每一文本回归框包括四个顶点；将所述多个文本回归框输入到语义分割分支网络，得到多个文字分割图；对所述多个文字分割图输入到预设角度回归网络，得到多个文字分割图的角度，并对每一文字分割图的角度进...

【技术保护点】
1.一种字符识别方法，其特征在于，包括：获取输入图像；对所述输入图像进行预处理，得到目标图像；基于特征金字塔网络FPN对所述目标图像进行特征提取，得到特征集，基于区域候选网络RPN对所述特征集进行处理，得到多个文本区域候选框；将所述多个文本区域候选框输入到预设定位网络，得到多个文本回归框，每一文本回归框包括四个顶点；将所述多个文本回归框输入到语义分割分支网络，得到多个文字分割图；对所述多个文字分割图输入到预设角度回归网络，得到多个文字分割图的角度，并对每一文字分割图的角度进行矫正；对矫正后的所述多个文字分割图进行识别，得到目标字符。

【技术特征摘要】
1.一种字符识别方法，其特征在于，包括：获取输入图像；对所述输入图像进行预处理，得到目标图像；基于特征金字塔网络FPN对所述目标图像进行特征提取，得到特征集，基于区域候选网络RPN对所述特征集进行处理，得到多个文本区域候选框；将所述多个文本区域候选框输入到预设定位网络，得到多个文本回归框，每一文本回归框包括四个顶点；将所述多个文本回归框输入到语义分割分支网络，得到多个文字分割图；对所述多个文字分割图输入到预设角度回归网络，得到多个文字分割图的角度，并对每一文字分割图的角度进行矫正；对矫正后的所述多个文字分割图进行识别，得到目标字符。2.根据权利要求1所述的方法，其特征在于，所述对所述输入图像进行预处理，得到目标图像，包括：对所述输入图像进行图像分割，得到目标区域图像；对所述目标区域图像进行尺寸调整，得到预设尺寸的目标区域图像；对所述预设尺寸的目标区域图像进行图像增强处理，得到所述目标图像。3.根据权利要求1或2所述的方法，其特征在于，所述对矫正后的所述多个文字分割图进行识别，得到目标字符，包括：对所述矫正后的所述多个字符分割图进行识别，得到多个字符；对所述多个字符进行分类统计，得到多类字符；将所述多类字符中数量最多的字符作为所述目标字符。4.根据权利要求1-3任一项所述的方法，其特征在于，所述方法还包括：对所述目标图像进行图像质量评价，得到图像质量评价值；在所述图像质量评价值大于预设范围时，执行所述基于特征金字塔网络FPN对所述目标图像进行特征提取的步骤。5.根据权利要求1-4任一项所述的方法，其特征在于，所述方法还包括：获取样本字符集，所述样本字符集包括多个字符，每个字符的尺寸大小一致；构建生成式对抗网络GAN，所述预设生成式对抗网络GAN包括生成网络G模块和区分网络D模块，所述G模块为5层反卷积网络，所述D模块为5层卷积神经网络；通过所述D模块对所述样本字符集进行训练，得到多个真实字符图，并输入随机数组，基于所述随机数组对所述真实字符图进行训练，得到多个随机字符图，并通过所述多个真实字符图和所述多个随机字符图训练所述D模块的控制参数θD；根据所述D模...

【专利技术属性】
技术研发人员：龚敏，何其佳，禹世杰，杨威，
申请(专利权)人：深圳市华尊科技股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人