一种文字识别方法、装置及计算机可读存储介质制造方法及图纸

技术编号：20177701 阅读：23 留言：0更新日期：2019-01-23 00:39

本发明专利技术公开一种文字识别方法、装置及服务器，在所述文字识别方法中，获取待识别图像，所述待识别图像中包含有不成行排列的多个待识别文字，根据所述待识别图像，生成所述多个待识别文字成行排列的目标图像，将目标图像输入至识别模型，得到所述多个待识别文字的识别结果，通过上述方案，有效识别出待识别图像中的不规整文字，提高了文字识别的多样化。

A Method, Device and Computer Readable Storage Media for Character Recognition

The invention discloses a method, device and server for character recognition. In the method, the image to be recognized is acquired. The image to be recognized contains a plurality of characters to be recognized in different rows. According to the image to be recognized, the target image of the plurality of characters to be recognized is generated in rows, and the target image is input into the recognition model to obtain the plurality of characters to be recognized. Through the above scheme, the irregular characters in the image to be recognized can be effectively recognized and the diversity of character recognition can be improved.

全部详细技术资料下载

【技术实现步骤摘要】
一种文字识别方法、装置及计算机可读存储介质
本专利技术涉及图像处理领域，尤其涉及一种文字识别方法、装置及计算机可读存储介质。
技术介绍
随着科学技术的不断发展，文字识别技术得到了广泛的应用，例如对扫描文档的文字进行识别、对拍摄照片中的文字进行识别等。目前通常采用OCR(OpticalCharacterRecognition，光学字符识别)来对排列规整的文字进行识别。
技术实现思路
本说明书实施例提供及一种文字识别方法、装置及服务器。第一方面，本说明书实施例提供一种文字识别方法，包括：获取待识别图像，所述待识别图像中包含有多个待识别文字，所述多个待识别文字不成行排列；根据所述待识别图像，生成目标图像，所述目标图像中包含所述多个待识别文字且所述多个待识别文字成行排列；根据所述目标图像，以及与所述目标图像对应的识别模型，生成所述多个待识别文字的识别结果。第二方面，本说明书实施例提供一种文字识别装置，包括：获取模块，用于获取待识别图像，所述待识别图像中包含有多个待识别文字，所述多个待识别文字不成行排列；图像处理模块，用于根据所述待识别图像，生成目标图像，所述目标图像中包含所述多个待识别文字且所述多个待识别文字成行排列；识别模块，用于根据所述目标图像，以及与所述目标图像对应的识别模型，生成所述多个待识别文字的识别结果。第三方面，本说明书实施例提供一种服务器，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行上述任一项所述方法的步骤。第四方面，本说明书实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述任一项所...

【技术保护点】
1.一种文字识别方法，所述方法包括：获取待识别图像，所述待识别图像中包含有多个待识别文字，所述多个待识别文字不成行排列；根据所述待识别图像，生成目标图像，所述目标图像中包含所述多个待识别文字且所述多个待识别文字成行排列；根据所述目标图像，以及与所述目标图像对应的识别模型，生成所述多个待识别文字的识别结果。

【技术特征摘要】
1.一种文字识别方法，所述方法包括：获取待识别图像，所述待识别图像中包含有多个待识别文字，所述多个待识别文字不成行排列；根据所述待识别图像，生成目标图像，所述目标图像中包含所述多个待识别文字且所述多个待识别文字成行排列；根据所述目标图像，以及与所述目标图像对应的识别模型，生成所述多个待识别文字的识别结果。2.根据权利要求1所述的文字识别方法，所述根据所述待识别图像，生成目标图像，包括：对所述待识别图像进行分割，获得多个分割图像，所述多个分割图像中的每个分割图像中包含一个以上的待识别文字；对所述多个分割图像进行成行排列拼接，生成所述目标图像。3.根据权利要求2所述的文字识别方法，所述对待识别图像进行分割，获得多个分割图像之前，所述方法包括：将所述多个待识别文字从所述待识别图像的背景中分离，获得待识别文字图像；对所述待识别文字图像进行膨胀处理，得到膨胀处理图像；确定所述膨胀处理图像中的多个连通区域；所述对待识别图像进行分割，获得多个分割图像，包括：对所述多个连通区域中的每个连通区域进行分割，获得所述多个分割图像。4.根据权利要求2所述的文字识别方法，所述对所述多个分割图像进行成行排列拼接，生成所述目标图像，包括：将所述多个分割图像中的每个分割图像的尺寸均调整为预设尺寸；对尺寸调整后的所述多个分割图像进行成行排列拼接，生成所述目标图像。5.根据权利要求2所述的文字识别方法，所述对所述多个分割图像进行成行排列拼接，生成所述目标图像，包括：按照预设排列规则对所述多个分割图像进行成行排列拼接，生成所述目标图像。6.根据权利要求1所述的文字识别方法，在所述根据所述目标图像，以及与所述目标图像对应的识别模型，生成所述多个待识别文字的识别结果之前，所述方法还包括：根据所述多个待识别文字的特征以及预设字库，生成一预设数量的样本，所述样本为文字成行排列的图像；根据所述样本，对初始识别模型进行训练，获得所述识别模型。7.根据权利要求6所述的文字识别方法，所述多个待识别文字的特征至少包括待识别文字的倾斜角度特征，所述根据所述多个待识别文字的特征以及预设字库，生成一预设数量的样本，包括：根据所述倾斜角度特征以及所述预设字库，生成所述样本。8.根据权利要求1所述的文字识别方法，所述识别模型为长短时记忆网络及联结主义时间分类识别模型。9.根据权利要求1所述的文字识别方法，所述方法还包括：获取标准测试图像，所述标准测试图像包含有用于标记所述标准测试图像的真实识别结果的图像标签；通过所述识别模型对所述标准测试图像进行识别，获得目标识别结果；根据所述目标识别结果，以及所述真实识别结果，对所述识别模型的参数进行调整。10.一种文字识别装置，所述装置包括：获取模块，用于获取待识别图像，所述待识别图像中包含有多个待识别文字，所述多个待识别文字不成行排列；图像处理模块，用于根据所述...

【专利技术属性】
技术研发人员：魏袁新，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人