文本识别方法、装置、设备、介质及产品制造方法及图纸

技术编号：37544344 阅读：13 留言：0更新日期：2023-05-12 16:14

本申请公开了一种文本识别方法、装置、设备、介质及产品。该文本识别方法包括：针对目标类型的证件设置目标识别模板；获取与目标证件对应的目标证件图像，对目标证件图像进行文本识别，得到初始识别结果；确定得到文本信息相匹配的多对目标文本区域和目标锚点区域；根据目标区域位置信息确定待识别区域在目标证件图像中的映射区域对应的映射区域位置信息；从多个文本区域中确定与映射区域相交的第一文本区域；从初始识别结果中获取与第一文本区域对应的第一文本信息，并根据第一文本信息输出目标证件图像对应的识别结果。根据本申请实施例，可以基于通用化的识别模型对不同类型的证照进行文本识别，节约了大量时间和资源。节约了大量时间和资源。节约了大量时间和资源。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别方法、装置、设备、介质及产品

[0001]本申请属于信息提取
，尤其涉及一种文本识别方法、装置、设备、介质及产品。

技术介绍

[0002]随着深度学习技术的不断发展，光学字符识别模型OCR装置作为一种文字识别技术，在日常生活中基于OCR装置的图像的文本识别、提取功能被广泛应用。
[0003]在进行有标准格式的证照的本文信息提取时，针对不同的证照需要利用识别技开发不同的OCR模型，每当证照类型进行更新后，需要再对不同类型的证照识别模型进行重新训练，浪费了大量时间和资源。

技术实现思路

[0004]本申请实施例提供一种文本识别方法、装置、设备、介质及产品，能够基于通用化的识别模型对不同类型的证照进行文本识别，节约了大量时间和资源。
[0005]第一方面，本申请实施例提供一种文本识别方法，该方法包括：
[0006]针对目标类型的证件设置目标识别模板，目标识别模板中包括与多个锚点区域分别对应的标准文本信息和锚点区域位置信息，以及与待识别区域对应的目标区域位置信息；
[0007]获取与目标证件对应的目标证件图像，对目标证件图像进行文本识别，得到初始识别结果，初始识别结果中包括与多个文本区域分别对应的文本信息和文本区域位置信息；
[0008]在目标证件的类型为目标类型的情况下，将初始识别结果中的文本信息与目标识别模板中的标准文本信息进行一一比对，确定得到文本信息相匹配的多对目标文本区域和目标锚点区域；
[0009]基于目标文本区域对应的文本区域位置信息...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法，其特征在于，包括：针对目标类型的证件设置目标识别模板，所述目标识别模板中包括与多个锚点区域分别对应的标准文本信息和锚点区域位置信息，以及与待识别区域对应的目标区域位置信息；获取与目标证件对应的目标证件图像，对所述目标证件图像进行文本识别，得到初始识别结果，所述初始识别结果中包括与多个文本区域分别对应的文本信息和文本区域位置信息；在所述目标证件的类型为所述目标类型的情况下，将所述初始识别结果中的所述文本信息与所述目标识别模板中的所述标准文本信息进行一一比对，确定得到文本信息相匹配的多对目标文本区域和目标锚点区域；基于所述目标文本区域对应的文本区域位置信息，和所述目标锚点区域对应的锚点区域位置信息之间的映射关系，根据所述目标区域位置信息确定所述待识别区域在所述目标证件图像中的映射区域对应的映射区域位置信息；根据所述映射区域位置信息和所述多个文本区域分别对应的文本区域位置信息，从所述多个文本区域中确定与所述映射区域相交的第一文本区域；从所述初始识别结果中获取与所述第一文本区域对应的第一文本信息，并根据所述第一文本信息输出所述目标证件图像对应的识别结果。2.根据权利要求1所述的方法，其特征在于，所述多个锚点区域包括固定文本区域、可变文本区域以及固定文本和可变文本组合区域。3.根据权利要求1所述的方法，其特征在于，所述目标识别模板中还包括与所述待识别区域对应的文本布局形式；在所述第一文本区域的数量为多个的情况下，所述从所述初始识别结果中获取与所述第一文本区域对应的第一文本信息，并根据所述第一文本信息输出所述目标证件图像对应的识别结果，包括：在所述文本布局形式为单行文本形式的情况下，确定所述第一文本区域与所述映射区域相交部分占所述映射区域的第一目标比例；从多个所述第一文本区域中获取所述第一目标比例最大的文本区域，作为第二文本区域；从所述初始识别结果中获取与所述第二文本区域对应的第二文本信息；根据所述第二文本信息输出所述目标证件图像对应的识别结果。4.根据权利要求3所述的方法，其特征在于，所述从所述初始识别结果中获取与所述第一文本区域对应的第一文本信息，并根据所述第一文本信息输出所述目标证件图像对应的识别结果，包括：在所述文本布局形式为多行文本形式的情况下，确定所述第一文本区域与所述映射区域相交部分占所述第一文本区域的第二目标比例；从多个所述第一文本区域中获取所述第二目标比例大于预设阈值的一个或多个文本区域，作为第二文本区域；从所述初始识别结果中获取与所述第二文本区域对应的第二文本信息；在所述第二文本区域的数量为一个的情况下，根据所述第二文本信息输出所述目标证
件图像对应的识别结果；在所述第二文本区域的数量为多个的情况下，将多个所述文本区域分别对应的第二文本信息进行拼接，得到第三文本信息，并根据所述第三文本信息输出所述目标证件图像对应的识别结果。5.根据权利要求1所述的方法，其特征在于，所述目标识别模板中还包括与所述待识别区域对应的前缀信息和/或后缀信息；所述根据所述第一文本信息输出所述目标证件图像对应的识别结果，包括：根据所述前缀信息和/或后缀信息确定所述第一文本信息中包含的多余信息；删除所述第一文本信息中的所述多余信息，输出得到所述目标证件图像对应的识别结果。6.根据权利要求5所述的方法，其特征在于，在所述前缀信息和/或所述后缀信息中包括多个固定字符且无正则表达式的情况下，所述根据所述前缀信息和/或后缀信息确定所述第一文本信息中包含的多余信息，包括：在所述多个固定字符之间进行排列组合，得到多个字符集合；将所述第一文本信息中的字符与所述多个字符集合中包含的字符分别进行比对，确定所述第一文本信息中包含的多余信息。7.根据权利要求5所述的方法，其特征在于，在所述前缀信息和/或所述后缀信息中包括正则表达式的情况下，所述根据所述前缀信息和/或后缀信息确定所述第一文本信息中包含的多余信息，包括：将所述正则表达式对应的多个可选字符分别与所述第一文本信息中的字符进行比对，确定所述第一文本信息中包含的多余信息。8.根据权利要求1所述的方法，其特征在于，所述目标识别模板中还包括与所述待识别区域对应的多个目标可选字符；所述初始识别结果中还包括与...

【专利技术属性】
技术研发人员：戴菀庭，罗奕康，王伊妍，张士存，聂砂，
申请(专利权)人：建信金融科技有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人