【技术实现步骤摘要】
信用证识别方法、装置、计算机设备和存储介质
[0001]本申请涉及图像识别
,特别是涉及一种信用证识别方法、装置、计算机设备和存储介质。
技术介绍
[0002]由于信用证票据应用场景比较特殊,因此业界几乎没有针对信用证的专用识别引擎,现有的信用证识别通常是采用人工录入与人工核对的方式,或使用通用的文字识别引擎,例如tesseract引擎,或者基于深度学习的通用OCR识别模型。
[0003]但是由于信用证版式提取信息内容复杂、文字密集,且需要判断复选框是否勾选、涂黑等内容,有着表格与非表格两种版式,现有的识别技术方案无法对结构复杂的信用证版式做准确的提取,也无法精确的对信用证的长文本进行定位。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够对信用证图像进行精确识别的信用证识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种信用证识别方法,该方法包括:
[0006]获取待识别信用证图像;
[0007] ...
【技术保护点】
【技术特征摘要】
1.一种信用证识别方法,其特征在于,所述方法包括:获取待识别信用证图像;将所述待识别信用证图像进行分割,得到若干文本区域;对所述文本区域进行文字识别,得到所述文本区域的识别结果;根据预设规则对所述文本区域的识别结果进行后处理得到结构化目标信息。2.根据权利要求1所述的方法,其特征在于,所述获取待识别信用证图像之后,还包括:对所述待识别信用证图像进行角度矫正。3.根据权利要求2所述的方法,其特征在于,所述对所述待识别信用证图像进行角度矫正,包括:将所述待识别信用证图像进行二值化处理得到二值化图像;提取所述二值化图像中的全部表格轮廓;对所述全部表格轮廓进行处理得到面积最大表格的目标轮廓;计算所述面积最大表格的目标轮廓中相邻直线夹角得到旋转角度;根据所述旋转角度对所述待识别信用证图像进行角度矫正。4.根据权利要求3所述的方法,其特征在于,所述对所述全部表格轮廓进行处理得到面积最大表格的目标轮廓,包括:根据轮廓面积进行过滤,得到最小轮廓面积的表格作为当前表格;获取与所述当前表格相邻的待处理表格;将所述待处理表格与所述当前表格合并作为新的当前表格,并继续获取与所述当前表格相邻的待处理表格,直至获取所述面积最大表格,提取所述面积最大表格的目标轮廓。5.根据权利要求1所述的方法,其特征在于,所述对所述文本区域进行文字识别之前,包括:对所述文本区域进行修复。6.根据权利要求5所述的方法,其特征在于,所述对所述文本区域进行修复,包括:获取所述待识别信用证图像对应的版式;根据所述版式对所述文本区域进行修复。7.根据权利要求6所述的方法,其特征在于,所述根据所述版式对所述文本区域进行修复,包括:当所述待识别信用证图像为表格版式时,提取所述文本区域中的目标方向的待处理边界;获取距离所述文本区域中目标类型的文本区域最近的待处理边界作为目标边界;将所述目标类型的文本区域的边界移动至所述目标边界。8.根据权利要求6所述的方法,其特征在于,所述根据不同的版式对所述文本区域进行修复,包括:当所述待识别信用证图像为非表格版式时,获取所述文本区域中目标类型的文本区域的坐标;根据所述坐标以及所述待识别信用证图像的宽度对所述待识别信用证图像进行分割,得到所述目标类型的文本区域对应的文本切片;分别对所述文本切片的不同方向进行对应的图像操作得到内容轮廓;
根据所述内容轮廓的横坐标对所述目标类型的文本区域进行修复。9.根据要求1所述的方法,其特征在于,所述根据预设...
【专利技术属性】
技术研发人员:王迪,李捷,王巍,徐敏,向东,王慧,
申请(专利权)人:上海浦东发展银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。