【技术实现步骤摘要】
OCR中判断文件图像方向的方法、装置、设备及存储介质
本说明书涉及光学字符识别(OpticalCharacterRecognition,简称OCR)
,尤其是涉及一种OCR中判断文件图像方向的方法、装置、设备及存储介质。
技术介绍
OCR识别是指输入一张图像然后得到图像中文本的过程。然而,在对文件图像(例如合同图像、证件图像)进行OCR识别时,由于图像扫描或拍摄方式等问题,输入的图像往往不是正向方向的,因此需要先在OCR中判断文件图像方向,以便于做摆正处理。当前,在OCR中判断文件图像方向的方法主要包括手动法和自动法。其中,手动法为人工识别文件图像的正向方向,并据此进行摆正,在此基础上再进行OCR识别。显然,这种方式耗时费力,且成本很高。现有的自动法通常是基于模板匹配的方法,即事先给定了模板,对各角度的文件图像进行OCR识别,将识别结果与模板中的关键字进行匹配,匹配次数最多的角度方向作为文件图像的正向方向。然而,这种模板匹配的方式仅能适用于模板范围内的文件图像,而对于一个新版式的文件图像就无效了,无法满足通用的
【技术保护点】
1.一种OCR中判断文件图像方向的方法,其特征在于,包括:/n获取目标图像;/n将所述目标图像按照多个指定旋转角度进行旋转,并分别获取所述目标图像在每个指定旋转角度下的文字识别结果;/n对所述文字识别结果进行分词,对应获得多个分词集合;/n确定所述多个分词集合中包含词语数量最多的分词集合,并将该分词集合对应的图像方向作为所述目标图像的正向方向。/n
【技术特征摘要】
1.一种OCR中判断文件图像方向的方法,其特征在于,包括:
获取目标图像;
将所述目标图像按照多个指定旋转角度进行旋转,并分别获取所述目标图像在每个指定旋转角度下的文字识别结果;
对所述文字识别结果进行分词,对应获得多个分词集合;
确定所述多个分词集合中包含词语数量最多的分词集合,并将该分词集合对应的图像方向作为所述目标图像的正向方向。
2.如权利要求1所述的OCR中判断文件图像方向的方法,其特征在于,所述获取所述目标图像在每个指定旋转角度下的文字识别结果,包括:
针对所述多个指定旋转角度的每个指定旋转角度:
利用预设的文本定位算法对所述目标图像在该指定旋转角度下的字符进行定位,获得所述目标图像在该指定旋转角度下的多个文件图像切片;每个所述文件图像切片包含一个字符;
利用预设的文本识别算法对所述文件图像切片进行文字识别,获取所述目标图像在该指定旋转角度下的文字识别结果。
3.如权利要求1所述的OCR中判断文件图像方向的方法,其特征在于,还包括:
在对所述文字识别结果进行分词之前,对所述文字识别结果进行文本清洗。
4.如权利要求3所述的OCR中判断文件图像方向的方法,其特征在于,所述对所述文字识别结果进行文本清洗,包括:
将同一个文字识别结果中的所有字符拼接为一行文本;
剔除该行文本中的非汉字字符。
5.如权利要求2所述的OCR中判断文件图像方向的方法,其特征在于,所述文本定位算法包括CTPN文本定位算法。
6.如权利要求2所述的OCR中判断文件图像方向的方法,其特征在于,所述文本识别算法包括CRNN文本识别算法。
7.如权利要求4所述的OCR中判断文件图像方向的方法,其特征在于,所述剔除该行文本中的非汉字字符,包括:
剔除该行文本中字符位长度小于2的所有字符。
8.如权利要求4所述的OCR中判断文件图像方向的方法,其特征...
【专利技术属性】
技术研发人员:李虎,
申请(专利权)人:中国建设银行股份有限公司,建信金融科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。