The present disclosure discloses an invoice recognition method, device and storage medium, wherein the method includes: carrying out text recognition processing on the invoice image to obtain the text recognition result of the invoice image; dividing the text recognition result of the invoice image into lines to obtain at least one text line; and based on the at least one text line. The result of text recognition contained in each line of a text line determines the item information corresponding to the item in the invoice image.
【技术实现步骤摘要】
一种发票识别方法及装置、计算机存储介质
本公开涉及计算机视觉领域中的发票识别技术,具体涉及一种发票识别方法、装置及计算机存储介质。
技术介绍
增值税发票的文字检测识别是非常具有挑战性的。通常在检测某一类固定场景的文字检测识别时,例如身份证,驾驶证,这些证件的模板是固定的,文字印刷也比较工整,不会出现串行的情况。而在对发票如增值税发票进行检测识别时,往往需要面临增值税发票有多种板式、条目数量不确定等等各种问题。因此,如何提高增值税发票的识别准确度,是亟待解决的技术问题。
技术实现思路
有鉴于此,本公开提供一种发票识别方法及装置、计算机存储介质,能提高发票识别的准确率。第一方面,本公开实施例提供了一种发票识别方法,所述方法包括:对发票图像进行文本识别处理,得到所述发票图像的文本识别结果;对所述发票图像的文本识别结果进行分行,得到至少一个文本行;基于所述至少一个文本行中每行包含的文本识别结果,确定所述发票图像中的条目对应的条目信息。上述方案中,可选地,所述基于所述至少一个文本行中每行包含的文本识别结果,确定所述发票图像中的条目对应的条目信息,包括:通过对所述至少一个文本行中每行包含的文本识别结果进行逐行分析,确定所述发票图像中的条目对应的条目信息。上述方案中,可选地,所述通过对所述至少一个文本行中每行包含的文本识别结果进行逐行分析,确定所述发票图像中的条目对应的条目信息,包括:对所述至少一个文本行中第一文本行包含的文本识别结果进行分析,确定所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系;基于所述第一文本行包含的至少一个条目和至少一个条目信息之间的对 ...
【技术保护点】
1.一种发票识别方法,其特征在于,所述方法包括:对发票图像进行文本识别处理,得到所述发票图像的文本识别结果;对所述发票图像的文本识别结果进行分行,得到至少一个文本行;基于所述至少一个文本行中每行包含的文本识别结果,确定所述发票图像中的条目对应的条目信息。
【技术特征摘要】
1.一种发票识别方法,其特征在于,所述方法包括:对发票图像进行文本识别处理,得到所述发票图像的文本识别结果;对所述发票图像的文本识别结果进行分行,得到至少一个文本行;基于所述至少一个文本行中每行包含的文本识别结果,确定所述发票图像中的条目对应的条目信息。2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个文本行中每行包含的文本识别结果,确定所述发票图像中的条目对应的条目信息,包括:通过对所述至少一个文本行中每行包含的文本识别结果进行逐行分析,确定所述发票图像中的条目对应的条目信息。3.根据权利要求2所述的方法,其特征在于,所述通过对所述至少一个文本行中每行包含的文本识别结果进行逐行分析,确定所述发票图像中的条目对应的条目信息,包括:对所述至少一个文本行中第一文本行包含的文本识别结果进行分析,确定所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系;基于所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系,对所述第一文本行的下一文本行包含的文本识别结果进行分析。4.根据权利要求3所述的方法,其特征在于,所述第一文本行的文本识别结果包括所述第一文本行中至少一个文本框的文本识别结果;所述对所述至少一个文本行中第一文本行包含的文本识别结果进行分析,确定所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系,包括:确定所述至少一个文本框中第一文本框的文本识别结果中包含第一条目,所述至少一个条目包括所述第一条目;确定在所述至少一个文本框中与所述第一文本框相邻的至少一个第二文本框的文本识别结果中是否包含所述第一条目的条目信息;在所述至少一个第二文本框的文本识别结果中不存在所述第一条目的条目信息的情况下,在至少一个第三文本框的文本识别结果中查找所述第一条目的条目信息,其中,所...
【专利技术属性】
技术研发人员:郑迪昕,梁鼎,刘学博,
申请(专利权)人:北京市商汤科技开发有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。