一种发票识别方法及装置、计算机存储介质制造方法及图纸

技术编号:19277524 阅读:33 留言:0更新日期:2018-10-30 18:03
本公开公开了一种发票识别方法、装置及存储介质,其中,所述的方法包括:对发票图像进行文本识别处理,得到所述发票图像的文本识别结果;对所述发票图像的文本识别结果进行分行,得到至少一个文本行;基于所述至少一个文本行中每行包含的文本识别结果,确定所述发票图像中的条目对应的条目信息。

Invoice identification method and device, computer storage medium

The present disclosure discloses an invoice recognition method, device and storage medium, wherein the method includes: carrying out text recognition processing on the invoice image to obtain the text recognition result of the invoice image; dividing the text recognition result of the invoice image into lines to obtain at least one text line; and based on the at least one text line. The result of text recognition contained in each line of a text line determines the item information corresponding to the item in the invoice image.

【技术实现步骤摘要】
一种发票识别方法及装置、计算机存储介质
本公开涉及计算机视觉领域中的发票识别技术,具体涉及一种发票识别方法、装置及计算机存储介质。
技术介绍
增值税发票的文字检测识别是非常具有挑战性的。通常在检测某一类固定场景的文字检测识别时,例如身份证,驾驶证,这些证件的模板是固定的,文字印刷也比较工整,不会出现串行的情况。而在对发票如增值税发票进行检测识别时,往往需要面临增值税发票有多种板式、条目数量不确定等等各种问题。因此,如何提高增值税发票的识别准确度,是亟待解决的技术问题。
技术实现思路
有鉴于此,本公开提供一种发票识别方法及装置、计算机存储介质,能提高发票识别的准确率。第一方面,本公开实施例提供了一种发票识别方法,所述方法包括:对发票图像进行文本识别处理,得到所述发票图像的文本识别结果;对所述发票图像的文本识别结果进行分行,得到至少一个文本行;基于所述至少一个文本行中每行包含的文本识别结果,确定所述发票图像中的条目对应的条目信息。上述方案中,可选地,所述基于所述至少一个文本行中每行包含的文本识别结果,确定所述发票图像中的条目对应的条目信息,包括:通过对所述至少一个文本行中每行包含的文本识别结果进行逐行分析,确定所述发票图像中的条目对应的条目信息。上述方案中,可选地,所述通过对所述至少一个文本行中每行包含的文本识别结果进行逐行分析,确定所述发票图像中的条目对应的条目信息,包括:对所述至少一个文本行中第一文本行包含的文本识别结果进行分析,确定所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系;基于所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系,对所述第一文本行的下一文本行包含的文本识别结果进行分析。上述方案中,可选地,所述第一文本行的文本识别结果包括所述第一文本行中至少一个文本框的文本识别结果;所述对所述至少一个文本行中第一文本行包含的文本识别结果进行分析,确定所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系,包括:确定所述至少一个文本框中第一文本框的文本识别结果中包含第一条目,所述至少一个条目包括所述第一条目;确定在所述至少一个文本框中与所述第一文本框相邻的至少一个第二文本框的文本识别结果中是否包含所述第一条目的条目信息;在所述至少一个第二文本框的文本识别结果中不存在所述第一条目的条目信息的情况下,在至少一个第三文本框的文本识别结果中查找所述第一条目的条目信息,其中,所述第三文本框为所述至少一个文本框中除所述第一文本框和所述至少一个第二文本框之外的候选框。上述方案中,可选地,所述基于所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系,对所述第一文本行的下一文本行包含的文本识别结果进行分析,包括:若所述第一文本行的文本识别结果中不存在第一条目对应的条目信息,在所述下一文本行的文本识别结果中查找所述第一条目对应的条目信息;和/或若所述第一文本行的文本识别结果中不存在第一条目信息对应的条目,在所述下一文本行的文本识别结果中查找所述第一条目信息对应的条目。上述方案中,可选地,所述基于所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系,对所述第一文本行的下一文本行包含的文本识别结果进行分析,还包括:基于所述查找的结果,对所述下一文本行的文本识别结果进行分析,以确定所述下一文本行包含的条目与条目信息之间的对应关系。上述方案中,可选地,确定所述发票图像中的条目对应的条目信息之后,还包括:基于所述发票图像的多个条目之间的内在逻辑关系,对所述多个条目对应的条目信息进行验证。上述方案中,可选地,对所述多个条目对应的条目信息进行验证,包括:在所述多个条目包括处于同一文本行的单价条目、数量条目和总金额条目的情况下,验证处于同一文本行中的单价条目对应的单价信息乘以数量条目对应的数量信息,是否等于总金额条目对应的金额信息;和/或在所述多个条目包括处于同一列的至少一个金额条目和合计条目的情况下,验证处于同一列的所有金额条目对应的金额信息的相加结果是否等于合计条目对应的合计值信息。上述方案中,可选地,所述对所述多个条目对应的条目信息进行验证之后,还包括:在所述验证的结果表明所述内在逻辑关系得不到满足的情况下,调整所述多个条目对应的条目信息,直至调整结果使得所述内在逻辑关系得到满足。上述方案中,可选地,对发票图像进行文本识别处理之前,所述方法还包括:判断所述发票图像是否符合识别图像要求;在判断出所述发票图像不符合所述识别图像要求的情况下,对所述发票图像进行预处理,得到预处理后的发票图像;所述对发票图像进行文本识别处理,包括:对所述预处理后的发票图像进行文本识别处理。第二方面,本公开实施例提供了一种发票识别装置,所述装置包括:识别模块,用于对发票图像进行文本识别处理,得到所述发票图像的文本识别结果;分行模块,用于对所述发票图像的文本识别结果进行分行,得到至少一个文本行;确定模块,用于基于所述至少一个文本行中每行包含的文本识别结果,确定所述发票图像中的条目对应的条目信息。上述方案中,可选地,所述确定模块,还用于:通过对所述至少一个文本行中每行包含的文本识别结果进行逐行分析,确定所述发票图像中的条目对应的条目信息。上述方案中,可选地,所述确定模块,还用于:对所述至少一个文本行中第一文本行包含的文本识别结果进行分析,确定所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系;基于所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系,对所述第一文本行的下一文本行包含的文本识别结果进行分析。上述方案中,可选地,所述第一文本行的文本识别结果包括所述第一文本行中至少一个文本框的文本识别结果;所述确定模块,还用于:确定所述至少一个文本框中第一文本框的文本识别结果中包含第一条目,所述至少一个条目包括所述第一条目;确定在所述至少一个文本框中与所述第一文本框相邻的至少一个第二文本框的文本识别结果中是否包含所述第一条目的条目信息;在所述至少一个第二文本框的文本识别结果中不存在所述第一条目的条目信息的情况下,在至少一个第三文本框的文本识别结果中查找所述第一条目的条目信息,其中,所述第三文本框为所述至少一个文本框中除所述第一文本框和所述至少一个第二文本框之外的候选框。上述方案中,可选地,所述确定模块,还用于:若所述第一文本行的文本识别结果中不存在第一条目对应的条目信息,在所述下一文本行的文本识别结果中查找所述第一条目对应的条目信息;和/或若所述第一文本行的文本识别结果中不存在第一条目信息对应的条目,在所述下一文本行的文本识别结果中查找所述第一条目信息对应的条目。上述方案中,可选地,所述确定模块,还用于:基于所述查找的结果,对所述下一文本行的文本识别结果进行分析,以确定所述下一文本行包含的条目与条目信息之间的对应关系。上述方案中,可选地,所述装置还包括:验证模块,用于在所述确定模块确定所述发票图像中的条目对应的条目信息之后,基于所述发票图像的多个条目之间的内在逻辑关系,对所述多个条目对应的条目信息进行验证。上述方案中,可选地,所述验证模块,还用于:在所述多个条目包括处于同一文本行的单价条目、数量条目和总金额条目的情况下,验证处于同一文本行中的单价条目对应的单价信息乘本文档来自技高网...

【技术保护点】
1.一种发票识别方法,其特征在于,所述方法包括:对发票图像进行文本识别处理,得到所述发票图像的文本识别结果;对所述发票图像的文本识别结果进行分行,得到至少一个文本行;基于所述至少一个文本行中每行包含的文本识别结果,确定所述发票图像中的条目对应的条目信息。

【技术特征摘要】
1.一种发票识别方法,其特征在于,所述方法包括:对发票图像进行文本识别处理,得到所述发票图像的文本识别结果;对所述发票图像的文本识别结果进行分行,得到至少一个文本行;基于所述至少一个文本行中每行包含的文本识别结果,确定所述发票图像中的条目对应的条目信息。2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个文本行中每行包含的文本识别结果,确定所述发票图像中的条目对应的条目信息,包括:通过对所述至少一个文本行中每行包含的文本识别结果进行逐行分析,确定所述发票图像中的条目对应的条目信息。3.根据权利要求2所述的方法,其特征在于,所述通过对所述至少一个文本行中每行包含的文本识别结果进行逐行分析,确定所述发票图像中的条目对应的条目信息,包括:对所述至少一个文本行中第一文本行包含的文本识别结果进行分析,确定所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系;基于所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系,对所述第一文本行的下一文本行包含的文本识别结果进行分析。4.根据权利要求3所述的方法,其特征在于,所述第一文本行的文本识别结果包括所述第一文本行中至少一个文本框的文本识别结果;所述对所述至少一个文本行中第一文本行包含的文本识别结果进行分析,确定所述第一文本行包含的至少一个条目和至少一个条目信息之间的对应关系,包括:确定所述至少一个文本框中第一文本框的文本识别结果中包含第一条目,所述至少一个条目包括所述第一条目;确定在所述至少一个文本框中与所述第一文本框相邻的至少一个第二文本框的文本识别结果中是否包含所述第一条目的条目信息;在所述至少一个第二文本框的文本识别结果中不存在所述第一条目的条目信息的情况下,在至少一个第三文本框的文本识别结果中查找所述第一条目的条目信息,其中,所...

【专利技术属性】
技术研发人员:郑迪昕梁鼎刘学博
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1