一种票据分类识别方法及系统技术方案

技术编号:22330644 阅读:69 留言:0更新日期:2019-10-19 12:22
本发明专利技术实施例公开了一种票据分类识别方法及系统,包括:获取含有票据的图片,对图片中的票据进行识别分类,获得票据识别结果,票据识别结果包括N张单张票据图片;对N张单张票据图片进行文字识别,获得文字识别结果;将文字识别结果封装成专项模型。通过将含有票据的图片进行分类分割,形成多张单张票据图片,再分别对单张票据图片进行文字识别,识别出票据上的文字内容及票据所属的类型,由此可以将同一张报销单上的多张且不同类型的票据进行自动分类识别,提高了分类效率,简化了财务人员的票据分拣工作;并分别将单张票据图片的文字识别结果封装成各票据对应的专项模型,以供其它业务使用,为后续审核提供方便。

【技术实现步骤摘要】
一种票据分类识别方法及系统
本专利技术属于电子办公
,尤其涉及一种票据分类识别方法及系统。
技术介绍
目前财务共享办公领域发票报销,扫描,审核大多仍采取人工审核方式,财务人员每天都面临着实物票接受,分拣,扫描,审核,批复的过程。整个流程线枯燥乏味,存在着大量重复手工操作,尤其是票据审核,需要反复对比员工提报的报销流程信息与票面信息是否一致,费时费力。
技术实现思路
本专利技术的实施例提供一种票据分类识别方法及系统,能够自动识别分类一张报销单上的多种类型的票据,提高了识别效率,简化了财务人员的分拣工作。为达到上述目的,本专利技术的实施例采用如下技术方案:第一方面,本专利技术的实施例提供一种票据分类识别方法,包括:S10获取含有票据的图片,对所述图片中的票据进行识别分类,获得票据识别结果,所述图片包括N张票据,N为大于1的整数,所述票据识别结果包括N张单张票据图片;S20对所述N张单张票据图片进行文字识别,获得文字识别结果;S30将所述文字识别结果封装成专项模型。结合第一方面,在第一方面的第一种可能的实现方式中,所述步骤S10使用OCR识别技术对所述图片中的票据进行识别分类,具体包括:S101将所述图片的大小调整设定值;S102在所述调整后的图片上运行单个卷积网络;S103由OCR识别技术中的目标检测模型的置信度对S102获得的图片运行卷积结果进行阈值处理;S104利用神经网络做图像语义分割,获得N张单张票据图片。结合第一方面,在第一方面的第二种可能的实现方式中,所述步骤S20中使用OCR识别技术对N张单张票据图片进行文字识别,获得文字识别结果,所述文字识别结果包括所述单张票据图片上的文字以及所述文字位于所述单张票据图片上的坐标。结合第一方面,在第一方面的第三种可能的实现方式中,所述步骤S30具体包括:S301根据所属文字识别结果,得到所述单张票据图片上的票据所属的类型;S302根据所述票据所属的类型,将文字识别结果封装成所述票据的专项模型,所述专项模型包括至少一个业务字段;S303将所述一个或多个业务字段约定为所述专项模型的目标字段。第二方面,本专利技术的实施例提供一种票据分类识别系统,包括:票据识别模块,用于获取含有票据的图片,对所述图片中的票据进行识别分类,获得票据识别结果,所述图片包括N张票据,N为大于1的整数,所述票据识别结果包括N张单张票据图片;文字识别模块,用于对所述N张单张票据图片进行文字识别,获得文字识别结果。封装模块,用于将所述文字识别结果封装成专项模型。结合第二方面,在第二方面的第一种可能的实现方式中,所述票据识别模块进一步用于使用OCR识别技术对所述图片中的票据进行识别分类,具体包括:调整模块,用于将所述图片的大小调整设定值;卷积模块,用于在所述调整后的图片上运行单个卷积网络;处理模块,用于由OCR识别技术中的目标检测模型的置信度对S102获得的图片运行卷积结果进行阈值处理;分割模块,用于利用神经网络做图像语义分割,获得N张单张票据图片。结合第二方面,在第二方面的第二种可能的实现方式中,所述文字识别模块进一步用于使用OCR识别技术对N张单张票据图片进行文字识别,获得文字识别结果,所述文字识别结果包括所述单张票据图片上的文字以及所述文字位于所述单张票据图片上的坐标。结合第二方面,在第二方面的第三种可能的实现方式中,所述封装模块包括:匹配模块,用于根据所属文字识别结果,得到所述单张票据图片上的票据所属的类型;转换模块,用于根据所述票据所属的类型,将文字识别结果封装成所述票据的专项模型,所述专项模型包括至少一个业务字段;约定模块,用于将所述一个或多个业务字段约定为所述专项模型的目标字段。本专利技术实施例提供的票据分类识别方法及系统,通过将含有多种类型票据的图片进行分割,形成多张单张票据图片,再分别对单张票据图片进行文字识别,识别出票据上的文字,从而识别出票据所属的类型,由此可以将同一张报销单上的多张且不同类型的票据进行自动分类识别,相比于现有技术只能识别单张票据,提高了识别分类效率,简化了财务人员的票据分拣工作;将单张票据图片的文字识别结果封装成各票据对应的专项模型,以供其它业务使用,为后续审核提供方便。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本专利技术实施例提供的票据分类识别方法的流程图;图2为本专利技术实施例提供的票据分类识别系统的结构示意图。具体实施方式为使本领域技术人员更好地理解本专利技术的技术方案,下面结合附图和具体实施方式对本专利技术作进一步详细描述。下文中将详细描述本专利技术的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本专利技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。在本专利技术的实施例中,通过获取含有N(N为大于1的整数)张票据的图片,对图片中的票据进行识别分类,获得包括N张单张票据图片的票据识别结果,然后对N张单张票据图片进行文字识别,获得文字识别结果,最后将文字识别结果封装成专项模型,由此可以将贴在同一张报销单上的多张且多种类型的票据自动分类识别,提高了识别效率,简化了财务人员的分拣工作,并分别封装成各票据对应的专项模型,以供其它业务使用。下面结合图1具体说明本专利技术一个实施例的方法流程。在步骤S10中,获取含有票据的图片。例如报销人员将各种类型的票据粘贴在一张报销单上,通过摄像头对报销单进行拍摄或者通过扫描设备对报销单进行扫描,从而获得含有N张票据的图片。对图片中的票据进行识别分类,获得票据识别结果,票据识别结果包括N张单张票据图片。根据本专利技术的一个实施例,使用OCR识别技术对所述图片中的票据进行识别分类,具体包括以下具体步骤:首先将图片的大小调整为设定值,设定值可以是448×448分辨率,然后在调整后的图片上运行单个卷积网络,其次由OCR识别技术中的目标检测模型的置信度对获得的图片运行卷积结果进行阈值处理,最后利用神经网络做图像语义分割,获得N张单张票据图片。在步骤S20中,对所述N张单张票据图片进行文字识别,获得文字识别结果。根据本专利技术的一个实施例,使用OCR识别技术对N张单张票据图片进行文字识别,具体包括文本检测和基于CRNN模型的文字识别,获得文字识别结果,所述文字识别结果包括所述单张票据图片上从上到下,从左到右的文字以及对应的坐标。例如,获得的文字识别结果为图片从上到下,从左到右的坐标及坐标的文字对一张火车票图片进行文字识别,获得的文字识别结果为在步骤S30中,将所述文字识别结果封装成专项模型。根据本专利技术的一个实施例,步骤S30可包括以下具体步骤:S301根据文字识别结果,获得所本文档来自技高网
...

【技术保护点】
1.一种票据分类识别方法,其特征在于,包括:S10获取含有票据的图片,对所述图片中的票据进行识别分类,获得票据识别结果,所述图片包括N张票据,N为大于1的整数,所述票据识别结果包括N张单张票据图片;S20对所述N张单张票据图片进行文字识别,获得文字识别结果;S30将所述文字识别结果封装成专项模型。

【技术特征摘要】
1.一种票据分类识别方法,其特征在于,包括:S10获取含有票据的图片,对所述图片中的票据进行识别分类,获得票据识别结果,所述图片包括N张票据,N为大于1的整数,所述票据识别结果包括N张单张票据图片;S20对所述N张单张票据图片进行文字识别,获得文字识别结果;S30将所述文字识别结果封装成专项模型。2.根据权利要求1所述的方法,其特征在于,所述步骤S10中使用OCR识别技术对所述图片中的票据进行识别分类,具体包括:S101将所述图片的大小调整设定值;S102在所述调整后的图片上运行单个卷积网络;S103由OCR识别技术中的目标检测模型的置信度对S102获得的图片运行卷积结果进行阈值处理;S104利用神经网络做图像语义分割,获得N张单张票据图片。3.根据权利要求1所述的方法,其特征在于,所述步骤S20中使用OCR识别技术对N张单张票据图片进行文字识别,获得文字识别结果,所述文字识别结果包括所述单张票据图片上的文字以及所述文字位于所述单张票据图片上的坐标。4.根据权利要求1所述的方法,其特征在于,所述步骤S30具体包括:S301根据所述文字识别结果,得到所述单张票据图片上的票据所属的类型;S302根据所述票据所属的类型,将文字识别结果封装成所述票据的专项模型,所述专项模型包括至少一个业务字段;S303将所述一个或多个业务字段约定为所述专项模型的目标字段。5.一种票据分类识别系统,其特征在于,包括:...

【专利技术属性】
技术研发人员:郭近之王宇赵娟陆俊龙徐伟豪
申请(专利权)人:苏宁云计算有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1