基于位置模板与语义模板的票据图像字段定位方法及系统技术方案

技术编号:17110855 阅读:24 留言:0更新日期:2018-01-24 22:43
本发明专利技术提供了一种基于位置模板与语义模板的票据图像字段定位方法及系统,包括:分析字段在票据图像中四类位置属性;为不同的票据类型分别制定不同的模板配置xml文件;通过票据分类系统分析票据图像的票据类型,并加载与该票据图像具有相同的票据类型的模板配置xml文件;定位票据图像中全部的字段位置坐标;通过模板配置xml文件并根据四类位置属性进行定位计算获取所需要识别的字段在票据图像的位置坐标,并获取该字段局部图像;文字识别系统采用OCR技术将字段局部图像识别成字符串。本发明专利技术能有效的获得字段在票据图像的具体位置坐标,有效的保存了大量关于发票类型特点规律的数据,为发票文字定位、文字识别提供更多的数据支持。

Location method and system of bill image field based on position template and semantic template

The invention provides a position template and the semantic template of bill image positioning method and system based on the field, including: analysis of four kinds of fields in the bill image location attribute; for different types of instruments were developed with different template configuration XML file; through the bill bill image classification system of bill type, and has the same bill the type of template configuration XML file loading and the bill image; field position coordinates all the positioning of the bill image; through the template configuration XML file and location calculation to obtain the required identification of the fields in the position coordinates of bill image based on four kinds of location attributes, and obtain the local field image; text recognition system of local image recognition field a string using OCR technology. The invention can effectively acquire the specific location coordinates of the field in the bill image, effectively save a lot of data about the invoice type characteristics and provide more data support for the invoice character location and character recognition.

【技术实现步骤摘要】
基于位置模板与语义模板的票据图像字段定位方法及系统
本专利技术属于图像识别、视频分析领域,尤其涉及一种基于位置模板与语义模板的票据图像字段定位方法及系统。
技术介绍
现代社会的各种商业活动,广泛使用各种票据,尽管电子支付、电子票据等发展日益增多,传统纸质票据仍然被广泛使用,如各类纸质发票、金融票据等。目前,财务部门平均每天有大量的票据影像,多岗位员工需要对同一张票据进行重复稽核,不仅耗费人力,而且降低了报账效率。通过图像OCR技术实现票面信息的提取,将提取的票面信息与报账信息进行对比,实现自动稽核;OCR提取的票据信息存入数据库中,相当于一个具有极强记忆力的大脑,可以很容易发现报账名称和纳税人识别号不一致,拆分报账等问题。同时,在互联网+财务的发展趋势背景下,借助OCR技术,将非结构化扫描影像数据中的有用信息转换为结构化的字符串数据,为有效数据挖掘和财务大数据分析提供数据基础。票据OCR智能识别系统,一般有三个系统组成:票据类型分类系统、票据图像字段定位系统、票据图像文字识别系统。票据分类系统,基于图像特征,分析票据的类型,输出票据的类型给字段定位系统;字段定位系统根据票据的类型,采取相应的策略,获取每个字段的位置和局部图像;定位系统将字段局部图像输出到文字识别系统中,文字识别系统将图像文件OCR识别成字符串文件。专利CN201310082322“票据信息区域自动识别和提取方法及设备”侧重使用级联分类器对发票进行分类,在字段定位模块中,只是使用固定位置来提取特定的字段,适用的票据范围太小。专利CN201610070970“一种基于OCR的票据自动识别与处理系统”是针对增值税发票,适用票据类型不具有广泛性,而且在增值税发票处理中,只是对指定的几个字段做固定位置定位获取。
技术实现思路
本专利技术的目的为了克服现有技术中的不足,提供一种基于位置模板与语义模板的票据图像字段定位方法及系统,本基于位置模板与语义模板的票据图像字段定位方法及系统能有效的获得字段在票据图像的具体位置坐标,有效的保存了大量关于发票类型特点规律的数据,为发票文字定位、文字识别提供更多的数据支持。为实现上述技术目的,本专利技术采取的技术方案之一是:一种基于位置模板与语义模板的票据图像字段定位方法,其特征在于包括以下步骤:步骤1:字段定位系统分析字段在票据图像中四类位置属性;步骤2:字段定位系统根据不同票据类型的格式规律,为不同的票据类型分别制定不同的模板配置xml文件;步骤3:票据分类系统分析票据图像的票据类型并发送票据类型到字段定位系统,字段定位系统加载与该票据图像具有相同的票据类型的模板配置xml文件;步骤4:获取票据图像中全部的字段位置坐标;步骤5:字段定位系统通过模板配置xml文件并根据四类位置属性进行定位计算从而获取所需要识别的字段在票据图像的具体位置坐标,并获取该字段局部图像;步骤6:字段定位系统将字段局部图像输入到文字识别系统中,文字识别系统采用OCR技术将字段局部图像识别成字符串。优选的,所述的步骤1中四类位置属性包括:(a)固定位置属性,字段在票据图像中的位置固定不动;(b)套打位置属性,票据图像中的字段的打印是套用一定格式打印的,每个字段之间的相对位置不动,但字段在票据上的位置却不固定;选取车辆训练正样本和负样本,建立样本标签数据表;(c)标题语义属性,字段在票据图像上位置变化不定,且每个字段有一个标题;(d)关键语义属性,字段在票据图像上位置变化不定,且每个字段没有标题,但有一定关键语义。优选的,所述的步骤2包括以下步骤:(a)字段定位系统收集不同票据类型的高清票据图像,根据所需要识别的字段为不同的票据类型分别制定不同的模板配置xml文件;(b)每个模板配置xml文件中,均写明票据类型ID、票据名称和票据图像的中所需要识别的字段数目,写明所需要识别的每个字段的ID、每个字段的名称、每个字段的定位属性、每个字段在票据图像中的位置、每个字段的存在标题和每个字段的关键语义,计算并记录每个字段间相对位置;(c)字段定位系统将每个模板配置xml文件均以其所属的票据图像的类型ID命名并保存。优选的,所述的步骤3包括以下步骤:(a)票据分类系统分析出票据图像的票据类型,并将该票据图像的票据类型ID输出到字段定位系统;(b)字段定位系统根据票据类型ID,从所有的模板配置xml文件中加载与该票据图像的票据类型ID相同的模板配置xml文件,获取该类型票据的定位属性,即票据图像中字段的位置属性。优选的,所述步骤5具体包括以下步骤:(a)字段定位系统获取与该票据图像对应的模板配置xml文件中的字段位置坐标数据;(b)如果步骤1中判断的字段在票据图像中的位置属性属于固定位置属性,字段定位系统从步骤4的票据图像的全部的字段位置坐标中提取与模板配置xml文件中的对应相同的字段位置坐标,该一致的字段位置坐标即为所需要识别的字段位置坐标,获取所需要识别的字段局部图像;(c)如果步骤1中判断的字段在票据图像中的位置属性属于套打位置属性,字段定位系统通过图像特征方法从步骤4的票据图像中的全部的字段位置坐标中获取有标志特征的字段,命名为标志字段;分析模板配置xml文件的字段中与标志字段具有相同的字段的位置坐标和标志字段在票据图像中的位置坐标之间的关系,计算模板配置xml文件中其他的字段位置坐标,从而计算步骤4的票据图像中与模板配置xml文件中的全部字段具有相同的字段的位置坐标并获取该字段局部图像;(d)如果步骤1中判断的字段在票据图像中的位置属性属于标题语义属性,字段定位系统从步骤4的票据图像的全部的字段位置坐标中识别字符串值,判断字符串中是否包含标题语义,如果包含,则提取标题后面的真实字段信息,从票据图像的真实字段信息中提取与模板配置xml文件中的对应相同的字段,根据相同的字段在票据图像中的位置坐标获取该字段局部图像;(e)如果步骤1中判断的字段在票据图像中的位置属性属于关键语义属性,字段定位系统从步骤4的票据图像的全部的字段位置坐标中识别字符串值,判断字符串中是否包含关键语义,如果包含,提取关键的字段信息,从票据图像中关键的字段信息中提取与模板配置xml文件中相同的字段,根据相同的字段在票据图像中的位置坐标获取该字段局部图像。为实现上述技术目的,本专利技术采取的技术方案之二是:一种基于位置模板与语义模板的票据图像字段定位系统,其特征在于该系统包括字段定位系统、票据分类系统和文字识别系统,字段定位系统分别与票据分类系统和文字识别系统连接;所述的字段定位系统包括:分析模块,用于分析字段在票据图像中四类位置属性;制作模块,用于根据不同票据类型的格式规律,为不同的票据类型分别制定不同的模板配置xml文件;接收模块,用于接收票据分类系统发送的票据图像的票据类型;加载模块,用于加载与该票据图像具有相同的票据类型的模板配置xml文件;获取模块,用于根据票据图像的位置属性和模板配置xml文件中字段的位置坐标从而获取所需要识别的字段在票据图像的具体位置坐标并获取所需要识别的字段局部图像;发送模块,用于发送字段局部图像到文字识别系统;所述票据分类系统用于分析票据图像的票据类型并发送票据类型到字段定位系统;所述文字识别系统用于接收字段定位系统中的发送模块发送的字段局部图像,并采本文档来自技高网
...
基于位置模板与语义模板的票据图像字段定位方法及系统

【技术保护点】
一种基于位置模板与语义模板的票据图像字段定位方法,其特征在于包括以下步骤:步骤1:字段定位系统分析字段在票据图像中四类位置属性;步骤2:字段定位系统根据不同票据类型的格式规律,为不同的票据类型分别制定不同的模板配置xml文件;步骤3:票据分类系统分析票据图像的票据类型并发送票据类型到字段定位系统,字段定位系统加载与该票据图像具有相同的票据类型的模板配置xml文件;步骤4: 获取票据图像中全部的字段位置坐标;步骤5:字段定位系统通过模板配置xml文件并根据四类位置属性进行定位计算从而获取所需要识别的字段在票据图像的具体位置坐标,并获取该字段局部图像;步骤6:字段定位系统将字段局部图像输入到文字识别系统中,文字识别系统采用OCR技术将字段局部图像识别成字符串。

【技术特征摘要】
1.一种基于位置模板与语义模板的票据图像字段定位方法,其特征在于包括以下步骤:步骤1:字段定位系统分析字段在票据图像中四类位置属性;步骤2:字段定位系统根据不同票据类型的格式规律,为不同的票据类型分别制定不同的模板配置xml文件;步骤3:票据分类系统分析票据图像的票据类型并发送票据类型到字段定位系统,字段定位系统加载与该票据图像具有相同的票据类型的模板配置xml文件;步骤4:获取票据图像中全部的字段位置坐标;步骤5:字段定位系统通过模板配置xml文件并根据四类位置属性进行定位计算从而获取所需要识别的字段在票据图像的具体位置坐标,并获取该字段局部图像;步骤6:字段定位系统将字段局部图像输入到文字识别系统中,文字识别系统采用OCR技术将字段局部图像识别成字符串。2.根据权利要求1所述的一种基于位置模板与语义模板的票据图像字段定位方法,其特征在于所述的步骤1中四类位置属性包括:(a)固定位置属性,字段在票据图像中的位置固定不动;(b)套打位置属性,票据图像中的字段的打印是套用一定格式打印的,每个字段之间的相对位置不动,但字段在票据上的位置却不固定;选取车辆训练正样本和负样本,建立样本标签数据表;(c)标题语义属性,字段在票据图像上位置变化不定,且每个字段有一个标题;(d)关键语义属性,字段在票据图像上位置变化不定,且每个字段没有标题,但有一定关键语义。3.根据权利要求1所述的一种基于位置模板与语义模板的票据图像字段定位方法,其特征在于所述的步骤2包括以下步骤:(a)字段定位系统收集不同票据类型的高清票据图像,根据所需要识别的字段为不同的票据类型分别制定不同的模板配置xml文件;(b)每个模板配置xml文件中,均写明票据类型ID、票据名称和票据图像的中所需要识别的字段数目,写明所需要识别的每个字段的ID、每个字段的名称、每个字段的定位属性、每个字段在票据图像中的位置、每个字段的存在标题和每个字段的关键语义,计算并记录每个字段间相对位置;(c)字段定位系统将每个模板配置xml文件均以其所属的票据图像的类型ID命名并保存。4.根据权利要求1所述的一种基于位置模板与语义模板的票据图像字段定位方法,其特征在于所述的步骤3包括以下步骤:(a)票据分类系统分析出票据图像的票据类型,并将该票据图像的票据类型ID输出到字段定位系统;(b)字段定位系统根据票据类型ID,从所有的模板配置xml文件中加载与该票据图像的票据类型ID相同的模板配置xml文件,获取该类型票据的定位属性,即票据图像中字段的位置属性。5.根据权利要求1所述的一种基于位置模板与语义模板的票据图像字段定位方法,其特征在于所述步骤5具体包括以下步骤:(a)字段...

【专利技术属性】
技术研发人员:车少帅于志文胡笳
申请(专利权)人:江苏鸿信系统集成有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1