The invention provides a position template and the semantic template of bill image positioning method and system based on the field, including: analysis of four kinds of fields in the bill image location attribute; for different types of instruments were developed with different template configuration XML file; through the bill bill image classification system of bill type, and has the same bill the type of template configuration XML file loading and the bill image; field position coordinates all the positioning of the bill image; through the template configuration XML file and location calculation to obtain the required identification of the fields in the position coordinates of bill image based on four kinds of location attributes, and obtain the local field image; text recognition system of local image recognition field a string using OCR technology. The invention can effectively acquire the specific location coordinates of the field in the bill image, effectively save a lot of data about the invoice type characteristics and provide more data support for the invoice character location and character recognition.
【技术实现步骤摘要】
基于位置模板与语义模板的票据图像字段定位方法及系统
本专利技术属于图像识别、视频分析领域,尤其涉及一种基于位置模板与语义模板的票据图像字段定位方法及系统。
技术介绍
现代社会的各种商业活动,广泛使用各种票据,尽管电子支付、电子票据等发展日益增多,传统纸质票据仍然被广泛使用,如各类纸质发票、金融票据等。目前,财务部门平均每天有大量的票据影像,多岗位员工需要对同一张票据进行重复稽核,不仅耗费人力,而且降低了报账效率。通过图像OCR技术实现票面信息的提取,将提取的票面信息与报账信息进行对比,实现自动稽核;OCR提取的票据信息存入数据库中,相当于一个具有极强记忆力的大脑,可以很容易发现报账名称和纳税人识别号不一致,拆分报账等问题。同时,在互联网+财务的发展趋势背景下,借助OCR技术,将非结构化扫描影像数据中的有用信息转换为结构化的字符串数据,为有效数据挖掘和财务大数据分析提供数据基础。票据OCR智能识别系统,一般有三个系统组成:票据类型分类系统、票据图像字段定位系统、票据图像文字识别系统。票据分类系统,基于图像特征,分析票据的类型,输出票据的类型给字段定位系统;字段定位系统根据票据的类型,采取相应的策略,获取每个字段的位置和局部图像;定位系统将字段局部图像输出到文字识别系统中,文字识别系统将图像文件OCR识别成字符串文件。专利CN201310082322“票据信息区域自动识别和提取方法及设备”侧重使用级联分类器对发票进行分类,在字段定位模块中,只是使用固定位置来提取特定的字段,适用的票据范围太小。专利CN201610070970“一种基于OCR的票据自动识别与处理 ...
【技术保护点】
一种基于位置模板与语义模板的票据图像字段定位方法,其特征在于包括以下步骤:步骤1:字段定位系统分析字段在票据图像中四类位置属性;步骤2:字段定位系统根据不同票据类型的格式规律,为不同的票据类型分别制定不同的模板配置xml文件;步骤3:票据分类系统分析票据图像的票据类型并发送票据类型到字段定位系统,字段定位系统加载与该票据图像具有相同的票据类型的模板配置xml文件;步骤4: 获取票据图像中全部的字段位置坐标;步骤5:字段定位系统通过模板配置xml文件并根据四类位置属性进行定位计算从而获取所需要识别的字段在票据图像的具体位置坐标,并获取该字段局部图像;步骤6:字段定位系统将字段局部图像输入到文字识别系统中,文字识别系统采用OCR技术将字段局部图像识别成字符串。
【技术特征摘要】
1.一种基于位置模板与语义模板的票据图像字段定位方法,其特征在于包括以下步骤:步骤1:字段定位系统分析字段在票据图像中四类位置属性;步骤2:字段定位系统根据不同票据类型的格式规律,为不同的票据类型分别制定不同的模板配置xml文件;步骤3:票据分类系统分析票据图像的票据类型并发送票据类型到字段定位系统,字段定位系统加载与该票据图像具有相同的票据类型的模板配置xml文件;步骤4:获取票据图像中全部的字段位置坐标;步骤5:字段定位系统通过模板配置xml文件并根据四类位置属性进行定位计算从而获取所需要识别的字段在票据图像的具体位置坐标,并获取该字段局部图像;步骤6:字段定位系统将字段局部图像输入到文字识别系统中,文字识别系统采用OCR技术将字段局部图像识别成字符串。2.根据权利要求1所述的一种基于位置模板与语义模板的票据图像字段定位方法,其特征在于所述的步骤1中四类位置属性包括:(a)固定位置属性,字段在票据图像中的位置固定不动;(b)套打位置属性,票据图像中的字段的打印是套用一定格式打印的,每个字段之间的相对位置不动,但字段在票据上的位置却不固定;选取车辆训练正样本和负样本,建立样本标签数据表;(c)标题语义属性,字段在票据图像上位置变化不定,且每个字段有一个标题;(d)关键语义属性,字段在票据图像上位置变化不定,且每个字段没有标题,但有一定关键语义。3.根据权利要求1所述的一种基于位置模板与语义模板的票据图像字段定位方法,其特征在于所述的步骤2包括以下步骤:(a)字段定位系统收集不同票据类型的高清票据图像,根据所需要识别的字段为不同的票据类型分别制定不同的模板配置xml文件;(b)每个模板配置xml文件中,均写明票据类型ID、票据名称和票据图像的中所需要识别的字段数目,写明所需要识别的每个字段的ID、每个字段的名称、每个字段的定位属性、每个字段在票据图像中的位置、每个字段的存在标题和每个字段的关键语义,计算并记录每个字段间相对位置;(c)字段定位系统将每个模板配置xml文件均以其所属的票据图像的类型ID命名并保存。4.根据权利要求1所述的一种基于位置模板与语义模板的票据图像字段定位方法,其特征在于所述的步骤3包括以下步骤:(a)票据分类系统分析出票据图像的票据类型,并将该票据图像的票据类型ID输出到字段定位系统;(b)字段定位系统根据票据类型ID,从所有的模板配置xml文件中加载与该票据图像的票据类型ID相同的模板配置xml文件,获取该类型票据的定位属性,即票据图像中字段的位置属性。5.根据权利要求1所述的一种基于位置模板与语义模板的票据图像字段定位方法,其特征在于所述步骤5具体包括以下步骤:(a)字段...
【专利技术属性】
技术研发人员:车少帅,于志文,胡笳,
申请(专利权)人:江苏鸿信系统集成有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。