【技术实现步骤摘要】
一种密集场景下的票据区域识别方法及装置
本专利技术属于图像处理
,涉及一种密集场景下的票据区域识别方法及装置。
技术介绍
在财税领域中,业务人员往往会通过影像设备对各种类型的票据进行拍摄以获取相应的票据图片信息,这些票据图片上一般都含有多个票据区域,每个票据区域的票样还不尽相同,如存在十几个甚至更多的票据区域,要将图片中所有的票据区域检测出来是非常难的,目前该领域内能见到的方案只能解决票据区域比较少的情况,当票据区域比较多的时候效果就会非常差,具体体现在:一方面会有大量的票据区域漏检或者过检;另一方面相邻票据区域之间会存在大量的重叠区域,尤其在极端的情况下,如一张票据图片中有50~100个票样不相同的票据区域,而且票据区域间排列紧凑,传统的票据区域检测方法这个时候往往表现非常差,无法达到使用要求,所以在票据区域非常密集的情况下如何将票据图片中的票据区域分割出来是非常有挑战性的,存在着对新技术的需求。
技术实现思路
本专利技术提出一种密集场景下的票据区域识别方法及装置,解决了现有技术中密集场景下票据难 ...
【技术保护点】
1.一种密集场景下的票据区域识别方法,其特征在于,包括以下步骤:/nS1:获取多张票据拍摄图片(1);/nS2:对每张所述票据拍摄图片(1)进行标注并获得标注区域(2),其中一个所述标注区域(2)包含一个票据区域信息(3);/nS3:将多张标注后的所述票据拍摄图片(1)按数量分为样本集一(4)和样本集二(5);/nS4:利用所述样本集一(4)对初始票据区域检测模型(10)进行训练,并获得训练后的票据区域检测模型(6);/nS5:根据所述样本集二(5)对所述训练后的票据区域检测模型(6)进行测试并获得训练好的票据区域检测模型(7);/nS6:根据所述训练好的票据区域检测模型( ...
【技术特征摘要】
1.一种密集场景下的票据区域识别方法,其特征在于,包括以下步骤:
S1:获取多张票据拍摄图片(1);
S2:对每张所述票据拍摄图片(1)进行标注并获得标注区域(2),其中一个所述标注区域(2)包含一个票据区域信息(3);
S3:将多张标注后的所述票据拍摄图片(1)按数量分为样本集一(4)和样本集二(5);
S4:利用所述样本集一(4)对初始票据区域检测模型(10)进行训练,并获得训练后的票据区域检测模型(6);
S5:根据所述样本集二(5)对所述训练后的票据区域检测模型(6)进行测试并获得训练好的票据区域检测模型(7);
S6:根据所述训练好的票据区域检测模型(7)获得多张所述票据拍摄图片(1)上的所有票据区域(11),每个所述票据区域(11)的票据区域信息(3)包括该票据区域(11)边框的中心坐标、高度及宽度。
2.根据权利要求1所述的一种密集场景下的票据区域识别方法,其特征在于,所述训练后的票据区域检测模型(6)的获取方法包括以下步骤:
S41.获得所述样本集一(4)中所有的标注区域(2)的票据区域信息(3);
S42.判断标注区域(2)是否为空,获得该标注区域(2)的票据类型;
S43.计算票据区域(11)与标注区域(2)的重叠度;
S44.联合S42-S43三个步骤的结果作为共同约束条件,获得最佳标注区域(8)。
3.根据权利要求1所述的一种密集场景下的票据区域识别方法,其特征在于,所述训练好的票据区域检测模型(7)的获取方法包括以下步骤:
S51.根据所述训练后的票据区域检测模型(6)获得所述样本集二(5)中所有所述最佳标注区域(8);
S52.根据所述最佳票据区域(8)获得与每个实际的票据区域(11)的票据区域信息(3)的偏差;
S53.通过调整所述票据拍摄图片(1)的总数,获得偏差满足预设阈值范围的所述训练好的票据区域检测模型(7)。
4.根据权利要求1所述的...
【专利技术属性】
技术研发人员:张汉宁,苏斌,弋渤海,田福康,王长辉,张俊杰,任会,方红超,
申请(专利权)人:西安网算数据科技有限公司,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。