【技术实现步骤摘要】
一种票据类图像版面解析方法及装置
[0001]本专利技术属于计算机应用
,涉及一种图像识别处理方法及装置,特别涉及一种票据类图像版面解析方法及装置。
技术介绍
[0002]在日常生活中,有大量的票据图像需要结构化存储。例如身份证、增值税发票、火车票、飞机票等。这些票据图像在电子化的过程中往往因为人员、设备、场景等因素,导致电子图像出现各种问题,例如倾斜、遮挡、模糊、反光等。这就会给后续的数据结构化带来两方面的挑战,一是OCR识别的挑战,二是版面分析的挑战。目前OCR识别技术已经较为成熟,但是版面分析技术却没有较为有效的解决方案。
[0003]现有的版面分析方法通常采用特征工程的方式,首先采用OCR算法识别图像版面中的每个文本框的文字坐标和文字内容,然后通过基于规则的方法将关键信息提取出来,例如姓名、日期、身份证号、校验码等。由于实际业务场景中获取的票据图像通常存在上述诸多问题,都吃基于规则的方法需要不断对设置的规则进行调整维护,不仅耗用大量的人工成本,而且还会造成规则越积越多,各类规则之间容易产生冲突,升级维护 ...
【技术保护点】
【技术特征摘要】
1.一种票据类图像版面解析方法,其特征在于,包括以下步骤:s1准备用于模型训练的训练版面样本,进行人工标注;s2对训练版面样本中文本框进行特征编码,所述特征编码至少包括所述文本框的坐标特征和文本特征;s3将所述文本框的坐标特征与文本特征进行特征拼接,形成所述文本框的拼接特征;将训练版面样本中的多个候选框的所述拼接特征进行拼接,形成所述训练版面样本的特征序列向量;s4利用所述训练版面样本的特征序列向量对模型进行训练,获得版面解析模型;s5对于待解析版面,采用与上述步骤s2至s3相同的方法,获得所述待解析版面的特征序列向量;将所述待解析版面的特征序列向量输入所述版面解析模型,获得所述待解析版面的解析结果。2.根据权利要求1所述的票据类图像版面解析方法,其特征在于,所述步骤s1还包括:采用数据增广策略,对训练版面样本进行数据增广;其中,所述数据增广策略包括以下方法中的一种或多种:随机扰动所述训练版面样本中检测框的坐标点;随机丢弃所述训练版面样本中的一个或多个检测框;随机切分所述检测框,并随机拆分所述检测框中的文本;随机替换所述检测框中的文本内容。3.根据权利要求2所述的票据类图像版面解析方法,其特征在于,步骤s2中所述文本特征包括以下信息中的一种或多种:数字占比、英文占比、符号占比、其他字符占比。4.根据权利要求3所述的票据类图像版面解析方法,其特征在于,所述步骤s2中对训练版面样本中文本框进行特征编码时,对所述坐标特征进行维度拉伸。5.根据权利要求4所述的票据类图像版面解析方法,其特征在于,所述步骤s4中采用的模型为seq2seq+attention模型...
【专利技术属性】
技术研发人员:丁大强,李蒙阳,石海涛,胡安裕,
申请(专利权)人:北京玖安天下科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。