一种票据类图像版面解析方法及装置制造方法及图纸

技术编号:30828339 阅读:27 留言:0更新日期:2021-11-18 12:33
一种票据类图像版面解析方法,包括:准备用于模型训练的训练版面样本,进行人工标注;对训练版面样本中文本框进行特征编码;将所述文本框的坐标特征与文本特征进行特征拼接,形成所述文本框的拼接特征;将训练版面样本中的多个候选框的所述拼接特征进行拼接,形成所述训练版面样本的特征序列向量;对模型进行训练,获得版面解析模型;将所述待解析版面的特征序列向量输入所述版面解析模型,获得所述待解析版面的解析结果。本发明专利技术采用机器学习方法,实现了端到端训练与处理过程,相对于传统的特征工程方法极大降低了人工的工作量,同时还提升了模型构架的运行效率,显著提高了票据类图像版面解析的准确性。类图像版面解析的准确性。类图像版面解析的准确性。

【技术实现步骤摘要】
一种票据类图像版面解析方法及装置


[0001]本专利技术属于计算机应用
,涉及一种图像识别处理方法及装置,特别涉及一种票据类图像版面解析方法及装置。

技术介绍

[0002]在日常生活中,有大量的票据图像需要结构化存储。例如身份证、增值税发票、火车票、飞机票等。这些票据图像在电子化的过程中往往因为人员、设备、场景等因素,导致电子图像出现各种问题,例如倾斜、遮挡、模糊、反光等。这就会给后续的数据结构化带来两方面的挑战,一是OCR识别的挑战,二是版面分析的挑战。目前OCR识别技术已经较为成熟,但是版面分析技术却没有较为有效的解决方案。
[0003]现有的版面分析方法通常采用特征工程的方式,首先采用OCR算法识别图像版面中的每个文本框的文字坐标和文字内容,然后通过基于规则的方法将关键信息提取出来,例如姓名、日期、身份证号、校验码等。由于实际业务场景中获取的票据图像通常存在上述诸多问题,都吃基于规则的方法需要不断对设置的规则进行调整维护,不仅耗用大量的人工成本,而且还会造成规则越积越多,各类规则之间容易产生冲突,升级维护越来越复杂;同时,也本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种票据类图像版面解析方法,其特征在于,包括以下步骤:s1准备用于模型训练的训练版面样本,进行人工标注;s2对训练版面样本中文本框进行特征编码,所述特征编码至少包括所述文本框的坐标特征和文本特征;s3将所述文本框的坐标特征与文本特征进行特征拼接,形成所述文本框的拼接特征;将训练版面样本中的多个候选框的所述拼接特征进行拼接,形成所述训练版面样本的特征序列向量;s4利用所述训练版面样本的特征序列向量对模型进行训练,获得版面解析模型;s5对于待解析版面,采用与上述步骤s2至s3相同的方法,获得所述待解析版面的特征序列向量;将所述待解析版面的特征序列向量输入所述版面解析模型,获得所述待解析版面的解析结果。2.根据权利要求1所述的票据类图像版面解析方法,其特征在于,所述步骤s1还包括:采用数据增广策略,对训练版面样本进行数据增广;其中,所述数据增广策略包括以下方法中的一种或多种:随机扰动所述训练版面样本中检测框的坐标点;随机丢弃所述训练版面样本中的一个或多个检测框;随机切分所述检测框,并随机拆分所述检测框中的文本;随机替换所述检测框中的文本内容。3.根据权利要求2所述的票据类图像版面解析方法,其特征在于,步骤s2中所述文本特征包括以下信息中的一种或多种:数字占比、英文占比、符号占比、其他字符占比。4.根据权利要求3所述的票据类图像版面解析方法,其特征在于,所述步骤s2中对训练版面样本中文本框进行特征编码时,对所述坐标特征进行维度拉伸。5.根据权利要求4所述的票据类图像版面解析方法,其特征在于,所述步骤s4中采用的模型为seq2seq+attention模型...

【专利技术属性】
技术研发人员:丁大强李蒙阳石海涛胡安裕
申请(专利权)人:北京玖安天下科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1