一种票据类图像版面解析方法及装置制造方法及图纸

技术编号：30828339 阅读：27 留言：0更新日期：2021-11-18 12:33

一种票据类图像版面解析方法，包括：准备用于模型训练的训练版面样本，进行人工标注；对训练版面样本中文本框进行特征编码；将所述文本框的坐标特征与文本特征进行特征拼接，形成所述文本框的拼接特征；将训练版面样本中的多个候选框的所述拼接特征进行拼接，形成所述训练版面样本的特征序列向量；对模型进行训练，获得版面解析模型；将所述待解析版面的特征序列向量输入所述版面解析模型，获得所述待解析版面的解析结果。本发明专利技术采用机器学习方法，实现了端到端训练与处理过程，相对于传统的特征工程方法极大降低了人工的工作量，同时还提升了模型构架的运行效率，显著提高了票据类图像版面解析的准确性。类图像版面解析的准确性。类图像版面解析的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种票据类图像版面解析方法及装置

[0001]本专利技术属于计算机应用
，涉及一种图像识别处理方法及装置，特别涉及一种票据类图像版面解析方法及装置。

技术介绍

[0002]在日常生活中，有大量的票据图像需要结构化存储。例如身份证、增值税发票、火车票、飞机票等。这些票据图像在电子化的过程中往往因为人员、设备、场景等因素，导致电子图像出现各种问题，例如倾斜、遮挡、模糊、反光等。这就会给后续的数据结构化带来两方面的挑战，一是OCR识别的挑战，二是版面分析的挑战。目前OCR识别技术已经较为成熟，但是版面分析技术却没有较为有效的解决方案。
[0003]现有的版面分析方法通常采用特征工程的方式，首先采用OCR算法识别图像版面中的每个文本框的文字坐标和文字内容，然后通过基于规则的方法将关键信息提取出来，例如姓名、日期、身份证号、校验码等。由于实际业务场景中获取的票据图像通常存在上述诸多问题，都吃基于规则的方法需要不断对设置的规则进行调整维护，不仅耗用大量的人工成本，而且还会造成规则越积越多，各类规则之间容易产生冲突，升级维护...

【技术保护点】

【技术特征摘要】
1.一种票据类图像版面解析方法，其特征在于，包括以下步骤：s1准备用于模型训练的训练版面样本，进行人工标注；s2对训练版面样本中文本框进行特征编码，所述特征编码至少包括所述文本框的坐标特征和文本特征；s3将所述文本框的坐标特征与文本特征进行特征拼接，形成所述文本框的拼接特征；将训练版面样本中的多个候选框的所述拼接特征进行拼接，形成所述训练版面样本的特征序列向量；s4利用所述训练版面样本的特征序列向量对模型进行训练，获得版面解析模型；s5对于待解析版面，采用与上述步骤s2至s3相同的方法，获得所述待解析版面的特征序列向量；将所述待解析版面的特征序列向量输入所述版面解析模型，获得所述待解析版面的解析结果。2.根据权利要求1所述的票据类图像版面解析方法，其特征在于，所述步骤s1还包括：采用数据增广策略，对训练版面样本进行数据增广；其中，所述数据增广策略包括以下方法中的一种或多种：随机扰动所述训练版面样本中检测框的坐标点；随机丢弃所述训练版面样本中的一个或多个检测框；随机切分所述检测框，并随机拆分所述检测框中的文本；随机替换所述检测框中的文本内容。3.根据权利要求2所述的票据类图像版面解析方法，其特征在于，步骤s2中所述文本特征包括以下信息中的一种或多种：数字占比、英文占比、符号占比、其他字符占比。4.根据权利要求3所述的票据类图像版面解析方法，其特征在于，所述步骤s2中对训练版面样本中文本框进行特征编码时，对所述坐标特征进行维度拉伸。5.根据权利要求4所述的票据类图像版面解析方法，其特征在于，所述步骤s4中采用的模型为seq2seq+attention模型...

【专利技术属性】
技术研发人员：丁大强，李蒙阳，石海涛，胡安裕，
申请(专利权)人：北京玖安天下科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人