一种端到端的图章识别方法及系统技术方案

技术编号：25309748 阅读：24 留言：0更新日期：2020-08-18 22:28

本发明专利技术公开了一种端到端的图章识别方法及系统，属于图像处理领域。该方法包括：输入原始图章图像，并提取原始图章图像的卷积网络特征图；基于卷积网络特征图，通过文本框定位网络定位原始图章图像中的文本框；通过卷积网络特征图和文本框的位置，获取文本框包含文字特征对应的文字编码，得到文本信息；通过卷积网络特征图和文本框的位置获取图网络特征，并通过图网络特征推理得到各文本框之间的关联关系；根据关联关系合并文本框以及文本信息，得到每一个关联的文本行几何信息以及相应的文本行信息，并输出结果。本发明专利技术可以处理所有可能的不规则的图章，在一个训练环节完成整个图章识别的所有步骤，真正做到自动化学习。

全部详细技术资料下载

【技术实现步骤摘要】
一种端到端的图章识别方法及系统
本专利技术涉及图像处理领域，尤其是一种端到端的图章识别方法及系统。
技术介绍
在企业事业单位、银行、保险等等日常的工作中，有大量的合同、票据、公文、单据等正式的文档需要处理、检查、识别、结构化，其中很重要的一个工作就是检查这些正式文档是否有盖章，以及所盖的章是否正确，是否清晰可辨别等等。以往的图章识别方法采用了多种传统图像处理方法(尤其OpenCV)或者多个深度学习的方法组合，步骤多，处理复杂，消耗内存，消耗时间。深度学习模型在训练过程中，从输入端(输入数据)到输出端会得到一个预测结果，与真实结果相比较会得到一个误差，这个误差会在模型中的每一层传递(反向传播)，每一层的表示都会根据这个误差来做调整，直到模型收敛或达到预期的效果才结束，中间所有的操作都包含在神经网络内部，不再分成多个模块处理。由原始数据输入，到结果输出，从输入端到输出端，中间的神经网络自成一体(也可以当做黑盒子看待)，这即为端到端技术。本专利技术提供了一个端到端的图章识别方法，可以处理诸如合同、发票、票据、单据、公文、报告中图章，如图1所示。根据图章的使用类别可以包括合同专用章、发票专用章、保险专用章、公司公章、政府公章等等，按照形状分，可以分为圆章、椭圆章、正方形章、长方形章、三角形章、菱形章、六边形章等等，按照取图方式分有扫描仪扫描、高拍仪拍摄、手机拍摄等等，按照颜色分红色、蓝色、灰色、二值图像等等。专利技术介绍本专利技术提供了一种端到端的完整图章识别方法及系统，可以处理所有可...

【技术保护点】
1.一种端到端的图章识别方法，其特征在于，所述方法包括：/n步骤1：输入原始图章图像，并提取所述原始图章图像的卷积网络特征图；/n步骤2：基于卷积网络特征图，通过文本框定位网络定位所述原始图章图像中的文本框；/n步骤3：通过卷积网络特征图和文本框的位置，获取文本框包含文字特征对应的文字编码，得到文本信息；/n步骤4：通过卷积网络特征图和文本框的位置，获取图网络特征，并通过所述图网络特征推理得到各文本框之间的关联关系；/n步骤5：根据关联关系合并文本框以及文本信息，得到每一个关联的文本行几何信息以及相应的文本行信息，并输出结果。/n

【技术特征摘要】
1.一种端到端的图章识别方法，其特征在于，所述方法包括：
步骤1：输入原始图章图像，并提取所述原始图章图像的卷积网络特征图；
步骤2：基于卷积网络特征图，通过文本框定位网络定位所述原始图章图像中的文本框；
步骤3：通过卷积网络特征图和文本框的位置，获取文本框包含文字特征对应的文字编码，得到文本信息；
步骤4：通过卷积网络特征图和文本框的位置，获取图网络特征，并通过所述图网络特征推理得到各文本框之间的关联关系；
步骤5：根据关联关系合并文本框以及文本信息，得到每一个关联的文本行几何信息以及相应的文本行信息，并输出结果。

2.根据权利要求1所述的图章识别方法，其特征在于，步骤1中，采用U型卷积神经网络提取所述原始图章图像的卷积网络特征图。

3.根据权利要求1所述的图章识别方法，其特征在于，步骤2中，所述文本框定位网络包括但不限于图像分割网络、字符框回归网络或者RCNN系列网络。

4.根据权利要求1所述的图章识别方法，其特征在于，所述步骤3具体包括：
步骤31：根据文本框的位置，将文本框映射到卷积网络特征图中；
步骤32：提取文本框内已有的卷积网络特征；
步骤33：经过全连接神经网络，得到各文本框包含文字特征对应的文字编码，基于文字编码得到相应的文本信息。

5.根据权利要求1所述的图章识别方法，其特征在于，所述步骤4具体包括：
步骤41：对文本框的坐标信息进行卷积网络特征嵌入；
步骤42：提取文本框内已有的卷积网络特征；
步骤43：提取该文本框跟周边其他文本框的局部图特征；
步骤44：将嵌入的卷积网络特征、已有的卷积网络特征以及局部图特征进行融合，形成图网络特征；
步骤45...

【专利技术属性】
技术研发人员：朱军民，王勇，康铁刚，
申请(专利权)人：北京易道博识科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人