一种表单分类方法及装置制造方法及图纸

技术编号：31741030 阅读：24 留言：0更新日期：2022-01-05 16:19

本说明书实施例提供了一种表单分类方法及装置。本发明专利技术将模型学习到的文本特征信息、文本布局特征信息和图像特征信息进行融合，共同决定表单的分类结果，提高了模型分类的准确率。另外，采用改进的自适应学习率算法，进一步提高了模型的分类准确率，解决了表单分类准确性不高的问题。性不高的问题。性不高的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种表单分类方法及装置

[0001]本说明书实施例涉及计算机
，尤其涉及一种表单分类方法及装置。

技术介绍

[0002]传统的表单分类方法是基于规则的方法，使用预定义的规则将表单进行分类，例如，任何带有“篮球”、“足球”字样的表单都被归类为体育类表单。
[0003]这种表单分类方式所使用的信息是单一的，使得决定表单分类的因素变得单一，最终影响到表单分类的准确性。

技术实现思路

[0004]本说明书实施例提供及一种表单分类方法及装置，以解决现有技术存在的问题。
[0005]第一方面，本说明书实施例提供一种表单分类方法，包括：
[0006]获取目标表单图像；
[0007]对目标表单图像进行文字识别，得到目标表单图像中每个单元格各自对应的第一文本信息、第一标识信息和第一文本布局坐标；
[0008]将所述第一文本信息和第一标识信息输入循环神经网络，得到第一文本特征信息；
[0009]将所述第一文本布局坐标和第一标识信息输入目标检测网络，得到第一文本布局特征信息；<br/>[0010]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种表单分类方法，其特征在于，包括：获取目标表单图像；对目标表单图像进行文字识别，每个单元格会对应一个文本信息，得到目标表单图像中每个单元格各自对应的第一文本信息及、对应的第一标识信息和第一文本布局坐标，即每一部分文本都会被一个矩形框框出来，矩形框的左上，右上，右下，左下的顺序，就是文本布局的坐标；将所述第一文本信息和第一标识信息输入循环神经网络，得到第一文本特征信息；将所述第一文本布局坐标和第一标识信息输入目标检测网络，得到第一文本布局特征信息；将所述目标表单图像输入卷积神经网络，得到第一图像特征信息；将所述第一文本特征信息、第一文本布局特征信息和第一图像特征信息进行变形，得到同一维度的向量，对变形后的第一文本特征信息、第一文本布局特征信息和第一图像特征信息进行特征融合；将融合后的特征输入表单分类模型，得到目标表单的表单分类结果。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：对带分类标签的样本表单图像进行文字识别，得到样本表单图像中每个单元格各自对应的第二文本信息、第二标识信息和第二文本布局坐标；将所述第二文本信息和第二标识信息输入循环神经网络，得到第二文本特征信息；将所述第二文本布局坐标和第二标识信息输入目标检测网络，得到第二文本布局特征信息；将所述样本表单图像输入卷积神经网络，得到第二图像特征信息；将所述第二文本特征信息、第二文本布局特征信息和第二图像特征信息进行变形，得到同一维度的向量，对变形后的第二文本特征信息、第二文本布局特征信息和第二图像特征信息进行特征融合；利用融合后的特征训练表单分类模型。3.根据权利要求2所述的方法，其特征在于，利用融合后的特征训练表单分类模型的过程中，根据迭代的次数优化学习率l，具体公式如下：其中，l0是初始的学习率，i表示第i次迭代，L表示网络训练的总迭代次数。4.根据权利要求3所述的方法，其特征在于，l0取值为0.005，L取值为800。5.根据权利要求2所述的方法，其特征在于，所述方法还包括：获取原始样本表单图像集合；对原始样本表单图像集合中的样本表单图像进行以下至少一项操作...

【专利技术属性】
技术研发人员：王凡，李磊，李军，
申请(专利权)人：华清科盛北京信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人