一种表单分类方法及装置制造方法及图纸

技术编号:31741030 阅读:24 留言:0更新日期:2022-01-05 16:19
本说明书实施例提供了一种表单分类方法及装置。本发明专利技术将模型学习到的文本特征信息、文本布局特征信息和图像特征信息进行融合,共同决定表单的分类结果,提高了模型分类的准确率。另外,采用改进的自适应学习率算法,进一步提高了模型的分类准确率,解决了表单分类准确性不高的问题。性不高的问题。性不高的问题。

【技术实现步骤摘要】
一种表单分类方法及装置


[0001]本说明书实施例涉及计算机
,尤其涉及一种表单分类方法及装置。

技术介绍

[0002]传统的表单分类方法是基于规则的方法,使用预定义的规则将表单进行分类,例如,任何带有“篮球”、“足球”字样的表单都被归类为体育类表单。
[0003]这种表单分类方式所使用的信息是单一的,使得决定表单分类的因素变得单一,最终影响到表单分类的准确性。

技术实现思路

[0004]本说明书实施例提供及一种表单分类方法及装置,以解决现有技术存在的问题。
[0005]第一方面,本说明书实施例提供一种表单分类方法,包括:
[0006]获取目标表单图像;
[0007]对目标表单图像进行文字识别,得到目标表单图像中每个单元格各自对应的第一文本信息、第一标识信息和第一文本布局坐标;
[0008]将所述第一文本信息和第一标识信息输入循环神经网络,得到第一文本特征信息;
[0009]将所述第一文本布局坐标和第一标识信息输入目标检测网络,得到第一文本布局特征信息;<br/>[0010]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种表单分类方法,其特征在于,包括:获取目标表单图像;对目标表单图像进行文字识别,每个单元格会对应一个文本信息,得到目标表单图像中每个单元格各自对应的第一文本信息及、对应的第一标识信息和第一文本布局坐标,即每一部分文本都会被一个矩形框框出来,矩形框的左上,右上,右下,左下的顺序,就是文本布局的坐标;将所述第一文本信息和第一标识信息输入循环神经网络,得到第一文本特征信息;将所述第一文本布局坐标和第一标识信息输入目标检测网络,得到第一文本布局特征信息;将所述目标表单图像输入卷积神经网络,得到第一图像特征信息;将所述第一文本特征信息、第一文本布局特征信息和第一图像特征信息进行变形,得到同一维度的向量,对变形后的第一文本特征信息、第一文本布局特征信息和第一图像特征信息进行特征融合;将融合后的特征输入表单分类模型,得到目标表单的表单分类结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对带分类标签的样本表单图像进行文字识别,得到样本表单图像中每个单元格各自对应的第二文本信息、第二标识信息和第二文本布局坐标;将所述第二文本信息和第二标识信息输入循环神经网络,得到第二文本特征信息;将所述第二文本布局坐标和第二标识信息输入目标检测网络,得到第二文本布局特征信息;将所述样本表单图像输入卷积神经网络,得到第二图像特征信息;将所述第二文本特征信息、第二文本布局特征信息和第二图像特征信息进行变形,得到同一维度的向量,对变形后的第二文本特征信息、第二文本布局特征信息和第二图像特征信息进行特征融合;利用融合后的特征训练表单分类模型。3.根据权利要求2所述的方法,其特征在于,利用融合后的特征训练表单分类模型的过程中,根据迭代的次数优化学习率l,具体公式如下:其中,l0是初始的学习率,i表示第i次迭代,L表示网络训练的总迭代次数。4.根据权利要求3所述的方法,其特征在于,l0取值为0.005,L取值为800。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取原始样本表单图像集合;对原始样本表单图像集合中的样本表单图像进行以下至少一项操作...

【专利技术属性】
技术研发人员:王凡李磊李军
申请(专利权)人:华清科盛北京信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1