【技术实现步骤摘要】
一种表单分类方法及装置
[0001]本说明书实施例涉及计算机
,尤其涉及一种表单分类方法及装置。
技术介绍
[0002]传统的表单分类方法是基于规则的方法,使用预定义的规则将表单进行分类,例如,任何带有“篮球”、“足球”字样的表单都被归类为体育类表单。
[0003]这种表单分类方式所使用的信息是单一的,使得决定表单分类的因素变得单一,最终影响到表单分类的准确性。
技术实现思路
[0004]本说明书实施例提供及一种表单分类方法及装置,以解决现有技术存在的问题。
[0005]第一方面,本说明书实施例提供一种表单分类方法,包括:
[0006]获取目标表单图像;
[0007]对目标表单图像进行文字识别,得到目标表单图像中每个单元格各自对应的第一文本信息、第一标识信息和第一文本布局坐标;
[0008]将所述第一文本信息和第一标识信息输入循环神经网络,得到第一文本特征信息;
[0009]将所述第一文本布局坐标和第一标识信息输入目标检测网络,得到第一文本布局特征信息;< ...
【技术保护点】
【技术特征摘要】
1.一种表单分类方法,其特征在于,包括:获取目标表单图像;对目标表单图像进行文字识别,每个单元格会对应一个文本信息,得到目标表单图像中每个单元格各自对应的第一文本信息及、对应的第一标识信息和第一文本布局坐标,即每一部分文本都会被一个矩形框框出来,矩形框的左上,右上,右下,左下的顺序,就是文本布局的坐标;将所述第一文本信息和第一标识信息输入循环神经网络,得到第一文本特征信息;将所述第一文本布局坐标和第一标识信息输入目标检测网络,得到第一文本布局特征信息;将所述目标表单图像输入卷积神经网络,得到第一图像特征信息;将所述第一文本特征信息、第一文本布局特征信息和第一图像特征信息进行变形,得到同一维度的向量,对变形后的第一文本特征信息、第一文本布局特征信息和第一图像特征信息进行特征融合;将融合后的特征输入表单分类模型,得到目标表单的表单分类结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对带分类标签的样本表单图像进行文字识别,得到样本表单图像中每个单元格各自对应的第二文本信息、第二标识信息和第二文本布局坐标;将所述第二文本信息和第二标识信息输入循环神经网络,得到第二文本特征信息;将所述第二文本布局坐标和第二标识信息输入目标检测网络,得到第二文本布局特征信息;将所述样本表单图像输入卷积神经网络,得到第二图像特征信息;将所述第二文本特征信息、第二文本布局特征信息和第二图像特征信息进行变形,得到同一维度的向量,对变形后的第二文本特征信息、第二文本布局特征信息和第二图像特征信息进行特征融合;利用融合后的特征训练表单分类模型。3.根据权利要求2所述的方法,其特征在于,利用融合后的特征训练表单分类模型的过程中,根据迭代的次数优化学习率l,具体公式如下:其中,l0是初始的学习率,i表示第i次迭代,L表示网络训练的总迭代次数。4.根据权利要求3所述的方法,其特征在于,l0取值为0.005,L取值为800。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取原始样本表单图像集合;对原始样本表单图像集合中的样本表单图像进行以下至少一项操作...
【专利技术属性】
技术研发人员:王凡,李磊,李军,
申请(专利权)人:华清科盛北京信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。