文档的处理方法及装置、存储介质和电子设备制造方法及图纸

技术编号:38322242 阅读:10 留言:0更新日期:2023-07-29 09:04
本申请公开了一种文档的处理方法及装置、存储介质和电子设备,涉及人工智能技术领域。该方法包括:获取目标文档,其中,目标文档为待识别的文档;将目标文档输入目标识别模型进行识别处理,输出目标文档中的文本信息和图像信息,其中,目标识别模型是基于第一神经网络模型和第二神经网络模型构建的模型,第一神经网络模型用于对文档中的图像进行识别处理,第二神经网络模型用于对文档中的文本进行识别处理,第一神经网络模型为具有深度可分离卷积结构的神经网络模型。通过本申请,解决了相关技术中对文档进行识别的效率较低的问题。术中对文档进行识别的效率较低的问题。术中对文档进行识别的效率较低的问题。

【技术实现步骤摘要】
文档的处理方法及装置、存储介质和电子设备


[0001]本申请涉及人工智能
,具体而言,涉及一种文档的处理方法及装置、存储介质和电子设备。

技术介绍

[0002]在处理大量档案的各种行业中,文档数字化已经成为一种普遍做法。在尝试自动化文档处理时,文档分类是一项需要面对的任务,但是文档之间类内的高变异性和类间的低变异性使这成为一个具有挑战性的问题。
[0003]而且,目前随着深度学习的兴起,使用深度神经网络用于处理文档分类任务展现出了高效的分类性能。但是即使是采用最简单的卷积神经网络用于处理该任务也需要消耗较长的时间和巨大的计算资源,从而会导致对文档进行识别的效率较低。
[0004]针对相关技术中对文档进行识别的效率较低的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请的主要目的在于提供一种文档的处理方法及装置、存储介质和电子设备,以解决相关技术中对文档进行识别的效率较低的问题。
[0006]为了实现上述目的,根据本申请的一个方面,提供了一种文档的处理方法。该方法包括:获取目标文档,其中,所述目标文档为待识别的文档;将所述目标文档输入目标识别模型进行识别处理,输出所述目标文档中的文本信息和图像信息,其中,所述目标识别模型是基于第一神经网络模型和第二神经网络模型构建的模型,所述第一神经网络模型用于对文档中的图像进行识别处理,所述第二神经网络模型用于对文档中的文本进行识别处理,所述第一神经网络模型为具有深度可分离卷积结构的神经网络模型。
[0007]进一步地,所述目标识别模型通过以下方式得到:获取N个样本文档,其中,N为正整数;对每个样本文档中的文本和图像进行标注处理,得到N个标注处理后的样本文档;依据所述N个标注处理后的样本文档,得到用于模型训练的训练集;基于所述第一神经网络模型和所述第二神经网络模型,构建第一识别模型;采用所述训练集对所述第一识别模型进行学习训练,得到所述目标识别模型。
[0008]进一步地,采用所述训练集对所述第一识别模型进行学习训练,得到所述目标识别模型包括:采用所述训练集和迁移学习的方法对所述第一识别模型进行学习训练,得到第二识别模型;利用交叉熵损失函数确定模型训练的损失值,其中,所述交叉熵损失函数;依据所述损失值,对所述第二识别模型的参数进行更新处理,得到所述目标识别模型。
[0009]进一步地,在利用交叉熵损失函数确定模型训练的损失值之前,所述方法还包括:通过所述第一神经网络模型对所述N个样本文档中的图像进行特征提取处理,得到第一分类结果;通过所述第二神经网络模型对所述N个样本文档中的文本进行特征提取处理,得到第二类结果;基于所述第一分类结果和所述第二类结果,结合预设方法,得到第三分类结
果;依据所述第三分类结果,确定所述交叉熵损失函数。
[0010]进一步地,在依据所述损失值,对所述第二识别模型的参数进行更新处理,得到所述目标识别模型之后,所述方法还包括:获取模型训练的训练时长;从数据集中获取用于测试模型的测试集,其中,所述数据集中至少包括所述N个样本文档;利用所述测试集,计算所述目标识别模型的准确程度;依据所述训练时长和所述准确程度,确定对所述目标识别模型进行测试的测试结果。
[0011]进一步地,依据所述N个标注处理后的样本文档,得到用于模型训练的训练集包括:依据所述N个标注处理后的样本文档,得到数据集;按照预设比例,将所述数据集划分为所述训练集和用于测试模型的测试集。
[0012]进一步地,所述目标识别模型中至少包括所述第一神经网络模型和所述第二神经网络模型,将所述目标文档输入目标识别模型进行识别处理,输出所述目标文档中的文本信息和图像信息包括:通过所述第一神经网络模型识别所述目标文档中的图像的类别,得到第一识别结果;通过所述第二神经网络模型识别所述目标文档中的文本的类别,得到第二识别结果;依据所述第一识别结果和所述第二识别结果,得到所述目标文档中的所述文本信息和所述图像信息。
[0013]进一步地,在将所述目标文档输入目标识别模型进行识别处理,输出所述目标文档中的文本信息和图像信息之后,所述方法还包括:获取所述目标文档中的所述文本信息和所述图像信息;基于所述文本信息和所述图像信息,对所述目标文档的格式进行转换,得到目标格式的所述目标文档。
[0014]为了实现上述目的,根据本申请的另一方面,提供了一种文档的处理装置。该装置包括:第一获取单元,用于获取目标文档,其中,所述目标文档为待识别的文档;第一处理单元,用于将所述目标文档输入目标识别模型进行识别处理,输出所述目标文档中的文本信息和图像信息,其中,所述目标识别模型是基于第一神经网络模型和第二神经网络模型构建的模型,所述第一神经网络模型用于对文档中的图像进行识别处理,所述第二神经网络模型用于对文档中的文本进行识别处理,所述第一神经网络模型为具有深度可分离卷积结构的神经网络模型。
[0015]进一步地,所述目标识别模型通过以下方式得到:第二获取单元,用于获取N个样本文档,其中,N为正整数;第二处理单元,用于对每个样本文档中的文本和图像进行标注处理,得到N个标注处理后的样本文档;第一确定单元,用于依据所述N个标注处理后的样本文档,得到用于模型训练的训练集;第一构建单元,用于基于所述第一神经网络模型和所述第二神经网络模型,构建第一识别模型;第一训练单元,用于采用所述训练集对所述第一识别模型进行学习训练,得到所述目标识别模型。
[0016]进一步地,所述第一训练单元包括:第一训练模块,用于采用所述训练集和迁移学习的装置对所述第一识别模型进行学习训练,得到第二识别模型;第一确定模块,用于利用交叉熵损失函数确定模型训练的损失值,其中,所述交叉熵损失函数;第一处理模块,用于依据所述损失值,对所述第二识别模型的参数进行更新处理,得到所述目标识别模型。
[0017]进一步地,所述装置还包括:第三处理单元,用于在利用交叉熵损失函数确定模型训练的损失值之前,通过所述第一神经网络模型对所述N个样本文档中的图像进行特征提取处理,得到第一分类结果;第四处理单元,用于通过所述第二神经网络模型对所述N个样
本文档中的文本进行特征提取处理,得到第二类结果;第二确定单元,用于基于所述第一分类结果和所述第二类结果,结合预设装置,得到第三分类结果;第三确定单元,用于依据所述第三分类结果,确定所述交叉熵损失函数。
[0018]进一步地,所述装置还包括:第三获取单元,用于在依据所述损失值,对所述第二识别模型的参数进行更新处理,得到所述目标识别模型之后,获取模型训练的训练时长;第四获取单元,用于从数据集中获取用于测试模型的测试集,其中,所述数据集中至少包括所述N个样本文档;第一计算单元,用于利用所述测试集,计算所述目标识别模型的准确程度;第四确定单元,用于依据所述训练时长和所述准确程度,确定对所述目标识别模型进行测试的测试结果。
[0019]进一步地,所述第一确定单元包括:第二确定模块,用于依据所述N个标注处理后的样本文档,得到数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文档的处理方法,其特征在于,包括:获取目标文档,其中,所述目标文档为待识别的文档;将所述目标文档输入目标识别模型进行识别处理,输出所述目标文档中的文本信息和图像信息,其中,所述目标识别模型是基于第一神经网络模型和第二神经网络模型构建的模型,所述第一神经网络模型用于对文档中的图像进行识别处理,所述第二神经网络模型用于对文档中的文本进行识别处理,所述第一神经网络模型为具有深度可分离卷积结构的神经网络模型。2.根据权利要求1所述的方法,其特征在于,所述目标识别模型通过以下方式得到:获取N个样本文档,其中,N为正整数;对每个样本文档中的文本和图像进行标注处理,得到N个标注处理后的样本文档;依据所述N个标注处理后的样本文档,得到用于模型训练的训练集;基于所述第一神经网络模型和所述第二神经网络模型,构建第一识别模型;采用所述训练集对所述第一识别模型进行学习训练,得到所述目标识别模型。3.根据权利要求2所述的方法,其特征在于,采用所述训练集对所述第一识别模型进行学习训练,得到所述目标识别模型包括:采用所述训练集和迁移学习的方法对所述第一识别模型进行学习训练,得到第二识别模型;利用交叉熵损失函数确定模型训练的损失值,其中,所述交叉熵损失函数;依据所述损失值,对所述第二识别模型的参数进行更新处理,得到所述目标识别模型。4.根据权利要求3所述的方法,其特征在于,在利用交叉熵损失函数确定模型训练的损失值之前,所述方法还包括:通过所述第一神经网络模型对所述N个样本文档中的图像进行特征提取处理,得到第一分类结果;通过所述第二神经网络模型对所述N个样本文档中的文本进行特征提取处理,得到第二类结果;基于所述第一分类结果和所述第二类结果,结合预设方法,得到第三分类结果;依据所述第三分类结果,确定所述交叉熵损失函数。5.根据权利要求3所述的方法,其特征在于,在依据所述损失值,对所述第二识别模型的参数进行更新处理,得到所述目标识别模型之后,所述方法还包括:获取模型训练的训练时长;从数据集中获取用于测试模型的测试集,其中,所述数据集中至少包括所述N个样本文档;利用所述测试集,计算所述目标识别模型的准确程度;依据所述训练时长和...

【专利技术属性】
技术研发人员:张海轩
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1