文档的处理方法及装置、存储介质和电子设备制造方法及图纸

技术编号：38322242 阅读：10 留言：0更新日期：2023-07-29 09:04

本申请公开了一种文档的处理方法及装置、存储介质和电子设备，涉及人工智能技术领域。该方法包括：获取目标文档，其中，目标文档为待识别的文档；将目标文档输入目标识别模型进行识别处理，输出目标文档中的文本信息和图像信息，其中，目标识别模型是基于第一神经网络模型和第二神经网络模型构建的模型，第一神经网络模型用于对文档中的图像进行识别处理，第二神经网络模型用于对文档中的文本进行识别处理，第一神经网络模型为具有深度可分离卷积结构的神经网络模型。通过本申请，解决了相关技术中对文档进行识别的效率较低的问题。术中对文档进行识别的效率较低的问题。术中对文档进行识别的效率较低的问题。

全部详细技术资料下载

【技术实现步骤摘要】
文档的处理方法及装置、存储介质和电子设备

[0001]本申请涉及人工智能
，具体而言，涉及一种文档的处理方法及装置、存储介质和电子设备。

技术介绍

[0002]在处理大量档案的各种行业中，文档数字化已经成为一种普遍做法。在尝试自动化文档处理时，文档分类是一项需要面对的任务，但是文档之间类内的高变异性和类间的低变异性使这成为一个具有挑战性的问题。
[0003]而且，目前随着深度学习的兴起，使用深度神经网络用于处理文档分类任务展现出了高效的分类性能。但是即使是采用最简单的卷积神经网络用于处理该任务也需要消耗较长的时间和巨大的计算资源，从而会导致对文档进行识别的效率较低。
[0004]针对相关技术中对文档进行识别的效率较低的问题，目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请的主要目的在于提供一种文档的处理方法及装置、存储介质和电子设备，以解决相关技术中对文档进行识别的效率较低的问题。
[0006]为了实现上述目的，根据本申请的一个方面，提供了一种文档的处理方法。该方法包括：获取目标文档，其中，所述目标文档为待识别的文档；将所述目标文档输入目标识别模型进行识别处理，输出所述目标文档中的文本信息和图像信息，其中，所述目标识别模型是基于第一神经网络模型和第二神经网络模型构建的模型，所述第一神经网络模型用于对文档中的图像进行识别处理，所述第二神经网络模型用于对文档中的文本进行识别处理，所述第一神经网络模型为具有深度可分离卷积结构的神经网络模型。
[0007]进...

【技术保护点】

【技术特征摘要】
1.一种文档的处理方法，其特征在于，包括：获取目标文档，其中，所述目标文档为待识别的文档；将所述目标文档输入目标识别模型进行识别处理，输出所述目标文档中的文本信息和图像信息，其中，所述目标识别模型是基于第一神经网络模型和第二神经网络模型构建的模型，所述第一神经网络模型用于对文档中的图像进行识别处理，所述第二神经网络模型用于对文档中的文本进行识别处理，所述第一神经网络模型为具有深度可分离卷积结构的神经网络模型。2.根据权利要求1所述的方法，其特征在于，所述目标识别模型通过以下方式得到：获取N个样本文档，其中，N为正整数；对每个样本文档中的文本和图像进行标注处理，得到N个标注处理后的样本文档；依据所述N个标注处理后的样本文档，得到用于模型训练的训练集；基于所述第一神经网络模型和所述第二神经网络模型，构建第一识别模型；采用所述训练集对所述第一识别模型进行学习训练，得到所述目标识别模型。3.根据权利要求2所述的方法，其特征在于，采用所述训练集对所述第一识别模型进行学习训练，得到所述目标识别模型包括：采用所述训练集和迁移学习的方法对所述第一识别模型进行学习训练，得到第二识别模型；利用交叉熵损失函数确定模型训练的损失值，其中，所述交叉熵损失函数；依据所述损失值，对所述第二识别模型的参数进行更新处理，得到所述目标识别模型。4.根据权利要求3所述的方法，其特征在于，在利用交叉熵损失函数确定模型训练的损失值之前，所述方法还包括：通过所述第一神经网络模型对所述N个样本文档中的图像进行特征提取处理，得到第一分类结果；通过所述第二神经网络模型对所述N个样本文档中的文本进行特征提取处理，得到第二类结果；基于所述第一分类结果和所述第二类结果，结合预设方法，得到第三分类结果；依据所述第三分类结果，确定所述交叉熵损失函数。5.根据权利要求3所述的方法，其特征在于，在依据所述损失值，对所述第二识别模型的参数进行更新处理，得到所述目标识别模型之后，所述方法还包括：获取模型训练的训练时长；从数据集中获取用于测试模型的测试集，其中，所述数据集中至少包括所述N个样本文档；利用所述测试集，计算所述目标识别模型的准确程度；依据所述训练时长和...

【专利技术属性】
技术研发人员：张海轩，
申请(专利权)人：中国工商银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人