一种文本提取方法、装置、设备及存储介质制造方法及图纸

技术编号：42675491 阅读：17 留言：0更新日期：2024-09-10 12:27

本公开提供了一种文本提取方法、装置、设备及存储介质，所述方法包括：首先，确定待提取文件中的目标提取对象，获取该目标提取对象对应的目标文本信息，以及目标提取对象对应的目标图像，其中，目标文本信息为通过对待提取文件进行协议解析得到，目标图像为通过对所述待提取文件进行图像转换得到，然后，将目标文本信息和目标图像输入至目标识别模型，经过目标识别模型的处理后，得到目标图像对应的文本识别结果，进而，将目标图像对应的文本识别结果确定为目标提取对象的文本提取结果。可见，本公开实施例将目标文本信息以及目标图像作为目标识别模型的多模态数据，提高了文本信息提取的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及数据处理领域，尤其涉及一种文本提取方法、装置、设备及存储介质。

技术介绍

1、文本提取，是针对不可编辑文件(如pdf文件)中的文本信息进行提取的技术。

2、由于不可编辑文件中的文本信息的格式多样，例如，可以包括数学公式、生僻字、非常见字体等，因此，如何更准确的提取到不可编辑文件中包含的文本信息，已经成为亟需解决的技术问题。

技术实现思路

1、为了解决上述技术问题，本公开实施例提供了一种文本提取方法、装置、设备及存储介质。

2、第一方面，本公开提供了一种文本提取方法，所述方法包括：

3、确定待提取文件中的目标提取对象；

4、获取所述目标提取对象对应的目标文本信息，以及所述目标提取对象对应的目标图像；其中，所述目标文本信息为通过对所述待提取文件进行协议解析得到，所述目标图像为通过对所述待提取文件进行图像转换得到；

5、将所述目标文本信息和所述目标图像输入至目标识别模型，经过所述目标识别模型的处理后，得到所述目标图像对应的文本识别结果；

<本文档来自技高网...

【技术保护点】

1.一种文本提取方法，其特征在，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述目标文本信息和所述目标图像输入至目标识别模型，经过所述目标识别模型的处理后，得到所述目标图像对应的文本识别结果之前，还包括：

3.根据权利要求2所述的方法，其特征在于，所述目标文本信息的显示特征信息包括所述目标文本信息中的各文本字符的显示位置信息和/或显示属性信息，所述显示属性信息包括字体类型和/或字号。

4.根据权利要求1所述的方法，其特征在于，所述获取所述目标提取对象对应的目标文本信息，以及所述目标提取对象对应的目标图像之前，还包括：

5...

【技术特征摘要】

1.一种文本提取方法，其特征在，所述方法包括：

4.根据权利要求1所述的方法，其特征在于，所述获取所述目标提取对象对应的目标文本信息，以及所述目标提取对象对应的目标图像之前，还包括：

5.根据权利要求1所述的方法，其特征在于，所述获取所述目标提取对象对应的目标文本信息，以及所述目标提取对象对应的目标图像之前，还包括：

6.根据权利要求1所述的方法，其特征在于，所述目标提取对象对应的目标文本信息和所述目标提取对象对应的目标图像具有相同的显示位置信息，所述显示位置信息用于表征在所述待提取文件内的显示位置。

【专利技术属性】
技术研发人员：魏舒，石威，黄灿，
申请(专利权)人：北京火山引擎科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人