图像内容结构化信息提取方法、装置、设备及存储介质制造方法及图纸

技术编号：40188205 阅读：23 留言：0更新日期：2024-01-26 23:51

本申请涉及图像内容结构化信息提取技术领域，具体提供一种图像内容结构化信息提取方法、装置、设备及存储介质，旨在解决现有识别方法不能同时识别不同格式的单据内容的问题。为此目的，本申请的图像内容结构化信息提取方法包括：获取待识别单据图像，识别待识别单据图像中的所有文本内容，将所有的所述文本内容按照预设拼接方式进行拼接处理，得到目标内容，利用大语言模型按照预设文本结构提取目标内容。通过上述方法，能够有效提高图像内容结构化信息提取的普适性和稳定性，节约了以往技术对每种单据内容格式都需要进行大量的训练和标注，节约大量资源。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及图像内容结构化信息提取，具体涉及一种图像内容结构化信息提取方法、装置、电子设备及计算机可读存储介质。

技术介绍

1、随着人工智能、物联网等信息技术的快速发展，人机交互的应用场景越来越广泛，各式各样的智能交互软件和设备出现在人们的生活工作中，可以为人们提供信息查询等众多应用场景的智能交互功能，以辅助用户完成各种行为意图，给人带来了便利，提升来了工作效率。

2、目前，针对用户输入智能交互软件或设备中一些图像信息是，需要对图像中的内容进行识别，转换成智能交互软件或设备能够显示的内容。然而，不同的图像中存在着版式多样、保存困难等问题，传统方式通过人工等方式进行手工录入也存在着出错率高、耗时长以及不同使用者提取的结构化信息格式也有所不同等问题。

3、此外，现有技术中通过机器学习或者深度学习针对预先收集的图像模板或者标签进行大量的训练，而最终训练得到的模型仍只能针对同样式的标签模板进行读取和分析，且存在准确性、鲁棒性和泛化能力方面的问题，无法很好地处理复杂的报告单格式和多样化的文本布局。

>技术实现思路...

【技术保护点】

1.一种图像内容结构化信息提取方法，其特征在于，包括：

2.根据权利要求1所述的图像内容结构化信息提取方法，其特征在于，所述识别所述待识别单据图像中的所有文本内容，将所有的所述文本内容按照预设拼接方式进行拼接处理，得到目标内容，包括：

3.根据权利要求2所述的图像内容结构化信息提取方法，其特征在于，所述按照行顺序识别所述待识别单据图像中的多个文本内容，包括：

4.根据权利要求1所述的图像内容结构化信息提取方法，其特征在于，所述对利用大语言模型按照预设文本结构提取所述目标内容之前，还包括：

5.根据权利要求1所述的图像内容结构化信息提取方法，...

【技术特征摘要】

1.一种图像内容结构化信息提取方法，其特征在于，包括：

3.根据权利要求2所述的图像内容结构化信息提取方法，其特征在于，所述按照行顺序识别所述待识别单据图像中的多个文本内容，包括：

4.根据权利要求1所述的图像内容结构化信息提取方法，其特征在于，所述对利用大语言模型按照预设文本结构提取所述目标内容之前，还包括：

5.根据权利要求1所述的图像内容结构化信息提取方法，其特征在于，所述预设文本结构包括第一文本结构和第二文本结构，所述利用大语言模型按照预设文本结构提取所述目标内容，包括：

6.根据权利要求4所述...

【专利技术属性】
技术研发人员：王飞，李青，李鹏飞，薛涛，
申请(专利权)人：杭州未名信科科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人