关键信息抽取方法及其装置制造方法及图纸

技术编号：40575367 阅读：6 留言：0更新日期：2024-03-06 17:16

本公开提供了关键信息抽取方法及其装置，涉及图像识别、光学字符识别OCR文字识别等人工智能领域。具体实现方案为：确定第一图像对应的光学字符识别OCR文本；所述第一图像为待抽取关键信息的图像；基于所述OCR文本和至少一个查询词Query确定第一文本；将所述第一文本输入至大模型，得到关键信息；所述关键信息为所述查询词对应的查询结果。本公开可以提高关键信息抽取的效率和准确度。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及图像处理领域，尤其涉及图像识别、光学字符识别(opticalcharacter recognition，ocr)文字识别等人工智能领域，特别的涉及一种关键信息抽取方法及其装置。

技术介绍

1、关键信息抽取(key information extraction，kie)指的是从文本或者图像中抽取出关键的信息，其一般作为ocr识别的下游任务，即先对文本或图像进行ocr识别以得到文本或图像的文本信息，之后，再在该文本信息中进行关键信息抽取。其中，kie可以应用于多种应用场景中，例如可以应用于表单识别、车票信息抽取、身份证信息抽取等应用场景中，但是，目前的关键信息抽取方法效率低、通用性差且效果不佳。

技术实现思路

1、本公开提供了一种关键信息抽取方法、装置、电子设备以及存储介质。

2、根据本公开的第一方面，提供了一种关键信息抽取方法，包括：

3、确定第一图像对应的光学字符识别ocr文本；所述第一图像为待抽取关键信息的图像；

4、基于所述ocr文本和至少一个查询词query确定第一文本；

5、将所述第一文本输入至大模型，得到关键信息；所述关键信息为所述查询词对应的查询结果。

6、根据本公开的第二方面，提供了一种关键信息抽取装置，包括：

7、第一确定模块，用于确定第一图像对应的光学字符识别ocr文本；所述第一图像为待抽取关键信息的图像；

8、第二确定模块，用于基于所述ocr文本和至少一个查询词query确定第一文本；

9、输入模块，用于将所述第一文本输入至大模型，得到关键信息；所述关键信息为所述查询词对应的查询结果。

10、根据本公开的第三方面，提供了一种电子设备，包括：

11、至少一个处理器；以及

12、与所述至少一个处理器通信连接的存储器；其中，

13、所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行前述第一方面所述的方法。

14、根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行前述第一方面所述的方法。

15、根据本公开的第五方面，提供了一种计算机程序产品，包括计算机程序，其中，所述计算机程序在被处理器执行时实现前述第一方面所述的方法。

16、根据本公开的技术解决了相关技术中槽值信息抽取效果不佳等的问题。

17、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种关键信息抽取方法，包括：

2.如权利要求1所述的方法，其中，所述基于所述OCR文本和至少一个Query确定第一文本，包括：

3.如权利要求2所述的方法，其中，所述基于至少一个所述Query从所述OCR文本中确定出第二文本，包括：

4.如权利要求3所述的方法，其中，所述将所述OCR文本划分为至少一个子文本，包括：

5.如权利要求1-4任一所述的方法，其中，在所述将所述第一文本输入至大模型之前，还包括：

6.如权利要求5所述的方法，其中，所述确定所述第一文本的文本内容对应的文本模板要求，包括：

7.如权利要求5所述的方法，其中，所述将所述第一文本输入至大模型，包括：

8.如权利要求1-4任一所述的方法，其中，所述确定第一图像对应的OCR文本，包括：

9.如权利要求8所述的方法，其中，所述将所述第二输出结果与所述第三输出结果进行合并，包括：

10.如权利要求1-4任一所述的方法，其中，所述确定第一图像对应的OCR文本，包括：

11.如权利要求3所述的方法，其中

12.如权利要求11所述的方法，其中，所述对至少一个所述子文本分别进行embedding向量化处理得到所述子文本对应的第一embedding向量，包括：

13.如权利要求12所述的方法，其中，所述第三embedding向量为第一条目项对应的embedding向量，所述第一条目项为与所述Query内容最相似的条目项；

14.如权利要求13所述的方法，其中，所述大模型用于基于所述Query从所述第二文本中确定出所述第一条目项，并将所述第一条目项对应的条目信息确定为所述关键信息。

15.一种关键信息抽取装置，包括：

16.如权利要求14所述的装置，其中，所述第二确定模块，包括：

17.如权利要求16所述的装置，其中，所述第一确定单元具体用于：

18.如权利要求17所述的方法，其中，所述第一确定单元具体用于：

19.如权利要求15-18任一所述的装置，其中，还包括：

20.如权利要求19所述的装置，其中，所述第三确定模块，包括：

21.如权利要求19所述的装置，其中，所述输入模块具体用于：

22.如权利要求15-18任一所述的装置，其中，所述第一确定模块具体用于：

23.如权利要求22所述的装置，其中，所述第一确定模块具体用于：

24.如权利要求15-18任一所述的装置，其中，所述第一确定模块具体用于：

25.如权利要求17所述的装置，其中，所述第一图像包括至少一个条目项以及所述条目项对应的条目信息；

26.如权利要求25所述的装置，其中，所述第一确定单元具体用于：

27.如权利要求26所述的装置，其中，所述第三embedding向量为第一条目项对应的embedding向量，所述第一条目项为与所述Query内容最相似的条目项；

28.如权利要求27所述的装置，其中，所述大模型用于基于所述Query从所述第二文本中确定出所述第一条目项，并将所述第一条目项对应的条目信息确定为所述关键信息。

29.一种电子设备，包括：

30.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-14中任一项所述的方法。

31.一种计算机程序产品，包括计算机程序，其中，所述计算机程序在被处理器执行时实现权利要求1-14中任一项所述方法的步骤。

...

【技术特征摘要】

1.一种关键信息抽取方法，包括：

2.如权利要求1所述的方法，其中，所述基于所述ocr文本和至少一个query确定第一文本，包括：

3.如权利要求2所述的方法，其中，所述基于至少一个所述query从所述ocr文本中确定出第二文本，包括：

4.如权利要求3所述的方法，其中，所述将所述ocr文本划分为至少一个子文本，包括：

5.如权利要求1-4任一所述的方法，其中，在所述将所述第一文本输入至大模型之前，还包括：

6.如权利要求5所述的方法，其中，所述确定所述第一文本的文本内容对应的文本模板要求，包括：

7.如权利要求5所述的方法，其中，所述将所述第一文本输入至大模型，包括：

8.如权利要求1-4任一所述的方法，其中，所述确定第一图像对应的ocr文本，包括：

9.如权利要求8所述的方法，其中，所述将所述第二输出结果与所述第三输出结果进行合并，包括：

10.如权利要求1-4任一所述的方法，其中，所述确定第一图像对应的ocr文本，包括：

11.如权利要求3所述的方法，其中，所述第一图像包括至少一个条目项以及所述条目项对应的条目信息；

12.如权利要求11所述的方法，其中，所述对至少一个所述子文本分别进行embedding向量化处理得到所述子文本对应的第一embedding向量，包括：

13.如权利要求12所述的方法，其中，所述第三embedding向量为第一条目项对应的embedding向量，所述第一条目项为与所述query内容最相似的条目项；

14.如权利要求13所述的方法，其中，所述大模型用于基于所述query从所述第二文本中确定出所述第一条目项，并将所述第一条目项对应的条目信息确定为所述关键信息。

15.一...

【专利技术属性】
技术研发人员：殷晓婷，杜宇宁，刘毅，赵乔，胡晓光，于佃海，马艳军，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人