信息提取方法技术

技术编号:43161010 阅读:23 留言:0更新日期:2024-11-01 19:54
本说明书实施例提供信息提取方法,其中所述信息提取方法包括:对目标图像进行文本检测,得到文本区域的位置信息以及所述文本区域内的文本;识别所述目标图像中的表格结构,得到单元格的位置信息;基于所述单元格的位置信息和所述文本区域的位置信息将对应同一单元格的所述文本区域内的文本进行聚合,得到所述同一单元格对应的文本;利用信息提取模型从目标单元格对应的文本中提取目标信息,所述目标单元格至少包括经过所述聚合的单元格。这样,能够避免在利用信息提取模型提取信息时,同一单元格对应的文本被分散,导致无法准确提取信息。

【技术实现步骤摘要】

本说明书实施例涉及计算机,特别涉及信息提取方法


技术介绍

1、随着计算机技术的发展,各行业均对业务数据进行数字化管理,对于非结构的业务数据,比如图像等,为了能够更好的进行后续数据处理,通常需要提取图像中的信息并进行结构化存储。

2、现有技术中,通常通过文本识别技术识别图像中的文本,之后再进行结构化信息提取,然而由于文本识别技术的局限性,部分文本识别不准确,影响后续信息提取,导致无法准确提取符合需求的信息。


技术实现思路

1、有鉴于此,本说明书实施例提供了信息提取方法。本说明书一个或者多个实施例同时涉及信息提取装置,计算设备,计算机可读存储介质以及计算机程序,以解决现有技术中存在的技术缺陷。

2、根据本说明书实施例的第一方面,提供了一种信息提取方法,包括:

3、对目标图像进行文本检测,得到文本区域的位置信息以及所述文本区域内的文本;识别所述目标图像中的表格结构,得到单元格的位置信息;基于所述单元格的位置信息和所述文本区域的位置信息将对应同一单元格的所述文本区域内的文本进行聚本文档来自技高网...

【技术保护点】

1.一种信息提取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在所述利用信息提取模型从目标单元格对应的文本中提取目标信息之前,还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述利用信息提取模型从目标单元格对应的文本中提取目标信息,包括:

4.根据权利要求1所述的方法,其特征在于,在所述对目标图像进行文本检测之前,还包括:

5.根据权利要求4所述的方法,其特征在于,所述确定第一目标区域内的第一目标点,包括:

6.根据权利要求4所述的方法,其特征在于,在所述利用第一目标检测模型从中间图像中检测第一目标...

【技术特征摘要】

1.一种信息提取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在所述利用信息提取模型从目标单元格对应的文本中提取目标信息之前,还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述利用信息提取模型从目标单元格对应的文本中提取目标信息,包括:

4.根据权利要求1所述的方法,其特征在于,在所述对目标图像进行文本检测之前,还包括:

5.根据权利要求4所述的方法,其特征在于,所述确定第一目标区域内的第...

【专利技术属性】
技术研发人员:贾玉龙王晨伟魏萍方远林云
申请(专利权)人:赞塔杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1