检测电网建设类档案中表格的方法、装置、介质和设备制造方法及图纸

技术编号:37479834 阅读:26 留言:0更新日期:2023-05-07 09:20
本申请实施例公开了一种检测电网建设类档案中表格的方法、装置、介质和设备。所述方法包括:利用初步检测网络中的至少两个检测头分别对文档图像中候选的表格区域进行特征提取,并基于所述检测头各自提取到的图像特征对文档图像进行表格检测,得到各检测头的检测结果;其中,所述文档图像通过对电网建设类档案进行扫描得到;基于各检测头的检测结果,对所述至少两个检测头提取到的图像特征进行特征融合,得到文档图像的检测融合特征;将所述文档图像的检测融合特征输入精细检测网络,通过所述精细检测网络确定文档图像中的表格区域。本申请技术方案可以降低表格检测的成本,提高表格检测的效率和准确率。表格检测的效率和准确率。表格检测的效率和准确率。

【技术实现步骤摘要】
检测电网建设类档案中表格的方法、装置、介质和设备


[0001]本申请涉及计算机应用
,尤其涉及一种检测电网建设类档案中表格的方法、装置、介质和设备,可用于在文档图像中检测表格。

技术介绍

[0002]在电网企业对电网建设类项目进行项目审核的过程中,往往会产生大量的纸质文档,这些纸质文档即为电网建设类档案,实施人员需要用扫描仪将纸质文档扫描成图像格式得到文档图像,将文档图像上传到云服务器中进行备案。然后再由审核人员对电网建设类档案中各项目卷文档中的关键信息进行审核。在审核人员进行审核的过程中,很重要的一个审查项就是验评划分表的一致性。
[0003]验评划分表的一致性,需要在项目划分表文档中定位划分表的位置。目前,大多采用人工方式在项目划分表文档中定位划分表,不仅人工成本高,还存在工作效率低的问题。将表格检测技术应用电网建设类项目的审核过程,对电网建设类档案中的划分表进行自动检测,可以有效降低人工成本,提工作效率。
[0004]现有的表格检测技术主要包括传统表格检测方法和基于深度学习的表格检测方法。传统表格检测方法依赖大量的先验条件或者规则信息,鲁棒性较低,一般仅用于检测特定格式的表格。电网建设类档案对应的文档图像中大多包含格式各异及大小不同的表格,此外,受到扫描设备参数等因素的影响,通过对电网建设类档案进行扫描得到的文档图像中通常分布有复杂的噪声。将传统表格检测方法并不能准确检测电网建设类档案中的表格。
[0005]相较于传统表格检测方法,基于深度学习的表格检测方法具有更高的鲁棒性,其检测性能与特征提取能力直接相关。而电网建设类档案对应的文档图像中表格的形态以及大小等内类变化差异较大,表格与图形以及图表等版面元素内间差异较小,这使得现有的基于深度学习的表格检测方法很难提取到准确的特征,导致基于深度学习的表格检测模型,对电网建设类档案中表格区域定位还不够精确,容易出现误检和漏检的现象。

技术实现思路

[0006]本申请提供了一种检测电网建设类档案中表格的方法、装置、介质和设备,可以达到有效降低表格检测成本,提高表格检测效率和准确性的目的。
[0007]根据本申请的第一方面,提供了检测电网建设类档案中表格的方法,所述方法包括:
[0008]利用初步检测网络中的至少两个检测头分别对文档图像中候选的表格区域进行特征提取,并基于所述检测头各自提取到的图像特征对文档图像进行表格检测,得到各检测头的检测结果;其中,所述文档图像通过对电网建设类档案进行扫描得到;
[0009]基于各检测头的检测结果,对所述至少两个检测头提取到的图像特征进行特征融合,得到文档图像的检测融合特征;
[0010]将所述文档图像的检测融合特征输入精细检测网络,通过所述精细检测网络确定文档图像中的表格区域。
[0011]根据本申请的第二方面,提供了检测电网建设类档案中表格的装置,所述装置包括:
[0012]特征提取模块,用于利用初步检测网络中的至少两个检测头分别对文档图像中候选的表格区域进行特征提取,并基于所述检测头各自提取到的图像特征对文档图像进行表格检测,得到各检测头的检测结果;其中,所述文档图像通过对电网建设类档案进行扫描得到;
[0013]特征融合模块,用于基于各检测头的检测结果,对所述至少两个检测头提取到的图像特征进行特征融合,得到文档图像的检测融合特征;
[0014]表格检测模块,用于将所述文档图像的检测融合特征输入精细检测网络,通过所述精细检测网络确定文档图像中的表格区域。
[0015]根据本专利技术的第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例所述的检测电网建设类档案中表格的方法。
[0016]根据本专利技术的第四方面,本申请实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例所述的检测电网建设类档案中表格的方法。
[0017]本申请实施例技术方案采用二阶段识别定位模式,将初步检测网络与精细检测网络相结合,由粗到细对文档图像进行目标的分类和定位,首先,采用设置有至少两个检测头的初步检测网络进行粗粒度检测,然后,利用精细检测网络进行细粒度检测。初步检测网络中的至少两个检测头,能够从多个角度提取文档图像更加互补的图像特征,将各检测头提取到的图像特征进行融合,再将得到的检测融合特征输入精细检测网络,通过精细检测网络基于检测融合特征在文档图像中确定表格区域,有效降低了表格检测的成本,提高了表格检测的效率和准确率。
[0018]应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0019]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是根据实施例一提供的检测电网建设类档案中表格的方法的流程图;
[0021]图2是根据实施例二提供的检测电网建设类档案中表格的方法的流程图;
[0022]图3A是根据实施例三提供的检测电网建设类档案中表格的方法的流程图;
[0023]图3B示出了一种用于实现本申请实施例所提供的检测电网建设类档案中表格的方法的具体网络模型;
[0024]图3C示出了初步检测网络中检测头的网络结构;
[0025]图3D示出了表格检测模型中介于初步检测网络和精细检测网络之间的特征融合单元如何融合各检测头从关键区域中提取到的图像特征;
[0026]图3E示出了类别检测分支和位置检测分支的网络结构;
[0027]图4是本申请实施例四提供的检测电网建设类档案中表格的装置的结构示意图;
[0028]图5是本申请实施例五提供的一种电子设备的结构示意图。
具体实施方式
[0029]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0030]需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“目标”以及“候选”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种检测电网建设类档案中表格的方法,其特征在于,所述方法包括:利用初步检测网络中的至少两个检测头分别对文档图像中候选的表格区域进行特征提取,并基于所述检测头各自提取到的图像特征对文档图像进行表格检测,得到各检测头的检测结果;其中,所述文档图像通过对电网建设类档案进行扫描得到;所述初步检测网络中的至少两个检测头基于不同的丢弃概率训练得到;基于各检测头的检测结果,对所述至少两个检测头提取到的图像特征进行特征融合,得到文档图像的检测融合特征;将所述文档图像的检测融合特征输入精细检测网络,通过所述精细检测网络确定文档图像中的表格区域。2.根据权利要求1所述的方法,其特征在于,所述基于各检测头的检测结果,对所述至少两个检测头提取到的图像特征进行特征融合,得到文档图像的检测融合特征,包括:基于所述检测结果中的位置信息,确定各检测头在所述文档图像中识别到的关键区域;基于所述检测结果中的类别信息,确定各检测头的注意力权重;基于所述注意力权重,对所述至少两个检测头从所述关键区域提取到的图像特征进行融合处理,得到文档图像的检测融合特征。3.根据权利要求1所述的方法,其特征在于,将所述文档图像的检测融合特征输入精细检测网络,通过所述精细检测网络确定文档图像中的表格区域,包括:将所述文档图像的检测融合特征输入精细检测网络,通过所述精细检测网络中的类型检测分支从所述检测融合特征中提取目标类别特征;通过所述精细检测网络中的位置检测分支从所述检测融合特征中提取目标位置特征;根据所述类型检测分支提取到的目标类型特征,以及所述位置检测分支提取到的目标位置特征,确定文档图像中的表格区域。4.根据权利要求1所述的方法,其特征在于,在利用初步检测网络中的至少两个检测头分别对文档图像中候选的表格区域进行特征提取之前,所述方法还包括:对文档图像进行特征提取,从所述文档图像中提取至少两种尺度的图像特征;对所述至少两种尺度的图像特征...

【专利技术属性】
技术研发人员:李惠仪陈国华邵向潮肖雪丽廖常辉冷颖雄谢洁芳周彦吉叶海珍邓茵刘贯科钟荣富戴喜良
申请(专利权)人:广东电网有限责任公司东莞供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1