一种表格指标提取方法及装置制造方法及图纸

技术编号:36565575 阅读:33 留言:0更新日期:2023-02-04 17:21
本发明专利技术公开了一种表格指标提取方法及装置。所述表格指标提取方法,包括:从待处理表格中解析出若干个子表格的表名和每一所述子表格中的若干个列名;结合所有所述子表格的表名和所有所述子表格中的所有列名进行规则配置,得到目标指标的规则表;根据所述目标指标的规则表,从所述待处理表格中提取所述目标指标。本发明专利技术能够适应不同格式的待处理表格灵活配置目标指标的规则表,基于目标指标的规则表自动提取目标指标。动提取目标指标。动提取目标指标。

【技术实现步骤摘要】
一种表格指标提取方法及装置


[0001]本专利技术涉及数据处理
,尤其涉及一种表格指标提取方法及装置。

技术介绍

[0002]在工程审核或者评估工程投资合理性的时候,往往会采用人工或利用系统提供的表格指标提取功能从工程造价报表中提取出关键的指标进行评估。采用人工提取表格指标虽然具有灵活性,但提取效率较低人力成本较高。而利用系统提供的指标提取功能提取表格指标则要求预先在系统中针对统一格式的表格固定化设置表格指标提取规则,一般是选择EXCEL表格中固定单元格数据定义指标,以根据EXCEL表格中固定单元格数据提取表格指标,使得表格指标提取规则缺乏灵活性,且随着行业对工程造价报表中产品命名等规定的修订,原有的表格指标提取规则将不再适应新修订格式的表格发生失效,需要重新开发系统的指标提取功能以适应新修订格式的表格。可见,现有的表格指标提取方法并不能适应不同格式的表格灵活配置表格指标提取规则,基于表格指标提取规则自动提取表格指标。

技术实现思路

[0003]为了克服现有技术的缺陷,本专利技术提供一种表格指标提取方法及装置,能够适应不同格式的待处理表格灵活配置目标指标的规则表,基于目标指标的规则表自动提取目标指标。
[0004]为了解决上述技术问题,第一方面,本专利技术一实施例提供一种表格指标提取方法,包括:
[0005]从待处理表格中解析出若干个子表格的表名和每一所述子表格中的若干个列名;
[0006]结合所有所述子表格的表名和所有所述子表格中的所有列名进行规则配置,得到目标指标的规则表;
[0007]根据所述目标指标的规则表,从所述待处理表格中提取所述目标指标。
[0008]进一步地,在所述从待处理表格中解析出若干个子表格的表名和每一所述子表格中的若干个列名之后,还包括:
[0009]采用自动学习技术识别各个所述子表格的表名对应的标准表名,以及各个所述子表格中的每一列名对应的标准列名;
[0010]将各个所述子表格的表名转换为对应的标准表名,分别将各个所述子表格中的每一列名转换为对应的标准列名。
[0011]进一步地,所述结合所有所述子表格的表名和所有所述子表格中的所有列名进行规则配置,得到目标指标的规则表,具体为:
[0012]基于所有所述子表格的表名和所有所述子表格中的所有列名,根据用户针对所述目标指标输入的若干组规则配置参数,从所有所述子表格中确定若干个目标子表格和每一所述目标子表格的搜索列范围,生成若干条表格指标提取规则,以整合所有所述表格指标提取规则,得到所述目标指标的规则表。
[0013]进一步地,所述规则配置参数包括数据来源表的表名、列范围、列范围开始关键字、列范围结束关键字、查找列、结果列、匹配类型、搜索关键字、匹配模式、规则叠加模式、比例换算方式。
[0014]进一步地,所述根据所述目标指标的规则表,从所述待处理表格中提取所述目标指标,具体为:
[0015]分别根据所述目标指标的规则表中的每一所述表格指标提取规则,从待处理表格中提取对应的目标数据,得到所有所述目标数据,并结合所有所述目标数据,计算所述目标指标。
[0016]第二方面,本专利技术一实施例提供一种表格指标提取装置,包括:
[0017]表格解析模块,用于从待处理表格中解析出若干个子表格的表名和每一所述子表格中的若干个列名;
[0018]规则配置模块,用于结合所有所述子表格的表名和所有所述子表格中的所有列名进行规则配置,得到目标指标的规则表;
[0019]指标提取模块,用于根据所述目标指标的规则表,从所述待处理表格中提取所述目标指标。
[0020]进一步地,所述表格指标提取装置,还包括:
[0021]自动学习模块,用于在所述从待处理表格中解析出若干个子表格的表名和每一所述子表格中的若干个列名之后,采用自动学习技术识别各个所述子表格的表名对应的标准表名,以及各个所述子表格中的每一列名对应的标准列名,将各个所述子表格的表名转换为对应的标准表名,分别将各个所述子表格中的每一列名转换为对应的标准列名。
[0022]进一步地,所述规则配置模块,具体用于基于所有所述子表格的表名和所有所述子表格中的所有列名,根据用户针对所述目标指标输入的若干组规则配置参数,从所有所述子表格中确定若干个目标子表格和每一所述目标子表格的搜索列范围,生成若干条表格指标提取规则,以整合所有所述表格指标提取规则,得到所述目标指标的规则表。
[0023]进一步地,所述规则配置参数包括数据来源表的表名、列范围、列范围开始关键字、列范围结束关键字、查找列、结果列、匹配类型、搜索关键字、匹配模式、规则叠加模式、比例换算方式。
[0024]进一步地,指标提取模块,具体用于分别根据所述目标指标的规则表中的每一所述表格指标提取规则,从待处理表格中提取对应的目标数据,得到所有所述目标数据,并结合所有所述目标数据,计算所述目标指标。
[0025]相比于现有技术,本专利技术的实施例,具有如下有益效果:
[0026]通过从待处理表格中解析出若干个子表格的表名和每一子表格中的若干个列名;结合所有子表格的表名和所有子表格中的所有列名进行规则配置,得到目标指标的规则表;根据目标指标的规则表,从待处理表格中提取目标指标,能够适应不同格式的待处理表格灵活配置目标指标的规则表,基于目标指标的规则表自动提取目标指标。
附图说明
[0027]图1为本专利技术第一实施例中的一种表格指标提取方法的流程示意图;
[0028]图2为本专利技术第一实施例中示例的工程造价报表的示意图;
[0029]图3为本专利技术第一实施例中示例的在工程造价报表中提取目标指标的示意图;
[0030]图4为本专利技术第二实施例中的一种表格指标提取装置的结构示意图。
具体实施方式
[0031]下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0032]需要说明的是,文中的步骤编号,仅为了方便具体实施例的解释,不作为限定步骤执行先后顺序的作用。本实施例提供的方法可以由相关的终端设备执行,且下文均以处理器作为执行主体为例进行说明。
[0033]如图1所示,第一实施例提供一种表格指标提取方法,包括步骤S1~S3:
[0034]S1、从待处理表格中解析出若干个子表格的表名和每一子表格中的若干个列名;
[0035]S2、结合所有子表格的表名和所有子表格中的所有列名进行规则配置,得到目标指标的规则表;
[0036]S3、根据目标指标的规则表,从待处理表格中提取目标指标。
[0037]作为示例性地,在步骤S1中,获取用户上传的待处理表格,比如Excel表格,考虑到待处理表格中通常会有多个子表格,比如Excel表格中的附表一、附表二等,从本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表格指标提取方法,其特征在于,包括:从待处理表格中解析出若干个子表格的表名和每一所述子表格中的若干个列名;结合所有所述子表格的表名和所有所述子表格中的所有列名进行规则配置,得到目标指标的规则表;根据所述目标指标的规则表,从所述待处理表格中提取所述目标指标。2.如权利要求1所述的表格指标提取方法,其特征在于,在所述从待处理表格中解析出若干个子表格的表名和每一所述子表格中的若干个列名之后,还包括:采用自动学习技术识别各个所述子表格的表名对应的标准表名,以及各个所述子表格中的每一列名对应的标准列名;将各个所述子表格的表名转换为对应的标准表名,分别将各个所述子表格中的每一列名转换为对应的标准列名。3.如权利要求1所述的表格指标提取方法,其特征在于,所述结合所有所述子表格的表名和所有所述子表格中的所有列名进行规则配置,得到目标指标的规则表,具体为:基于所有所述子表格的表名和所有所述子表格中的所有列名,根据用户针对所述目标指标输入的若干组规则配置参数,从所有所述子表格中确定若干个目标子表格和每一所述目标子表格的搜索列范围,生成若干条表格指标提取规则,以整合所有所述表格指标提取规则,得到所述目标指标的规则表。4.如权利要求3所述的表格指标提取方法,其特征在于,所述规则配置参数包括数据来源表的表名、列范围、列范围开始关键字、列范围结束关键字、查找列、结果列、匹配类型、搜索关键字、匹配模式、规则叠加模式、比例换算方式。5.如权利要求1所述的表格指标提取方法,其特征在于,所述根据所述目标指标的规则表,从所述待处理表格中提取所述目标指标,具体为:分别根据所述目标指标的规则表中的每一所述表格指标提取规则,从待处理表格中提取对应的目标数据,得到所有所述目标数据,并结合所有所述目标数据,计算所...

【专利技术属性】
技术研发人员:梅诗妍侯凯李佳孙罡陈铭刘江敏刘刚刚胡晋岚刘景华姜玉梁周妍秦燕秦万祥赵芳菲
申请(专利权)人:广东电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1