【技术实现步骤摘要】
建筑工程excel文件的存储方法、装置、设备和存储介质
[0001]本专利技术涉及建筑工程图形识别领域,具体涉及一种建筑工程
excel
文件的存储方法
、
装置
、
设备和可读存储介质
。
技术介绍
[0002]随着建筑工程技术的迅速发展,建设方
、
施工方和咨询方等各领域的造价人员需要使用指标文件作为建筑工程项目的工程量测算成本管理参考,因此,对于指标文件的存储也成为建筑工程不可或缺的一步
。
现阶段,各建筑企业通常需要将指标
excel
文件导入至对应企业平台的软件系统进行存储和编制的
。
[0003]现有技术中由于各企业管理方式不同,因此存储的指标
excel
文件也有所不同,在对系统中指标
excel
文件中的数据内容进行编制或者汇总时,通常因为存在表格样式多
、
制表样式差异大和科目名称命名多样等情形,而导致数据内容识别准确率不足,增加了指标 />excel
...
【技术保护点】
【技术特征摘要】
1.
一种建筑工程
excel
文件的存储方法,其特征在于,所述方法包括:获取经过格式标准化的建筑工程
excel
文件并进行拆分,获得待识别数据,其中,所述待识别数据包括表头数据和非表头数据;识别每列的表头数据和非表头数据所属的指标类型,并对识别结果进行分别存储;根据所述识别结果确定每列所述待识别数据所属的统一指标类型;从所述统一指标类型中确定科目名称和其他指标类型,并判断所述统一指标类型中是否存在单项信息指标类型,若存在所述单项信息指标类型,根据所述单项信息指标类型
、
所述科目名称指标类型和所述其他指标类型将所述待识别数据存储至标准模板,否则,根据所述科目名称指标类型和所述其他指标类型将所述待识别数据存储至标准模板
。2.
根据权利要求1所述的方法,其特征在于,所述识别每列的表头数据和非表头数据所属的指标类型,并对识别结果进行分别存储,包括:根据第一预设正则表达式集对所述表头数据进行逐列识别,获得每列表头数据所属的指标类型,提取每列表头数据所属的指标类型并进行顺序拼接,生成所述表头数据的指标类型表头行以实现表头数据识别结果的存储;根据第二预设正则表达式集和预设分类器对所述非表头数据进行逐列识别,获得每列非表头数据所属的指标类型,提取每列非表头数据所属的指标类型并进行顺序拼接,生成所述非表头数据的指标类型表头行以实现非表头数据识别结果的存储
。3.
根据权利要求1所述的方法,其特征在于,所述根据所述识别结果确定每列所述待识别数据所属的统一指标类型,包括:逐列判断所述表头数据的指标类型和所述非表头数据的指标类型是否相同;若相同,则将所述指标类型确定为该列待识别数据的统一指标类型;若不相同,则根据所述非表头数据所属的指标类型或所述表头数据所属的指标类型确定该列待识别数据的统一指标类型
。4.
根据权利要求3所述的方法,其特征在于,所述其他指标类型包括科目编码
、
单位
、
计算口径
、
计算口径值和数值属性,所述根据所述非表头数据所属的指标类型或者所述表头数据所属的指标类型确定该列待识别数据的统一指标类型,包括:若所述非表头数据所属的指标类型为计算口径,确定所述非表头数据所属的指标类型为该列待识别数据的统一指标类型;若所述表头数据的布局形式为单行且所属的指标类型为单项信息
、
科目编码
、
科目名称
、
单位
、
计算口径值和数值属性中的任一项,确定该列表头数据所属的指标类型为该列待识别数据的统一指标类型;若所述表头数据的布局形式为多行且所属的指标类型包含单项信息和数值属性,确定数值属性为该列待识别数据的统一指标类型;若所述表头数据的布局形式为多行且所属的指标类型包含未识别信息,确定该列待识别数据的统一指标类型为待确定
。5.
根据权利要求3所述的方法,其特征在于,所述其他指标类型包括公共指标类型和数值属性指标类型,所述从所述统一指标类型中确定科目名称和其他指标类型,包括:判断所述统一指标类型中是否存在科目名称指标类型,根据判断结果获取科目名称指标类型和其他指标类型;
若存在科目名称指标类型,则获取所述科目名称指标类型和其他指标类型作为标准模板的部分定位条件,以将所述非表头数据导入至标准模板中;若不存在科目名称指标类型,则根据预设分类器对所属指标类型为未识别信息的表头数据进行识别,获得所属指标类型为科目名称指标类型的表头数据,根据所属指标类型为科目名称的表头数据的布局形式确定科目名称关联的科目编号,并根据第二预设正则表达式集对所述所属指标类型为科目名称的表头数据进行识别,确定所述科目名称指标类型关联的数值属性指标类型,获取所述科目名称指标类型和所述科目名称指标类型关联的科目编号指标类型
、
关联的数值属性指标类型与公共指标类型作为导入模板的部分定位条件,以将所述待识别数据导入至标准模板中
。6.
根据权利要求5所述的方法,其特征在于,所述根据所属指标类型为科目名称的表头数据的布局形式确定科目编号,包括:若所属指标类型为科目名称的表头数据的布局为单行,确定所述科目名称指标类型关联的科目编号指标类型为同级形式;若所属指标类型为科目名称的表头数据的布局为多行,确定所述科目名称指标类型关...
【专利技术属性】
技术研发人员:冯奕凯,
申请(专利权)人:广联达科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。