【技术实现步骤摘要】
基于openpyxl的工程量清单目录比对系统及方法
本专利技术涉及技术语言文档处理
,具体为一种基于openpyxl的工程量清单目录比对系统及方法。
技术介绍
技术语言文档处理技术主要是针对庞杂的表格及文本信息按照特殊的逻辑关系标识出有用的技术词语。随着海量表格及文本数据的增加,如何从海量文本信息中迅速捕获到适用于自身的信息,进而对这些信息进行合理的应用和管理是当前急需解决的问题。目前,物资项目管理领域下,表格及文档大都直接人为处理,例如,工程量清单,导致在工程量清单的整理过程中,工作效率较低且容易出现错漏,进而使工程量清单的处理效率及处理效果都不太理想。
技术实现思路
本专利技术针对现有技术存在的问题,提出了一种基于openpyxl的工程量清单目录比对系统及方法,能够将工程量清单目录上的关键信息快速有效地汇总到总表文档上,有效减轻了物资项目管理人员的工作复杂度。本专利技术解决其技术问题所采用的技术方案是:一种基于openpyxl的工程量清单目录比对系统,包括excel文件获 ...
【技术保护点】
1.基于openpyxl的工程量清单目录比对系统,其特征在于:包括/nexcel文件获取模块,用于上传同一批次的目录数据并获取具有sheet表名称为工程量清单的excel文件;/n总表文档创建模块,用于创建总表文档;/nexcel文件处理模块,用于获取excel文件的关键词信息;/n关键词信息记录模块,用于将所述excel文件的关键词信息记录在所述总表文档中;/n总表文档导出模块,用于导出所述总表文档。/n
【技术特征摘要】
1.基于openpyxl的工程量清单目录比对系统,其特征在于:包括
excel文件获取模块,用于上传同一批次的目录数据并获取具有sheet表名称为工程量清单的excel文件;
总表文档创建模块,用于创建总表文档;
excel文件处理模块,用于获取excel文件的关键词信息;
关键词信息记录模块,用于将所述excel文件的关键词信息记录在所述总表文档中;
总表文档导出模块,用于导出所述总表文档。
2.根据权利要求1所述的基于openpyxl的工程量清单目录比对系统,其特征在于:所述excel文件获取模块包括
总文件夹建立单元,用于建立存放所述目录数据的批次文件总文件夹,所述目录数据包括压缩包、文件夹、word文件和excel文件;
压缩包解压单元,用于在所述批次文件总文件夹中将所述压缩包解压为文件夹;
次文件夹建立单元,用于建立存放所述批次文件总文件夹以及所述文件夹中的word文件和excel文件的批次文件次文件夹;
文档分类单元,用于通过openpyxl功能模块将所述待处理文档分类为excel文件和word文件;
excel文件确定单元,用于通过openpyxl功能模块读取excel文件的sheet表名称以确定具有sheet表名称为工程量清单的excel文件。
3.根据权利要求1所述的基于openpyxl的工程量清单目录比对系统,其特征在于:所述excel文件处理模块用于将名称为工程量清单的sheet表中的内容与数据库中一二级采购目录进行关键词匹配,如果匹配上,则获取关键词信息;所述关键词信息包括关键词本体、关键词类型、关键词行列坐标信息、关键词所在sheet表的页数以及关键词所在excel文件的名称。
4.根据权利要求3所述的基于openpyxl的工程量清单目录比对系统,其特征在于:所述excel文件处理模块通过xlrd功能模块读取名称为工程量清单的sheet表中的内容。
5.根据权利要求3所述的基于openpyxl的工程量清单目录比对系统,其特征在于:所述关键词信息记录模块包括
第一记录单元,用于将所述关键词信息的关键词本体记录在所述总表文档中;
第二记录单元,用于将所述关键词本体所对应的类型记录在所述总表文档中;
第三记录单元,用于将所述关键词本体在sheet表中的行列坐标信息记录在所述总表文档中;
第四记录单元,用于将具有所述关键词本体的sheet表位于excel文件中的页数记录在所述总表文档中;
第五记录单元,用于将所述关键词本体所对...
【专利技术属性】
技术研发人员:钱仲文,李雪维,裘华东,范江东,赵欣,金日强,张志仁,韩欣之,吕晓青,卢孔实,吴越人,郭燕玲,潘丐多,叶凡,林春,张睿,李媛媛,朱力,郑思佳,吴波,徐天天,袁奕文,何佳,杨文颖,喻琤,刘挺,杨钦,
申请(专利权)人:国网浙江省电力有限公司物资分公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。