一种标书结构化处理方法及系统技术方案

技术编号:29403443 阅读:23 留言:0更新日期:2021-07-23 22:41
本发明专利技术涉及计算机技术领域,具体公开了一种标书结构化处理方法及系统,所述的一种标书结构化处理方法,包括以下步骤:S1:对标书文件进行预处理,获得处理后的标书文档;S2:对所述标书文档进行结构分析,并将标书文档分为若干部分,每个部分均对应一个标签,获得分析后的待处理文档;S3:构建标书文档结构化数据库,所述标书文档结构化数据库内对应每个标签均设置有相对应的存储区;S4:将所述待处理文档中不同标签的部分存储至相对应的存储区中。本发明专利技术具有能够有效地对标书文件进行存储,并且在后续能够高效率地对想要了解的信息进行查询的优点。

【技术实现步骤摘要】
一种标书结构化处理方法及系统
本专利技术涉及计算机
,具体涉及了一种标书结构化处理方法及系统。
技术介绍
招投标,是招标投标的简称。招标和投标是一种商品交易行为,是交易过程的两个方面。招标投标是一种国际惯例,是商品经济高度发展的产物,是应用技术、经济的方法和市场经济的竞争机制的作用,有组织开展的一种择优成交的方式。这种方式是在货物、工程和服务的采购行为中,招标人通过事先公布的采购和要求,吸引众多的投标人按照同等条件进行平等竞争,按照规定程序并组织技术、经济和法律等方面专家对众多的投标人进行综合评审,从中择优选定项目的中标人的行为过程。其实质是以较低的价格获得最优的货物、工程和服务。但是目前对标书文件的管理大部分还是通过人为处理,如果是纸质标书的话,需要通过人工去保存,还存在着保存不当导致标书受损的风险,电子档的标书文件也存在着存放杂乱导致不能快速地对标书文件进行查询统计的问题。为此,我们提供一种标书结构化处理方法以及系统,用以提高标书文件的存储安全性以及查询和存取的效率。
技术实现思路
针对现有技术存在不能有效率地对标书文件进行查询以及存取的问题,本专利技术的目的在于提供一种标书结构化处理方法及系统,具有能够有效地对标书文件进行存储,并且在后续能够高效率地对想要了解的信息进行查询的优点。本专利技术的上述技术目的是通过以下技术方案得以实现的:一种标书结构化处理方法,其特征在于,包括以下步骤:S1:对标书文件进行预处理,获得处理后的标书文档;S2:对所述标书文档进行结构分析,并将标书文档分为若干部分,每个部分均对应一个标签,获得分析后的待处理文档;S3:构建标书文档结构化数据库,所述标书文档结构化数据库内对应每个标签均设置有相对应的存储区;S4:将所述待处理文档中不同标签的部分存储至相对应的存储区中。优选地,所述对标书文件进行预处理,获得处理后的标书文档包括:S101:当标书文件为纸质标书文件时,将纸质标书文件转化成电子标书文件;S102:将电子标书文件内容进行初步划分,获得标书文档。如果标书文件为纸质文件的话首先将纸质标书文件通过OCR文字识别技术转化为电子标书文件,这样能够更方便地将纸质的标书文件的内容进行内容初步划分,从而实现了纸质标书文件也能进行结构化处理的好处。优选地,所述对所述标书文档进行结构分析,并将标书文档分为若干部分,每个部分均对应一个标签包括:S201:设定标准目录,每个目录均为一个标签;S202:对标书文档的内容进行按照标准目录进行划分,获得若干部分的标书文档;S203:将划分后的部分附上相对应的标签。设定标准目录能够更加有效地对标书文件中各个部分有一个更加清晰的划分,也能够有效地提高了后续的查询过程的效率。优选地,所述标准目录包括:工程概述、设备详细技术要求、技术偏差、设计图纸提交要求以及其他共5个标签。优选地,所述构建标书文档结构化数据库,所述标书文档结构化数据库内对应每个标签均设置有相对应的存储区包括:根据标准目录中的标签在标书文档结构化数据库内分别设置有工程概述存储区、设备详细技术要求存储区、技术偏差存储区、设计图纸提交要求存储区以及其他存储区共5个存储区。不同标签的文件内容能够保存至相对应的存储区,能够保证在查询的过程中每个存储区所存储的内容均能够迅速反应,能够更加有效地提高了后续对标书文件查询的效率。一种标书结构化处理系统,其特征在于,包括:预处理模块,所述预处理模块用于对标书文件进行预处理,获得处理后的标书文档;分析模块,所述分析模块用于对所述标书文档进行结构分析,并将标书文档分为若干部分,每个部分均对应一个标签,获得分析后的待处理文档;数据库建立模块,所述数据库建立模块用于构建标书文档结构化数据库,所述标书文档结构化数据库内对应每个标签均设置有相对应的存储区;存储模块,所述存储模块用于将所述待处理文档中不同标签的部分存储至相对应的存储区中。一种标书结构化处理装置,其特征在于:包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现上述的标书结构化处理方法。一种计算机可读存储介质,其特征在于:所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现上述的标书结构化处理方法。上述标书结构化处理方法及系统,具有以下有益效果:设定标准目录能够更加有效地对标书文件中各个部分有一个更加清晰的划分,也能够有效地提高了后续的查询过程的效率;对标书文件进行预处理,能够对纸质的标书文件转化为电子标书文件,从而能够有效地对标书文件进行保存,避免了标书文件存在认为损坏的风险,提高了标书文件存储的安全性。附图说明图1是本实施例一种标书结构化处理方法的示意图。图2是本实施例中步骤S1的示意图。图3是本实施例中步骤S2的示意图。图4是本实施例一种标书结构化处理系统的示意图。具体实施方式以下实施例是对本专利技术的进一步说明,不是对本专利技术的限制。一种标书结构化处理方法,其特征在于,包括以下步骤:S1:对标书文件进行预处理,获得处理后的标书文档;S2:对所述标书文档进行结构分析,并将标书文档分为若干部分,每个部分均对应一个标签,获得分析后的待处理文档;S3:构建标书文档结构化数据库,所述标书文档结构化数据库内对应每个标签均设置有相对应的存储区;S4:将所述待处理文档中不同标签的部分存储至相对应的存储区中。优选地,所述对标书文件进行预处理,获得处理后的标书文档包括:S101:当标书文件为纸质标书文件时,将纸质标书文件转化成电子标书文件;S102:将电子标书文件内容进行初步划分,获得标书文档。优选地,所述对所述标书文档进行结构分析,并将标书文档分为若干部分,每个部分均对应一个标签包括:S201:设定标准目录,每个目录均为一个标签;S202:对标书文档的内容进行按照标准目录进行划分,获得若干部分的标书文档;S203:将划分后的部分附上相对应的标签。优选地,所述标准目录包括:工程概述、设备详细技术要求、技术偏差、设计图纸提交要求以及其他共5个标签。优选地,所述构建标书文档结构化数据库,所述标书文档结构化数据库内对应每个标签均设置有相对应的存储区包括:根据标准目录中的标签在标书文档结构化数据库内分别设置有工程概述存储区、设备详细技术要求存储区、技术偏差存储区、设计图纸提交要求存储区以及其他存储区共5个存储区。一种标书结构化处理系统,其特征在于,包括:预处理模块100,所述预处理模块用于对标书文件进行预处理,获得处理后的标书文档;分析模块200,所述分析模块用于对所述标书文档进行结构分析,并将标书文档分为若干部分,每个部分均对应一个标签,获得分析后的待处理文档;数据库建本文档来自技高网...

【技术保护点】
1.一种标书结构化处理方法,其特征在于,包括以下步骤:/nS1:对标书文件进行预处理,获得处理后的标书文档;/nS2:对所述标书文档进行结构分析,并将标书文档分为若干部分,每个部分均对应一个标签,获得分析后的待处理文档;/nS3:构建标书文档结构化数据库,所述标书文档结构化数据库内对应每个标签均设置有相对应的存储区;/nS4:将所述待处理文档中不同标签的部分存储至相对应的存储区中。/n

【技术特征摘要】
1.一种标书结构化处理方法,其特征在于,包括以下步骤:
S1:对标书文件进行预处理,获得处理后的标书文档;
S2:对所述标书文档进行结构分析,并将标书文档分为若干部分,每个部分均对应一个标签,获得分析后的待处理文档;
S3:构建标书文档结构化数据库,所述标书文档结构化数据库内对应每个标签均设置有相对应的存储区;
S4:将所述待处理文档中不同标签的部分存储至相对应的存储区中。


2.根据权利要求1所述的标书结构化处理方法,其特征在于,所述对标书文件进行预处理,获得处理后的标书文档包括:
S101:当标书文件为纸质标书文件时,将纸质标书文件转化成电子标书文件;
S102:将电子标书文件内容进行初步划分,获得标书文档。


3.根据权利要求1所述的标书结构化处理方法,其特征在于,所述对所述标书文档进行结构分析,并将标书文档分为若干部分,每个部分均对应一个标签包括:
S201:设定标准目录,每个目录均为一个标签;
S202:对标书文档的内容进行按照标准目录进行划分,获得若干部分的标书文档;
S203:将划分后的部分附上相对应的标签。


4.根据权利要求3所述的标书结构化处理方法,其特征在于,所述标准目录包括:工程概述、设备详细技术要求、技术偏差、设计图纸提交要求以及其他共5个标签。


...

【专利技术属性】
技术研发人员:王忠军李寿荣潘晓华魏磊
申请(专利权)人:南方电网深圳数字电网研究院有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1