System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及工程造价,尤其涉及一种提高工程造价的标准性和准确性的识别、检索方法。
技术介绍
1、近年来输变电工程设计在大力推行三维设计,但现阶段受限于设计规范深度及数据维度难以统一等问题,欲实现输变电工程三维设计与造价无缝对接实际应用难度高。
2、目前主流方式是由设计人员进行设计提资,提供电气清册,技经利用excel,依据图纸及电气清册手动计算工程量,如果设计图纸一旦发生变化,技经人员就需要重新计算工程量,对于工作的重复性和复杂性增加了一定的麻烦。这不仅增加了工作量,而且由于人工计算的准确度不足,导致可溯源性差,对后期施工缺乏指导作用。为此是本领域人员所急需解决的技术问题。
技术实现思路
1、为了克服上述缺点,本专利技术提供一种提高工程造价的标准性和准确性的识别、检索方法。
2、技术方案是:一种提高工程造价的标准性和准确性的识别、检索方法,包括以下步骤:
3、分布式数据库系统建设:
4、步骤1:设计分布式数据库架构,选择hadoop生态系统,配置hdfs和yarn。
5、步骤2:安装和配置spark sql。
6、数据导入和识别:
7、步骤3:从电气一次二次记通信清册中导入电气设备的信息,包括设备名称、型号规格、单位和数量。
8、步骤4:通过关联标准物料名称,获取物料的标准规格、单位和数量,以便于后续的匹配和统计。
9、数据模型设计:
10、步骤5:创建电气物料
11、步骤6:定义事实表和维度表,确保数据的一致性和减少冗余。
12、数据分析工具开发:
13、步骤7:使用python或java开发数据匹配和统计的算法。
14、步骤8:基于定额清单梳理出的标准规则,与标准物料、清单定额条目、项目划分进行匹配套取,实现变电电气物料的自动化、精细化统计。
15、优选地,所述步骤1的具体流程如下:
16、1.1)选择合适的硬件平台和操作系统,下载并安装hadoop发行版,如apachehadoop、cloudera、hortonworks等,按照官方操作进行配置和部署。
17、1.2)设定hadoop集群的角色和节点,如namenode、datanode、resourcemanager、nodemanager等,配置hdfs和yarn的参数,如副本数、块大小、内存分配、调度策略等。
18、1.3)启动hadoop集群,检查各个节点的运行状态和日志,确保集群正常工作。
19、优选地,所述步骤2的具体流程如下:
20、2.1)根据数据分析的需求,选择合适的分布式sql引擎,下载并安装相应的sparksql软件包。
21、2.2)配置spark sql的参数,如元数据存储、连接方式、执行引擎、优化选项等,使其能够与hadoop集群协同工作。
22、2.3)创建数据库和表,定义数据的结构和格式,如列名、数据类型、分区键、压缩方式等。
23、优选地,所述步骤3的具体流程如下:
24、3.1)获取电气一次二次记通信清册的数据源,如excel文件、csv文件、数据库表等,了解数据的内容和格式。
25、3.2)设计电气设备信息表的结构,如设备id、设备名称、型号规格、单位、数量、所属变电站、所属间隔等字段,确定数据的类型和约束。
26、3.3)创建电气设备信息表,使用spark sql的命令或api在hdfs上创建相应的表,如create table、create external table等。
27、3.4)导入电气一次二次记通信清册的数据,使用spark sql的命令将数据从数据源加载到电气设备信息表中,如load data、insert into、create table as select等。
28、优选地,所述步骤4的具体流程如下:
29、4.1)获取标准物料名称的数据源,如物料命名规范、物料标识指南、物料编码规则等,了解数据的内容和格式。
30、4.2)设计物料标准信息表的结构,如物料名称、标准规格、标准单位、标准数量等字段,确定数据的类型和约束。
31、4.3)创建物料标准信息表,使用spark sql的命令在hdfs上创建相应的表,如create table、create external table等。
32、4.4)导入标准物料名称的数据,使用spark sql的命令将数据从数据源加载到物料标准信息表中,如load data、insert into、create table as select等。
33、4.5)关联电气设备信息表和物料标准信息表,使用spark sql的命令进行表连接,如join、on、where等,根据设备名称和物料名称的匹配,获取物料的标准规格、单位和数量。
34、4.6)输出关联结果,使用spark sql的命令将关联结果保存到hdfs上的文件或表中,如insert overwrite、create table as select等,或者直接显示在终端或界面上,如select、show等。
35、优选地,所述步骤5的具体流程如下:
36、5.1)构建星型数据模型,并设计星型数据模型的逻辑结构,确定事实表和维度表的关系,如一对一、一对多、多对多等,以及主键和外键的约束,如物料名称是物料信息表和物料标准信息表的主键,也是物料消耗表的外键等。
37、5.2)设计星型数据模型的物理结构,确定事实表和维度表的存储位置,如hdfs上的文件或表,以及数据的格式,如文本、二进制、parquet等,根据数据的访问频率和查询效率进行优化,如分区、分桶、索引等。
38、优选地,所述步骤6的具体流程如下:
39、6.1)定义事实表的属性,如物料消耗表,包括物料名称、规格、数量、价格、变电站、间隔等字段,确定数据的类型和约束,如字符串、数值、日期等,以及非空、唯一、主键等。
40、6.2)定义维度表的属性,如物料信息表、物料标准信息表、变电站信息表、间隔信息表等,包括各个维度的相关字段,确定数据的类型和约束,如字符串、数值、日期等,以及非空、唯一、主键、外键等。
41、6.3)确保事实表和维度表的数据一致性,如物料名称、规格、变电站、间隔等字段在不同表中的值应该相同,避免出现数据不匹配的情况,如使用数据质量检测和数据清洗的方法进行处理。
42、优选地,所述步骤7的具体流程如下:
43、7.1)选择合适的编程语言,如python或java,根据数据的规模和复杂度进行选择,一般来说,python更简洁、灵活,java更稳定、高效。
44、7.2)选择spark sql作为编程本文档来自技高网...
【技术保护点】
1.一种提高工程造价的标准性和准确性的识别、检索方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种提高工程造价的标准性和准确性的识别、检索方法,其特征在于,所述步骤1的具体流程如下:
3.根据权利要求1所述的一种提高工程造价的标准性和准确性的识别、检索方法,其特征在于,所述步骤3的具体流程如下:
4.根据权利要求1所述的一种提高工程造价的标准性和准确性的识别、检索方法,其特征在于,所述步骤4的具体流程如下:
5.根据权利要求4所述的一种提高工程造价的标准性和准确性的识别、检索方法,其特征在于,所述步骤5~6的具体流程如下:
6.根据权利要求4所述的一种提高工程造价的标准性和准确性的识别、检索方法,其特征在于,所述步骤7~8的具体流程如下:
【技术特征摘要】
1.一种提高工程造价的标准性和准确性的识别、检索方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种提高工程造价的标准性和准确性的识别、检索方法,其特征在于,所述步骤1的具体流程如下:
3.根据权利要求1所述的一种提高工程造价的标准性和准确性的识别、检索方法,其特征在于,所述步骤3的具体流程如下:
4.根据权利要...
【专利技术属性】
技术研发人员:刘宏志,靳书栋,李越,杨博杰,李凯,尹彦涛,韩延峰,李倩,张灿,康方,曹孟迪,李彦,王艳梅,郝铁军,
申请(专利权)人:国网山东省电力公司经济技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。