基于相似度对比的建设工程项目数据管理方法及系统技术方案

技术编号:15792686 阅读:54 留言:0更新日期:2017-07-10 01:37
本发明专利技术涉及一种基于相似度对比的建设工程项目数据管理方法及系统,方法主要包括:将各项目根据行业标准划分层级类别;根据层级类别确定工程项目特征的备选指标,搜集对应的工程项目特征指标数据并存储于项目库中;从项目库中选择目标项目的工程项目特征指标数据,并筛选出关联项目的工程项目特征指标数据;对工程项目特征指标数据相应进行缺失值或异常值处理及标准化处理;基于标准化后的工程项目特征指标数据,计算各关联项目与目标项目之间的相似度。本发明专利技术实现了对不同项目之间的相似性度量,相对于人工判断具有省时省力、成本低等优点。

【技术实现步骤摘要】
基于相似度对比的建设工程项目数据管理方法及系统
本专利技术属于建设工程项目数据管理领域,具体涉及一种基于相似度对比的建设工程项目数据管理方法及系统。
技术介绍
目前,建设行业历史累积的工程项目数据(包括工程项目特征指标数据)数量惊人、种类繁多,而且这些数据的层级较复杂,维度过多,导致业界难以用统一的标准对这些数据进行深度分类及管理。现有技术中采用的分类及管理方案的实施大多主要依赖人工判断,过于耗时费力,且造成企业管理成本居高不下。这是导致大部分企业对历史工程项目数据疏于管理的主要原因,从而也阻碍了项目数据之间的有效对比、校验及海量历史工程项目数据价值的实现。
技术实现思路
本专利技术针对目前存在的工程项目数据的分类管理过于耗时耗力、企业管理成本高等缺陷,提出一种基于相似度对比的建设工程项目数据管理方法,同时相应提出了一种基于相似度对比的建设工程项目数据管理系统的结构方案。本专利技术提出的一种基于相似度对比的建设工程项目数据管理方法,主要包括以下步骤A1至A6:A1、将各项目根据行业标准划分层级类别;A2、根据各项目的层级类别确定工程项目特征的备选指标,搜集选定的备选指标对应的工程项目特征指标数据,并存储于项目库中;A3、从项目库中选择目标项目的工程项目特征指标数据,并筛选出与目标项目的层级类别相同的关联项目的工程项目特征指标数据;A4、对工程项目特征指标数据出现缺失或异常的目标项目或关联项目,相应进行缺失值或异常值处理;A5、对目标项目和各关联项目的工程项目特征指标数据进行标准化处理;A6、基于标准化后的工程项目特征指标数据,计算各关联项目与目标项目之间的相似度。本专利技术的一优选方案中,步骤A1中的层级类别具体包括行业类型、工程类型、项目类型三个层级类别。但根据不同的行业标准可有不同的层级类别划分方案。本专利技术的一优选方案中,步骤A2中工程项目特征的备选指标包括公共指标和各行业特殊属性指标。本专利技术的一优选方案中,步骤A4包括A41至A42:A41、对目标项目和关联项目的工程项目特征指标数据的异常值和缺失值进行识别;A42、对工程项目特征指标数据出现缺失或异常的目标项目或关联项目的异常值或缺失值相应进行填补修正。本专利技术的一优选方案中,步骤A5包括:将目标项目和各关联项目的工程项目特征指标数据以最小值至最大值相应映射到[0,1]区间进行标准化。即最小值映射为0,最大值映射为1,其他值处于0至1之间。本专利技术的一优选方案中,步骤A6包括:基于欧氏距离计算公式并结合预置的各工程项目特征指标数据的权重,计算各关联项目与目标项目之间的相似度。本专利技术的一优选方案中,步骤A6之后还可包括步骤:A7、根据相似度选择相应的关联项目与目标项目进行对比分析。本专利技术相应提出的一种基于相似度对比的建设工程项目数据管理系统的结构方案,主要包括层级类别划分模块、数据搜集模块、关联项目筛选模块、数据缺失或异常处理模块、数据标准化模块、相似度计算模块;层级类别划分模块,将各项目根据行业标准划分层级类别;数据搜集模块,根据各项目的层级类别确定工程项目特征的备选指标,搜集选定的备选指标对应的工程项目特征指标数据,并存储于项目库中;关联项目筛选模块,从项目库中选择目标项目的工程项目特征指标数据,并筛选出与目标项目的层级类别相同的关联项目的工程项目特征指标数据;数据缺失或异常处理模块,对工程项目特征指标数据出现缺失或异常的目标项目或关联项目,相应进行缺失值或异常值处理;数据标准化模块,对目标项目和各关联项目的工程项目特征指标数据进行标准化处理;相似度计算模块,基于标准化后的工程项目特征指标数据,计算各关联项目与目标项目之间的相似度。本专利技术的一优选方案中,除了以上模块之后还包括:对比分析模块,根据相似度选择相应的关联项目与目标项目进行对比分析。本专利技术具备以下有益效果:基于统一标准划分的层级类别,对目标项目与关联项目的工程项目特征指标数据进行相似度计算,实现对不同项目之间的相似性度量,相对于人工判断具有省时省力、成本低等优点。本专利技术可方便地实现工程项目的分类及管理,对于企业积累的海量历史工程项目数据价值的实现提供了重要技术基础。附图说明图1是实施例一涉及的一种基于相似度对比的建设工程项目数据管理方法流程示意图。图2是实施例二涉及的一种基于相似度对比的建设工程项目数据管理系统结构框图。具体实施方式为了便于本领域技术人员理解,下面将结合附图以及实施例对本专利技术进行进一步描述。实施例一请参阅图1,实施例一涉及的一种基于相似度对比的建设工程项目数据管理方法,主要包括以下步骤S100至S600:S100、将各项目根据行业标准划分层级类别。作为参考,根据行业标准,步骤S100中的层级类别可包括行业类型、工程类型、项目类型三个层级类别。例如:项目1的行业类型为建筑工程,工程类型为居住建筑工程,项目类型为宿舍项目。当然,根据不同的行业标准可有不同的层级类别划分方案。S200、根据各项目的层级类别确定工程项目特征的备选指标,搜集选定的备选指标对应的工程项目特征指标数据,并存储于项目库中。例如:根据步骤S200执行后搜集到表1所示工程项目特征指标数据(或简称为指标数据):表1.原始的工程项目特征指标数据如表1所示,步骤S200中工程项目特征的备选指标可包括公共指标和各行业特殊属性指标。公共指标包括总造价、单方造价、各专业单方造价(土建、装饰、电气、市政工程、消防、智能化)等指标;行业特殊属性指标包括建筑面积、层数、总高度等指标。当然,备选指标不限于以上分类。S300、从项目库中选择目标项目的工程项目特征指标数据,并筛选出与目标项目的层级类别相同的关联项目的工程项目特征指标数据。例如:根据步骤S300假设选择项目1为目标项目,并且筛选到项目2至项目7为关联项目。S400、对工程项目特征指标数据出现缺失或异常的目标项目或关联项目,相应进行缺失值或异常值处理。步骤S400的详细方案具体可参考以下步骤S410至S420:S410、对目标项目和关联项目的工程项目特征指标数据的异常值和缺失值进行识别。本实施例中,异常值是指一组数据值(测定值)与大部分同类数据的差距较大的情况,可作为缺失值进行处理。缺失值是指原始的工程项目特征指标数据出现缺失的情况,因此需要通过某种合理的方式对其进行填补或修正。例如:一、各维度指标数据出现小于零的数可视为异常值;二、各指标数据大于该指标的上限Qmax或小于该指标的下限Qmin可视为异常值。关于Qmax和Qmin的计算如下所示:假定有n项目,第K个指标数据由小到大排序后组成向量(x1,x2,x3…,xn),第K个指标数据中的上限和下限分别为Qmax和Qmin。向量(x1,x2,x3…,xn)的上四分位数为Q1,下四分位数为Q3。Q1=x(n+1)×0.25(1)Q3=x(n+1)×0.75(2)Qmin=Q1-1.5(Q3-Q1)(3)Qmax=Q3+1.5(Q3-Q1)(4)关于Q1和Q3的计算会出现另外一种情况,当(n+1)×0.25不为整数时,假设(n+1)×0.25的整数部分为a,小数部分为b,Q1=(1-b)xa+bxa+1,Q3同理可得。S420、对工程项目特征指标数据出现缺失或异常的目标项目或关联项目和异常值或缺失值相应进行填补修正。本实施例只对本文档来自技高网...
基于相似度对比的建设工程项目数据管理方法及系统

【技术保护点】
一种基于相似度对比的建设工程项目数据管理方法,其特征在于,包括以下步骤:A1、将各项目根据行业标准划分层级类别;A2、根据各项目的层级类别确定工程项目特征的备选指标,搜集选定的备选指标对应的工程项目特征指标数据,并存储于项目库中;A3、从项目库中选择目标项目的工程项目特征指标数据,并筛选出与目标项目的层级类别相同的关联项目的工程项目特征指标数据;A4、对工程项目特征指标数据出现缺失或异常的目标项目或关联项目,相应进行缺失值或异常值处理;A5、对目标项目和各关联项目的工程项目特征指标数据进行标准化处理;A6、基于标准化后的工程项目特征指标数据,计算各关联项目与目标项目之间的相似度。

【技术特征摘要】
1.一种基于相似度对比的建设工程项目数据管理方法,其特征在于,包括以下步骤:A1、将各项目根据行业标准划分层级类别;A2、根据各项目的层级类别确定工程项目特征的备选指标,搜集选定的备选指标对应的工程项目特征指标数据,并存储于项目库中;A3、从项目库中选择目标项目的工程项目特征指标数据,并筛选出与目标项目的层级类别相同的关联项目的工程项目特征指标数据;A4、对工程项目特征指标数据出现缺失或异常的目标项目或关联项目,相应进行缺失值或异常值处理;A5、对目标项目和各关联项目的工程项目特征指标数据进行标准化处理;A6、基于标准化后的工程项目特征指标数据,计算各关联项目与目标项目之间的相似度。2.根据权利要求1所述的基于相似度对比的建设工程项目数据管理方法,其特征在于,步骤A1中的层级类别具体包括行业类型、工程类型、项目类型三个层级类别。3.根据权利要求1所述的基于相似度对比的建设工程项目数据管理方法,其特征在于,步骤A2中工程项目特征的备选指标包括公共指标和各行业特殊属性指标。4.根据权利要求1所述的基于相似度对比的建设工程项目数据管理方法,其特征在于,步骤A4包括:A41、对目标项目和关联项目的工程项目特征指标数据的异常值和缺失值进行识别;A42、对工程项目特征指标数据出现缺失或异常的目标项目或关联项目和异常值或缺失值相应进行填补修正。5.根据权利要求1所述的基于相似度对比的建设工程项目数据管理方法,其特征在于,步骤A5包括:将目标项目和各关联项目的工程项目特征指标数据以最小值至最大值相应映射到[0,1]区间进行标准化。6.根据权利要求1所述的基于相似度对比的建设工程项目数据管理方法,其特征在于,步骤A6包括:基于欧氏距离计算公式并结合预置的各工程项目特征指标数...

【专利技术属性】
技术研发人员:陈玉辉陈林淇黄宁胡乾侯晓峰张涛陈红仙
申请(专利权)人:广东中建普联科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1