【技术实现步骤摘要】
建设行业工程量计价清单数据自动编码与识别方法及系统
本专利技术属于建设行业工程数据分析领域,具体涉及一种建设行业工程量计价清单数据自动编码与识别方法及系统。
技术介绍
在建设行业,各个企业要实现建设工程项目的全过程管理,需要对海量的工程项目数据(例如工程量计价清单数据)进行对比、分析、预警、总结等等。各省份所采用的清单计价规范偏差较大,或者采用不同版本的清单计价规范,编码不统一,工程项目数据难以在计算机系统中统一识别和调用,通常只能靠人工经验进行判断,效率低、成本高,准确性差。导致在建设工程项目全过程管理中无法准确有效的进行成本管控和预警。
技术实现思路
本专利技术针对现有技术中计价清单数据难以识别、分析所导致的效率低以及成本高等问题,提出一种建设行业工程量计价清单数据自动编码与识别方法,同时相应提出一种建设行业工程量计价清单数据自动编码与识别系统的结构方案。本专利技术提出的一种建设行业工程量计价清单数据自动编码与识别方法,主要包括以下步骤A1至步骤A6:A1、获取计价清单数据,根据统一的标准清单编码规范对所述计价清单数据中的清单编码进行标准化处理,提取标准的分项编码,并过滤错误的清单编码;A2、将所述计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词;A3、将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库;A4、将所述计价清单数据中提取出的关键词在所述关键词规则库进行匹配分析,结合分项编码仲裁所述计价清单数据所属的类别,将其清单编码进一步识别为预设位数 ...
【技术保护点】
一种建设行业工程量计价清单数据自动编码与识别方法,其特征在于,包括以下步骤:A1、获取计价清单数据,根据统一的标准清单编码规范对计价清单数据中的清单编码进行标准化处理,提取标准的分项编码,并过滤错误的清单编码;A2、将所述计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词;A3、将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库;A4、将所述计价清单数据中提取出的关键词在所述关键词规则库进行匹配分析,结合分项编码仲裁所述计价清单数据所属的类别,将其清单编码进一步识别为预设位数的标准清单编码;A5、基于识别出的预设位数的标准清单编码,识别所述计价清单数据所属的工程专业、分部工程以及分项工程;A6、基于识别出的预设位数的标准清单编码,对所述计价清单数据包含的人工、材料、机械设备的具体要求进行清单指引编码。
【技术特征摘要】
1.一种建设行业工程量计价清单数据自动编码与识别方法,其特征在于,包括以下步骤:A1、获取计价清单数据,根据统一的标准清单编码规范对计价清单数据中的清单编码进行标准化处理,提取标准的分项编码,并过滤错误的清单编码;A2、将所述计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词;A3、将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库;A4、将所述计价清单数据中提取出的关键词在所述关键词规则库进行匹配分析,结合分项编码仲裁所述计价清单数据所属的类别,将其清单编码进一步识别为预设位数的标准清单编码;A5、基于识别出的预设位数的标准清单编码,识别所述计价清单数据所属的工程专业、分部工程以及分项工程;A6、基于识别出的预设位数的标准清单编码,对所述计价清单数据包含的人工、材料、机械设备的具体要求进行清单指引编码。2.根据权利要求1所述的建设行业工程量计价清单数据自动编码与识别方法,其特征在于,所述步骤A1之前还包括:A0、将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码;所述标准清单编码包括四个层级,从主到次分别为:专业编码、分部编码、分项编码、清单编码,分别与计价清单数据所属的工程专业、分部工程以及分项工程、计价清单对应。3.根据权利要求2所述的建设行业工程量计价清单数据自动编码与识别方法,其特征在于,所述预设位数的标准清单编码为9位编码,该9位编码的前2位为专业编码,前4位为分部编码,前6位为分项编码,全部9位唯一对应一组计价清单编码。4.根据权利要求2所述的建设行业工程量计价清单数据自动编码与识别方法,其特征在于,所述步骤A3中预置关键词规则库的方法包括:A31、以计价清单数据对应规范化编码的方式形成数据训练集,对计价清单数据的清单名称和清单特征词汇进行分词处理,以获取关键词;A32、通过决策树算法将获取的关键词进行组合,结合分项编码,形成关键词规则库;A33、以加入新的数据训练集形成新的关键词组合,并通过机器学习方式完善关键词规则库,保证编码的准确性。5.根据权利要求4所述的建设行业工程量计价清单数据自动编码与识别方法,其特征在于,所述步骤A4包括:A41、...
【专利技术属性】
技术研发人员:陈林淇,罗杰锋,陈玉辉,陈文妮,胡焱,张涛,侯晓峰,陈红仙,詹宇清,陈汝炫,欧迅,陈文,
申请(专利权)人:广东中建普联科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。