建设行业工程量计价清单数据自动编码与识别方法及系统技术方案

技术编号:15792626 阅读:53 留言:0更新日期:2017-07-10 01:23
本发明专利技术涉及一种建设行业工程量计价清单数据自动编码与识别方法及系统,其能够将人类自然语言描述的计价清单数据进行智能识别、统一标准编码及自动归集,经过处理后的计价清单数据将具有唯一对应的编码,可实现智能识别、转换、分析、归类、统计等功能的自动化,无需人工操作,有助于提高工作效率,降低企业成本,更快推进建设工程项目的投资分析以及全过程造价管理。

【技术实现步骤摘要】
建设行业工程量计价清单数据自动编码与识别方法及系统
本专利技术属于建设行业工程数据分析领域,具体涉及一种建设行业工程量计价清单数据自动编码与识别方法及系统。
技术介绍
在建设行业,各个企业要实现建设工程项目的全过程管理,需要对海量的工程项目数据(例如工程量计价清单数据)进行对比、分析、预警、总结等等。各省份所采用的清单计价规范偏差较大,或者采用不同版本的清单计价规范,编码不统一,工程项目数据难以在计算机系统中统一识别和调用,通常只能靠人工经验进行判断,效率低、成本高,准确性差。导致在建设工程项目全过程管理中无法准确有效的进行成本管控和预警。
技术实现思路
本专利技术针对现有技术中计价清单数据难以识别、分析所导致的效率低以及成本高等问题,提出一种建设行业工程量计价清单数据自动编码与识别方法,同时相应提出一种建设行业工程量计价清单数据自动编码与识别系统的结构方案。本专利技术提出的一种建设行业工程量计价清单数据自动编码与识别方法,主要包括以下步骤A1至步骤A6:A1、获取计价清单数据,根据统一的标准清单编码规范对所述计价清单数据中的清单编码进行标准化处理,提取标准的分项编码,并过滤错误的清单编码;A2、将所述计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词;A3、将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库;A4、将所述计价清单数据中提取出的关键词在所述关键词规则库进行匹配分析,结合分项编码仲裁所述计价清单数据所属的类别,将其清单编码进一步识别为预设位数的标准清单编码;A5、基于识别出的预设位数的标准清单编码,识别所述计价清单数据所属的工程专业、分部工程以及分项工程;A6、基于识别出的预设位数的标准清单编码,对所述计价清单数据包含的人工、材料、机械设备的具体要求进行清单指引编码。本专利技术的一优选方案中,所述步骤A1之前还包括:A0、将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码;所述标准清单编码包括四个层级,从主到次分别为:专业编码、分部编码、分项编码、清单编码,分别与计价清单数据所属的工程专业、分部工程以及分项工程、计价清单对应。本专利技术的一优选方案中,所述预设位数的标准清单编码为9位编码,该9位编码的前2位为专业编码,前4位为分部编码,前6位为分项编码,全部9位唯一对应一组计价清单编码。当然,标准清单编码及各层级的位数可根据具体情况设置。本专利技术的一优选方案中,所述步骤A3中预置关键词规则库的方法包括:A31、以计价清单数据对应规范化编码的方式形成数据训练集,对计价清单数据的清单名称和清单特征词汇进行分词处理,以获取关键词;A32、通过决策树算法将获取的关键词进行组合,结合分项编码,形成关键词规则库;A33、以加入新的数据训练集形成新的关键词组合,并通过机器学习方式完善关键词规则库,保证编码的准确性。本专利技术的一优选方案中,所述步骤A4包括:A41、若匹配到的关键词组合在关键词规则库中只对应一个标准清单编码,则直接获取该标准清单编码;若匹配到的关键词组合对应多个标准清单编码,则加上标准的分项编码进行仲裁得到唯一的标准清单编码;A42、若匹配到的关键词组合在规则库中无对应的标准清单编码,则先对该关键词组合进行降维算法重新提取关键词组合,并将该关键词组合重新执行步骤A41进行匹配分析,根据最高匹配度确定唯一的标准清单编码。本专利技术的一可选方案中,所述各地清单计价规范包括各省份的清单计价规范,所述各版本的清单计价规范包括《GB50500-2008建设工程工程量清单计价规范》,所述标准清单计价规范为《GB50500-2013建设工程工程量清单计价规范》。本专利技术相应提出的一种建设行业工程量计价清单数据自动编码与识别系统的结构方案,主要包括规范化模块、分词模块、维护及完善模块、匹配分析模块、存储模块以及指引编码模块;所述规范化模块,用于获取计价清单数据,根据统一的标准清单编码对其清单编码进行规范化处理,从中提取标准的分项编码,并过滤错误的清单编码;所述分词模块,用于将计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词;所述维护及完善模块,用于将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库;所述匹配分析模块,用于将计价清单数据中提取出的关键词在关键词规则库进行匹配分析,结合分项编码仲裁计价清单数据所属的类别,将其清单编码进一步识别为预设位数的标准清单编码,以及进一步识别计价清单数据所属的工程专业、分部工程以及分项工程;所述存储模块,用于将识别出所属的工程专业、分部工程以及分项工程的计价清单数据分为工程专业、分部工程、分项工程以及计价清单四个层级进行存储;所述指引编码模块,用于基于识别出的预设位数的标准清单编码,对计价清单数据包含的人工、材料、机械设备的具体要求进行清单指引编码。本专利技术的一优选方案中,还包括统一编码模块,所述统一编码模块用于将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码。本专利技术至少具备以下有益效果:1、经过处理后的各计价清单数据将具有唯一对应的编码,可实现智能识别、转换、分析、归类、统计等功能的自动化,无需人工操作,有助于提高工作效率,降低企业成本,更快推进建设工程项目的投资分析以及全过程造价管理。2、能够智能识别计价清单数据的专业、分部工程、分项工程、计价清单等数据,形成以计价清单为基础的清单指引,并可进行人工、材料、机械设备的定额及价格匹配,以便于计价清单数据的进一步应用及管理。3、优选方案中,将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码,方便对计价清单数据进行识别、转换、分析、归类、统计等应用及管理。附图说明图1是实施例一涉及的一种建设行业工程量计价清单数据自动编码与识别方法整体流程示意图。图2是实施例二涉及的一种建设行业工程量计价清单数据自动编码与识别系统结构框图。具体实施方式为了便于本领域技术人员理解,下面将结合附图以及实施例对本专利技术进行进一步描述。实施例一请参阅图1,本实施例涉及的一种建设行业工程量计价清单数据自动编码与识别方法,包括以下步骤S100至步骤S700:S100、将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码。步骤S100主要是形成新的统一标准清单编码,其中各地清单计价规范可包括各省份的清单计价规范,各版本的清单计价规范的其中之一可包括《GB50500-2008建设工程工程量清单计价规范》(以下简称为2008清单计价规范),所述标准清单计价规范为《GB50500-2013建设工程工程量清单计价规范》(以下简称为2013清单计价规范)。当然,随着清单计价规范的不断推陈出新,不限于以上2008清单计价规范及2013清单计价规范两个版本。步骤S100中通过将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行比对,形成一一对应关系,不同的清单名称根据所在分项工本文档来自技高网...
建设行业工程量计价清单数据自动编码与识别方法及系统

【技术保护点】
一种建设行业工程量计价清单数据自动编码与识别方法,其特征在于,包括以下步骤:A1、获取计价清单数据,根据统一的标准清单编码规范对计价清单数据中的清单编码进行标准化处理,提取标准的分项编码,并过滤错误的清单编码;A2、将所述计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词;A3、将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库;A4、将所述计价清单数据中提取出的关键词在所述关键词规则库进行匹配分析,结合分项编码仲裁所述计价清单数据所属的类别,将其清单编码进一步识别为预设位数的标准清单编码;A5、基于识别出的预设位数的标准清单编码,识别所述计价清单数据所属的工程专业、分部工程以及分项工程;A6、基于识别出的预设位数的标准清单编码,对所述计价清单数据包含的人工、材料、机械设备的具体要求进行清单指引编码。

【技术特征摘要】
1.一种建设行业工程量计价清单数据自动编码与识别方法,其特征在于,包括以下步骤:A1、获取计价清单数据,根据统一的标准清单编码规范对计价清单数据中的清单编码进行标准化处理,提取标准的分项编码,并过滤错误的清单编码;A2、将所述计价清单数据中由自然语言描述的清单名称、清单特征词汇进行分词处理,并提取关键词;A3、将提取的关键词通过决策树算法自动生成关键词组合,结合分项编码,形成关键词规则数据,并运用机器学习方式维护及完善预置的关键词规则库;A4、将所述计价清单数据中提取出的关键词在所述关键词规则库进行匹配分析,结合分项编码仲裁所述计价清单数据所属的类别,将其清单编码进一步识别为预设位数的标准清单编码;A5、基于识别出的预设位数的标准清单编码,识别所述计价清单数据所属的工程专业、分部工程以及分项工程;A6、基于识别出的预设位数的标准清单编码,对所述计价清单数据包含的人工、材料、机械设备的具体要求进行清单指引编码。2.根据权利要求1所述的建设行业工程量计价清单数据自动编码与识别方法,其特征在于,所述步骤A1之前还包括:A0、将各地及各版本的清单计价规范中的编码与标准清单计价规范中的编码进行一一对应,形成统一的标准清单编码;所述标准清单编码包括四个层级,从主到次分别为:专业编码、分部编码、分项编码、清单编码,分别与计价清单数据所属的工程专业、分部工程以及分项工程、计价清单对应。3.根据权利要求2所述的建设行业工程量计价清单数据自动编码与识别方法,其特征在于,所述预设位数的标准清单编码为9位编码,该9位编码的前2位为专业编码,前4位为分部编码,前6位为分项编码,全部9位唯一对应一组计价清单编码。4.根据权利要求2所述的建设行业工程量计价清单数据自动编码与识别方法,其特征在于,所述步骤A3中预置关键词规则库的方法包括:A31、以计价清单数据对应规范化编码的方式形成数据训练集,对计价清单数据的清单名称和清单特征词汇进行分词处理,以获取关键词;A32、通过决策树算法将获取的关键词进行组合,结合分项编码,形成关键词规则库;A33、以加入新的数据训练集形成新的关键词组合,并通过机器学习方式完善关键词规则库,保证编码的准确性。5.根据权利要求4所述的建设行业工程量计价清单数据自动编码与识别方法,其特征在于,所述步骤A4包括:A41、...

【专利技术属性】
技术研发人员:陈林淇罗杰锋陈玉辉陈文妮胡焱张涛侯晓峰陈红仙詹宇清陈汝炫欧迅陈文
申请(专利权)人:广东中建普联科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1