一种工程造价定额智能匹配方法与系统技术方案

技术编号:36566334 阅读:17 留言:0更新日期:2023-02-04 17:22
本发明专利技术公开了一种工程造价定额智能匹配方法与系统。所述系统包括数据清洗模块、模型训练模块、定额匹配模块;所述数据清洗模块用于将清单标准库、定额标准库和未清洗的清单训练数据作为输入,执行数据清洗功能,得到规范干净的清单训练数据;所述模型训练模块用于将规范干净的清单训练数据,执行模型训练功能,得到定额智能匹配模型;所述定额匹配模块用于输入清单信息,经过定额智能匹配模型,得到匹配结果,以及匹配的可信度。本发明专利技术智能化自动化地实现定额的匹配过程,提高生产效率,降低人力消耗。人力消耗。人力消耗。

【技术实现步骤摘要】
一种工程造价定额智能匹配方法与系统


[0001]本专利技术涉及人工智能和自然语言处理领域,具体涉及一种工程造价定额智能匹配方法与系统。

技术介绍

[0002]在工程造价领域,由于历史原因,存在着清单计价和定额计价两种计价方法。为了顺利地完成工程造价,往往需要根据清单的信息套取相应的一个或多个定额。所谓清单,是指某个具体的建造对象,如楼梯、阳台、坡道等;所谓定额,是指为满足清单的建造而需要的标准化的原材料或工序,比如C20混凝土散水、回填砂石、挖淤泥等。
[0003]目前,套取定额的过程基本采用人工手动套用来实现。但是,一个工程往往有百余条清单,同时一个定额标准库往往有着几千个定额,即使是经验丰富的专家,也需要面临从几千个定额中进行选择的困境。因此,套定额的过程,不仅对套用人员的专业知识有很高的要求,而且费时费力费心。
[0004]自然语言处理,是人工智能领域的重要研究方向,它以人类语言和文本为研究对象,对人类语言和文本进行分析和处理。而清单和定额的信息正是以文本(中文、数字、符号等)的形式呈现的,因此,引入自然语言处理技术,智能化自动化地实现套取定额的过程是可以实现的。
[0005]综上所述,目前迫切需要在工程造价领域引入人工智能和自然语言处理技术,将清单套定额的过程由人工手动套用变为由AI算法自动化地匹配套用。

技术实现思路

[0006]专利技术目的:针对上述现有技术存在的问题和不足,本专利技术的目的是提供一种工程造价定额智能匹配方法与系统,智能化自动化地实现定额的匹配过程,提高生产效率,降低人力消耗。
[0007]技术方案:为实现上述专利技术目的,本专利技术提供一种工程造价定额智能匹配方法,包括以下步骤:
[0008](1)数据清洗:将清单标准库、定额标准库和未清洗的清单训练数据作为输入,执行数据清洗功能,对多个定额编号的连接进行拆分,能够对定额名称中的标记符进行去除,得到规范干净的清单训练数据;
[0009](2)模型训练:针对规范干净的清单训练数据,执行模型训练功能,得到定额智能匹配模型;
[0010](3)定额匹配:根据要匹配的清单所属的专业,定额智能匹配模型自动决定要使用哪个清单专业子模型进行匹配,同时置信子模型还可以给出匹配结果的可信度。
[0011]进一步地,步骤(1)所述数据清洗的过程中,针对由多个定额的编号连接构成的定额的编号,将该定额拆分成一个主定额和若干个从定额,从定额所属的定额标准库由主定额决定;
[0012]针对带有后缀的定额的编号,设置一组后缀标记符,若定额编号中出现了标记符,则将标记符及其之后的字符去掉;
[0013]针对所属定额标准库未知的定额,首先筛选出该定额可能属于的候选定额标准库,然后采用文本相似度的技术,决定该定额最终属于的定额标准库。
[0014]进一步地,步骤(2)所述模型训练得到定额智能匹配模型,由多个子模型组成,包括一个词表扩充子模型、一个Bert预训练子模型、若干个清单专业子模型和一个置信子模型;其中,清单专业子模型按照序列标注任务的形式进行训练,而输入文本序列则是由“匹配特殊字符”、“清单编号特殊字符”、“清单标准名称”、“清单修改名称”、“清单特征描述”拼接而成。
[0015]进一步地,步骤(3)所述定额匹配具体是:输入一条要匹配定额的清单,模型首先识别该清单所属的专业,然后模型使用对应的清单专业子模型进行定额匹配,同时置信子模型给出一个概率,这个概率代表着匹配结果的可信度。
[0016]本专利技术还提供一种工程造价定额智能匹配系统,所述系统包括数据清洗模块、模型训练模块、定额匹配模块;所述数据清洗模块用于将清单标准库、定额标准库和未清洗的清单训练数据作为输入,执行数据清洗功能,得到规范干净的清单训练数据;所述模型训练模块用于将规范干净的清单训练数据,执行模型训练功能,得到定额智能匹配模型;所述定额匹配模块用于输入清单信息,经过定额智能匹配模型,得到匹配结果,以及匹配的可信度。
[0017]有益效果:本专利技术所述算法与系统能够智能化自动化地实现定额的匹配过程。在本系统给出的匹配结果上再进行人为的审核和修改,与纯人工的方式相比,可以大幅度地提高生产效率,降低人力消耗。
附图说明
[0018]图1为本专利技术的总体流程示意图;
[0019]图2为未清洗的清单训练数据示例;
[0020]图3为清单标准库示例;
[0021]图4为定额标准库示例。
具体实施方式
[0022]下面结合附图和具体实施例,进一步阐明本专利技术,应理解这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围,在阅读了本专利技术之后,本领域技术人员对本专利技术的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
[0023]如图1所示,本专利技术提供一种工程造价定额智能匹配系统,所述系统包括数据清洗模块、模型训练模块、定额匹配模块;所述数据清洗模块用于将清单标准库、定额标准库和未清洗的清单训练数据作为输入,执行数据清洗功能,得到规范干净的清单训练数据;所述模型训练模块用于将规范干净的清单训练数据,执行模型训练功能,得到定额智能匹配模型;所述定额匹配模块用于输入清单信息,经过定额智能匹配模型,得到匹配结果,以及匹配的可信度。
[0024]本专利技术提供一种工程造价定额智能匹配方法,包括以下步骤:(1)数据清洗
[0025]如图2,一条训练清单一般有人工标注的一个或多个定额。在实际的业务场景中,定额主要存在以下三个方面的问题:1)定额编号由多个定额的编号连接构成,如图2中的“13

18ZFBS+13

19ZFBS*2”;2)定额编号带有后缀,如图2中的“13

15换”、“10

46换”、“13

18ZFBS”、“13

19ZFBS”;3)定额所属的定额标准库未知,如图2中DEKu的值为“null”。
[0026]针对以上存在的三个主要问题及其他的小问题,本专利技术的数据清洗算法如下:
[0027][0028][0029]如图1,获得规范干净的清单训练数据之后,就可以进行模型训练。本专利技术训练得
到的定额智能匹配模型由多个子模型组成,包括一个词表扩充子模型、一个Bert预训练子模型、若干个清单专业子模型和一个置信子模型。
[0030]首先,本专利技术将使用某个开源的Bert模型(比如哈工大讯飞联合实验室开源的BERT

wwm

ext),对其词表进行扩充。扩充的方法是统计清单标准库(如图3所示)有多少个清单,为每一个清单的编号生成一个特殊的字符,并将这些字符加入到词表里。因词表进行了扩充,需要同时对开源Bert的Embedding层进行相应的扩充。如此,词表和Embedding层进行了扩充的开源Bert模型,就是词表扩充子模型。
[0031]然后,依据清单标准库和定额标准库生成预训练数据,按照G本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种工程造价定额智能匹配方法,其特征在于,该方法包括以下步骤:(1)数据清洗:将清单标准库、定额标准库和未清洗的清单训练数据作为输入,执行数据清洗功能,对多个定额编号的连接进行拆分,能够对定额名称中的标记符进行去除,得到规范干净的清单训练数据;(2)模型训练:针对规范干净的清单训练数据,执行模型训练功能,得到定额智能匹配模型;(3)定额匹配:根据要匹配的清单所属的专业,定额智能匹配模型自动决定要使用哪个清单专业子模型进行匹配,同时置信子模型还可以给出匹配结果的可信度。2.根据权利要求1所述的一种工程造价定额智能匹配方法,其特征在于,步骤(1)所述数据清洗的过程中,针对由多个定额的编号连接构成的定额的编号,将该定额拆分成一个主定额和若干个从定额,从定额所属的定额标准库由主定额决定;针对带有后缀的定额的编号,设置一组后缀标记符,若定额编号中出现了标记符,则将标记符及其之后的字符去掉;针对所属定额标准库未知的定额,首先筛选出该定额可能属于的候选定额标准库,然后采用文本相似度的技术,决定该定额最终属于的定额标准库。3.根据权利要求1所述的一种工程造价定额智能匹配方法,其特征在于,步骤(2)所述模型训练得到定额智能匹配模型...

【专利技术属性】
技术研发人员:鲍春晓赵博张海军徐忠崔爱民黄宜华
申请(专利权)人:江苏皓盘云建网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1