工程做法的智能解析方法、装置、设备和可读存储介质制造方法及图纸

技术编号:37999865 阅读:11 留言:0更新日期:2023-06-30 10:13
本发明专利技术公开了一种工程做法的智能解析方法、装置、设备和可读存储介质,该方法包括:获取原始工程做法文本,确定原始工程做法文本包含的分隔符,通过分隔符将原始工程做法文本划分为多个单行做法文本;将单行做法文本输入至训练完成的文本分类模型中进行识别,获得每个单行做法文本对应的做法类型;提取做法类型为构造做法的单行做法文本,利用预设词库对提取的单行做法文本进行词性匹配,得到该单行做法文本对应的目标特征词,其中,预设词库包含多个特征词组合,目标特征词是特征词组合中的一个或多个;依据做法类型和目标特征词对原始工程做法文本进行格式转换,生成结构化的工程做法文本。法文本。法文本。

【技术实现步骤摘要】
工程做法的智能解析方法、装置、设备和可读存储介质


[0001]本专利技术涉及计算机辅助设计
,具体涉及一种工程做法的智能解析方法、装置、设备和可读存储介质。

技术介绍

[0002]随着BIM技术的发展和普及,越来越多的工程项目以三维模型作为交付物以用于下游的施工、算量、运维等多个环节。三维模型不仅应包含墙梁板柱等构件信息,同时亦应体现墙面、楼地面、顶棚、踢脚、屋面等部位的材料、厚度、工艺等做法信息,以用于施工阶段的工艺控制及建筑项目过程中准确算取装饰装修材料用量和成本控制。当前,地方标准图集针对不同项目的常见工程做法进行了定义和说明;各级设计院、甲方一般基于国标图集或地标进行调整,形成自己的构造做法库;这些做法库通常以Word、Excel或者Dwg等二维形式进行呈现和储备。在BIM施工图设计中,需要从已有的做法库信息提取相关特征并进行解析,最终输入三维设计软件中,以形成材料名称、厚度、功能等结构化信息表达。
[0003]现有的有关工程做法的软件产品中,对于工程做法的解析录入多基于特定的文件模板进行,即仅针对特定文件形式、特定书写形式的工程做法进行解析,而特定文件形式为Excel,特定书写形式是标准字体样式以及做法项目的标准规范文本内容。然而,该方式存在以下缺陷:其一,智能解析仅仅支持对特定文件格式、特定书写方式的文本信息进行解析,解析的局限性较大,容错性较低,不能满足多类文件的多种书写方式的解析需要;其二,对已有做法文本信息的解析通过简单规则进行定义,难以涵盖书写不规范等多种复杂场景,由此造成解析的准确率较低,适用性不高;其三,对已有做法文本信息的解析目前仅仅支持对材料名称和厚度信息的解析,不能通过材料名称识别其功能信息,解析完成之后仍需用户逐条手动添加功能信息。
[0004]针对现有技术中基于特定模板解析工程做法方式解析结果准确率低的技术问题,目前未存在有效的解决办法。

技术实现思路

[0005]本专利技术的目的在于提供了一种工程做法的智能解析方法、装置、设备和可读存储介质,能够解决基于特定模板解析工程做法方式解析结果准确率低的技术问题。
[0006]本专利技术的一个方面提供了一种工程做法的智能解析方法,该方法包括:获取原始工程做法文本,确定原始工程做法文本包含的分隔符,通过分隔符将原始工程做法文本划分为多个单行做法文本;将单行做法文本输入至训练完成的文本分类模型中进行识别,获得每个单行做法文本对应的做法类型;提取做法类型为构造做法的单行做法文本,利用预设词库对提取的单行做法文本进行词性匹配,得到该单行做法文本对应的目标特征词,其中,预设词库包含多个特征词组合,目标特征词是特征词组合中的一个或多个;依据做法类型和目标特征词对原始工程做法文本进行格式转换,生成结构化的工程做法文本。
[0007]可选地,利用预设词库对提取的单行做法文本进行词性匹配,得到该单行做法文
本对应的目标特征词,包括:将单行做法文本与预设词库的每个特征词组合进行匹配,判断特征词组合是否包含于单行做法文本中;针对全部包含于单行做法文本的特征词组合,统计预设词库中该特征词组合的数量,通过该特征词组合的数量和/或包含的特征词确定单行做法文本对应的目标词特征;针对部分/不包含于单行做法文本的特征词组合,通过特征词组合与单行做法文本的特征词相似度确定单行做法文本对应的目标词特征。
[0008]可选地,通过该特征词组合的数量确定单行做法文本对应的目标词特征,包括:判断该特征词组合数量是否超过第一预设阈值;若该特征词组合数量未超过第一预设阈值,将该特征词组合包含的特征词作为单行做法文本的目标词特征;若该特征词组合数量超过第一预设阈值,确定每一特征词组合的特征词字段数量,将特征词数量最多的特征词组合作为单行做法文本的目标词特征。
[0009]可选地,通过该特征词组合包含的特征词确定单行做法文本对应的目标词特征,包括:将全部包含于单行做法文本的特征词组合定义为待分类特征词组合集;确定待分类特征词组合集内特征词数量最多的特征词组合,并分别判断待分类特征词组合集内其他的任一特征词组合是否全部包含于特征词组合;若是,将待分类特征词组合集内其他的对应特征词组合和特征词组合划分为一组,并将待分类特征词组合集内剩余的特征词组合分别划分为一组,得到多个特征词组合小组;检索每一特征词组合小组中特征词数量最多的特征词组合,并对多个特征词组合小组检索到的特征词组合进行汇总,确定汇总结果为单行做法文本的目标词特征。
[0010]可选地,依据做法类型和目标特征词对原始工程做法文本进行格式转换,生成结构化的工程做法文本,包括:通过做法类型对原始工程做法文本进行区域分隔,获得多个做法文本段,其中,每个做法文本段包含做法类型和做法内容;针对做法类型为构造做法的做法内容,重点标示与目标特征词完全相同的原始工程做法文本对应位置内容;和/或,将与目标特征词内容相似度高于第二预设阈值的原始工程做法文本对应位置内容替换为目标特征词,并对目标特征词进行重点标示。
[0011]可选地,文本分类模型是通过如下方式训练的:获取批量历史工程做法文本,对历史工程做法文本进行数据清洗和分行处理,得到每个历史工程做法文本对应的多个单行历史做法文本;对单行历史做法文本进行做法类型标记,并将标记后的单行历史做法文本作为训练集,其中,做法类型包括做法名称、做法编号、构造做法和其他类型;将训练集输入至初始深度学习模型进行训练,直到模型的loss值趋向于收敛时,停止训练模型,获得文本分类模型。
[0012]可选地,在生成结构化的工程做法文本之后,方法还包括:若预设词库中不存在与单行做法文本相匹配的特征词组合,将单行做法文本存储至预设词库中,以实现对预设词库的更新。
[0013]本专利技术的另一个方面提供了一种工程做法的智能解析装置,该装置包括:获取模块,用于获取原始工程做法文本,确定原始工程做法文本包含的分隔符,通过分隔符将原始工程做法文本划分为多个单行做法文本;识别模块,用于将单行做法文本输入至训练完成的文本分类模型中进行识别,获得每个单行做法文本对应的做法类型;匹配模块,用于提取做法类型为构造做法的单行做法文本,利用预设词库对提取的单行做法文本进行词性匹配,得到该单行做法文本对应的目标特征词,其中,预设词库包含多个特征词组合,目标特
征词是特征词组合中的一个或多个;生成模块,用于依据做法类型和目标特征词对原始工程做法文本进行格式转换,生成结构化的工程做法文本。
[0014]本专利技术的再一个方面提供了一种计算机设备,该计算机设备包括:存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,处理器执行计算机程序时实现上述任一实施例的工程做法的智能解析方法。
[0015]本专利技术的又一个方面提供了一种计算机存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例的工程做法的智能解析方法。进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种工程做法的智能解析方法,其特征在于,所述方法包括:获取原始工程做法文本,确定所述原始工程做法文本包含的分隔符,通过所述分隔符将所述原始工程做法文本划分为多个单行做法文本;将所述单行做法文本输入至训练完成的文本分类模型中进行识别,获得每个单行做法文本对应的做法类型;提取所述做法类型为构造做法的单行做法文本,利用预设词库对提取的单行做法文本进行词性匹配,得到该单行做法文本对应的目标特征词,其中,所述预设词库包含多个特征词组合,所述目标特征词是所述特征词组合中的一个或多个;依据所述做法类型和所述目标特征词对所述原始工程做法文本进行格式转换,生成结构化的工程做法文本。2.根据权利要求1所述的方法,其特征在于,所述特征词组合包括一个或多个特征词,所述利用预设词库对提取的单行做法文本进行词性匹配,得到该单行做法文本对应的目标特征词,包括:将所述单行做法文本与所述预设词库的每个所述特征词组合进行匹配,判断所述特征词组合是否包含于所述单行做法文本中;针对全部包含于所述单行做法文本的特征词组合,统计所述预设词库中该特征词组合的数量,通过该特征词组合的数量和/或包含的特征词确定所述单行做法文本对应的目标词特征;针对部分/不包含于所述单行做法文本的特征词组合,通过所述特征词组合与所述单行做法文本的特征词相似度确定所述单行做法文本对应的目标词特征。3.根据权利要求2所述的方法,其特征在于,通过该特征词组合的数量确定所述单行做法文本对应的目标词特征,包括:判断该特征词组合数量是否超过第一预设阈值;若该特征词组合数量未超过第一预设阈值,将该特征词组合包含的特征词作为所述单行做法文本的目标词特征;若该特征词组合数量超过第一预设阈值,确定每一特征词组合的特征词字段数量,将所述特征词数量最多的特征词组合作为所述单行做法文本的目标词特征。4.根据权利要求2所述的方法,其特征在于,通过该特征词组合包含的特征词确定所述单行做法文本对应的目标词特征,包括:将全部包含于所述单行做法文本的特征词组合定义为待分类特征词组合集;确定所述待分类特征词组合集内特征词数量最多的特征词组合,并分别判断所述待分类特征词组合集内其他的任一特征词组合是否全部包含于所述特征词组合;若是,将所述待分类特征词组合集内其他的对应特征词组合和所述特征词组合划分为一组,并将所述待分类特征词组合集内剩余的特征词组合分别划分为一组,得到多个特征词组合小组;检索每一所述特征词组合小组中特征词数量最多的特征词组合,并对多个特征词组合小组检索到的特征词组合进行汇总,确定汇总结果为所述单行做法文本的目标词特征。5....

【专利技术属性】
技术研发人员:张尧磊邵太华毕松松方乐航郭军卓越蒋轶民范华玉
申请(专利权)人:广联达科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1