当前位置: 首页 > 专利查询>清华大学专利>正文

基于深度学习和形态学的建筑PDF图纸墙体识别装置和方法制造方法及图纸

技术编号:26035389 阅读:38 留言:0更新日期:2020-10-23 21:13
本发明专利技术公开了一种基于深度学习和图像形态学的建筑PDF图纸墙体的识别装置,包括:PDF图纸转换模块,图纸墙体预识别模块,图纸信息过滤模块,图纸墙体精确识别模,PDF图纸转换模块为墙体预识别模型提供符合格式的数据源;图纸墙体预识别模块用于实现墙体预识别功能,图纸墙体预识别模块以PDF图纸转换模块输出的图纸分割块为输入,获得图纸墙体位置分布概率图;图纸信息过滤模块实现了原图纸中噪声信息过滤,为图纸墙体精确识别进行数据准备,图纸墙体精确识别模块以初步噪声过滤后的图纸为输入,实现图纸中墙体位置的精确识别。该建筑PDF图纸墙体识别装置,打通了图像类图纸与结构化电子图纸之间的数据壁垒,为后续的众多BIM应用提供了数据基础。

【技术实现步骤摘要】
基于深度学习和形态学的建筑PDF图纸墙体识别装置和方法
本专利技术涉及非结构化图纸数据信息提取,应用于图纸自动审查、图纸重构等领域,尤其涉及一种基于深度学习和形态学的建筑PDF图纸墙体识别装置和方法。
技术介绍
建筑图纸是建筑建造施工过程中的重要指导依据,其中包含了建筑的结构设计、管线布局信息、消防系统部署等众多来自不同建筑领域的建筑信息。大型建筑图纸的单层导出图像分辨率通常在20K*20K左右,其中包括轴网、辅助线、实心墙体、空心墙体、标签、引线以及门窗等建筑领域相关构件。在以AutoCAD为代表的图纸绘制软件出现前,早期建筑图纸绘制工作往往通过手工完成,近些年来,随着CAD技术的普遍应用,电子制图已经逐渐替代了传统的纸质绘图,并积累了大量的图纸数据。BIM(BuildingInformationModeling),建筑信息建模是一种实现建筑信息集成的技术。建筑信息建模技术可以整合建筑在多个维度、多个领域的信息,并应用在建筑的设计、施工、运行、维护等多个生命周期。在与BIM数据有关的应用研究中,图纸自动识别技术一直是研究的重点,也是从图纸数据过渡到BIM数据应用的基础。图纸中的待识别对象可分为聚合类对象与非聚合类对象,聚合类对象包括门、烟感报警器、消防栓等符号类对象。这类对象的构成基本元素会聚集地出现在图纸中一个较小的范围内,聚合类对象包围盒内的无关信息量极少,可以用包围盒近似表达聚合类对象的空间位置信息。非聚合类对象包括墙体、管线等对象,这类对象无法采用包围盒描述位置信息。在非聚合类对象中,墙体识别是建筑的空间结构布局表示的关键,也是图纸自动识别中的难点,图纸内墙体对象的自动识别对建筑图纸的规范审查具有重大意义。然而,目前大量存在的PDF、JPG等格式的电子图纸均属于图像类非结构化数据,其中对象的基本组成元素为点、直线、弧线等基本几何元素的像素表示,目前尚没有针对此类大型建筑图纸墙体识别的有效方法。首先,墙体的尺度与原图纸的尺度比例波动幅度较大,导致一般的目标检测方法难以用于墙体识别。其次,墙体的结构往往不固定,且规模可变范围较大,难以准确描述。在实际图纸中,表示墙体的线条在纹理层次上与图纸背景相似度较高,难以通过纹理特征区分。在图纸墙体识别任务上,传统的图像形态学方法与基于深度学习的识别模型在建筑户型图墙体识别上都取得了不错的效果,但是两者都难以拓展到内容更加复杂的建筑图纸上,主要原因有以下几点:(1)组成墙体对象的基本元素在图纸内的空间跨度过大。墙体对象在特定方向上与整张图纸的尺度比例在1:100与1:2之间。过大的尺度占比与剧烈的尺度抖动导致一般的目标检测方法在墙体检测任务上失效。(2)墙体对象的结构不固定。墙体对象的结构、规模变化范围较大,难以精确描述。(3)非聚合类对象与图纸的背景相似度高。墙体与图纸的轴网、辅助线等背景信息的边界并不清晰,需要借助更高层次的语义信息进行区分。(4)基于形态学的户型图墙体识别方法主要作用于内容较单一、信息密度较低的户型图图纸。建筑图纸中的信息密度远高于户型图,过多的噪声叠加使分辨能力较弱的形态学方法失效。(5)基于深度学习的户型图墙体识别方法通过先识别墙体结构连接点再规划重构的方式实现户型图内的墙体识别工作,而建筑图纸的分辨率远高于户型图图纸,这导致深度模型无法直接处理整张图纸,这会导致墙体结构关键点识别模型的准确率大幅降低,进而影响后续的识别流程。
技术实现思路
为了解决上述技术问题,本专利技术将基于深度学习的墙体识别模型与基于图像形态学的墙体识别算法相结合,提出一种针对大型复杂建筑PDF图纸的墙体识别方法,并基于此方法实现一种图纸墙体自动识别装置。本专利技术提供了一种基于深度学习和图像形态学的建筑PDF图纸墙体的识别装置,包括:PDF图纸转换模块,图纸墙体预识别模块,图纸信息过滤模块,图纸墙体精确识别模,其特征在于:PDF图纸转换模块为墙体预识别模型提供符合格式的数据源;图纸墙体预识别模块用于实现墙体预识别功能,图纸墙体预识别模块以PDF图纸转换模块输出的图纸分割块为输入,获得图纸墙体位置分布概率图;图纸信息过滤模块实现了原图纸中噪声信息过滤,为图纸墙体精确识别进行数据准备,其中噪声信息定义为图纸中非墙体结构内的像素信息;图纸信息过滤模块对原图纸中的前景信息进行提取,以图纸墙体位置分布概率图为指导生成信息屏蔽掩码,依照信息屏蔽掩码对原图纸中提取到的前景信息进行过滤,得到初步噪声过滤结果;图纸墙体精确识别模块以初步噪声过滤后的图纸为输入,实现图纸中墙体位置的精确识别。进一步地,PDF图纸转换模块按照给定的分辨率,将待识别PDF图纸转换为高清像素图纸,保留图纸中的细节信息;将高清图纸图像转化为二值图,对二值图进行中心内容提取,得到图纸主体部分。进一步地,图纸墙体预识别模块以图像分割模型为基础,结合关键点识别技术中以热力图为训练目标的监督方法,得到墙体预识别模型;在训练过程中对输入数据与目标数据进行双边抖动,提高墙体预识别模型对于墙体边界处的敏感度;在使用过程中对于图纸分割块的每一张输入图像,给出其中墙体位置分布分的概率图,墙体位置分布概率图为与输入图像等大的单通道图像,其中每一个元素的值表示原图纸中对应位置像素属于墙体结构的概率;将多个图纸分割块的处理结果进行拼接,得到整张图纸的墙体位置分布概率图。进一步地,图纸墙体精确识别模块能够实现墙体闭合,将图纸中具有多种表示方式的墙体全部转化为实心墙体,通过估算图纸中全部墙体的平均宽度得到腐蚀运算迭代次数,并取墙体宽度上限记为I进行运算,得到墙体闭合结果,I为迭代次数;图纸墙体精确识别模块能够实现过腐蚀还原,在墙体闭合的同时,腐蚀预算导致墙体体积向四周扩张,因此以I为迭代次数进行膨胀运算,抵消墙体扩张的副作用;图纸墙体精确识别模块能够实现游离线过滤,在经历以上操作后没有形成闭合的线条即为游离线,游离线不属于墙体的一部分,因此通过迭代次数为I的膨胀运算对此类信息进行消去;图纸墙体精确识别模块能够实现过膨胀还原,膨胀运算在消除游离线的同时削减了墙体厚度,因此通过I次腐蚀运算抵消膨胀运算副作用。本专利技术还提供了一种基于深度学习和图像形态学的建筑PDF图纸墙体的识别装置的识别方法,具体包括以下步骤:步骤1、用户在前端界面上传待识别PDF图纸或PDF图纸导出的JPG、PNG格式图纸,并开始墙体识别流程;步骤2、PDF图纸转换模块开启图纸预处理任务,将输入数据转化为图像类数据,若输入数据为PDF图纸,则对图纸进行PDF到JPG图像转换;步骤3、图纸墙体预识别模块对输入图纸进行二值化转,以确保输入数据的数值准确性;步骤4、图纸墙体预识别模块对二值化图像进行中心裁剪,过滤图像外围的无信息背景部分,以减轻后续模型的计算量;步骤5、图纸墙体预识别模块按照冗余切割方式对输入图纸进行图像分割,得到包含一部分图纸语义信息的多张待处本文档来自技高网
...

【技术保护点】
1.一种基于深度学习和图像形态学的建筑PDF图纸墙体的识别装置,包括:PDF图纸转换模块,图纸墙体预识别模块,图纸信息过滤模块,图纸墙体精确识别模,其特征在于:/nPDF图纸转换模块为墙体预识别模型提供符合格式的数据源;/n图纸墙体预识别模块用于实现墙体预识别功能,图纸墙体预识别模块以PDF图纸转换模块输出的图纸分割块为输入,获得图纸墙体位置分布概率图;/n图纸信息过滤模块实现了原图纸中噪声信息过滤,为图纸墙体精确识别进行数据准备,其中噪声信息定义为图纸中非墙体结构内的像素信息;/n图纸信息过滤模块对原图纸中的前景信息进行提取,以图纸墙体位置分布概率图为指导生成信息屏蔽掩码,依照信息屏蔽掩码对原图纸中提取到的前景信息进行过滤,得到初步噪声过滤结果;/n图纸墙体精确识别模块以初步噪声过滤后的图纸为输入,实现图纸中墙体位置的精确识别。/n

【技术特征摘要】
1.一种基于深度学习和图像形态学的建筑PDF图纸墙体的识别装置,包括:PDF图纸转换模块,图纸墙体预识别模块,图纸信息过滤模块,图纸墙体精确识别模,其特征在于:
PDF图纸转换模块为墙体预识别模型提供符合格式的数据源;
图纸墙体预识别模块用于实现墙体预识别功能,图纸墙体预识别模块以PDF图纸转换模块输出的图纸分割块为输入,获得图纸墙体位置分布概率图;
图纸信息过滤模块实现了原图纸中噪声信息过滤,为图纸墙体精确识别进行数据准备,其中噪声信息定义为图纸中非墙体结构内的像素信息;
图纸信息过滤模块对原图纸中的前景信息进行提取,以图纸墙体位置分布概率图为指导生成信息屏蔽掩码,依照信息屏蔽掩码对原图纸中提取到的前景信息进行过滤,得到初步噪声过滤结果;
图纸墙体精确识别模块以初步噪声过滤后的图纸为输入,实现图纸中墙体位置的精确识别。


2.根据权利要求1所述的基于深度学习和图像形态学的建筑PDF图纸墙体的识别装置,其特征在于:
PDF图纸转换模块按照给定的分辨率,将待识别PDF图纸转换为高清像素图纸,保留图纸中的细节信息;将高清图纸图像转化为二值图,对二值图进行中心内容提取,得到图纸主体部分。


3.根据权利要求1所述的基于深度学习和图像形态学的建筑PDF图纸墙体的识别装置,其特征在于:
图纸墙体预识别模块以图像分割模型为基础,结合关键点识别技术中以热力图为训练目标的监督方法,得到墙体预识别模型;
在训练过程中对输入数据与目标数据进行双边抖动,提高墙体预识别模型对于墙体边界处的敏感度;在使用过程中对于图纸分割块的每一张输入图像,给出其中墙体位置分布分的概率图,墙体位置分布概率图为与输入图像等大的单通道图像,其中每一个元素的值表示原图纸中对应位置像素属于墙体结构的概率;将多个图纸分割块的处理结果进行拼接,得到整张图纸的墙体位置分布概率图。


4.根据权利要求1所述的基于深度学习和图像形态学的建筑PDF图纸墙体的识别装置,其特征在于:图纸墙体精确识别模块能够实现墙体闭合,将图纸中具有多种表示方式的墙体全部转化为实心墙体,通过估算图纸中全部墙体的平均宽度得到腐蚀运算迭代次数,并取墙体宽度上限记为I进行运算,得到墙体闭合结果,I为迭代次数;
图纸墙体精确识别模块能够实现过腐蚀还原,在墙体闭合...

【专利技术属性】
技术研发人员:张荷花
申请(专利权)人:清华大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1