System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及工程施工图像处理,尤其是一种基于图像检测的工程图纸属性参数匹配方法,尤其是基于深度神经网络的目标检测方法、基于深度神经网络的文本图像识别方法、基于数字图像处理的几何基元匹配方法和基于机器学习的分类方法。
技术介绍
1、在传统的工程施工中,设计人员基于计算机辅助设计技术(cad)完成工程图纸的创建,此时图纸的存在形态为纸质或数字图像格式的计算机数据。而近年来随着建筑信息模型(bim)在国内建筑项目上的推广,在更多的情况下,工程项目依赖于bim系统使设计团队、施工单位、设施运营等各方人员协同进行工作。然而目前行业内将工程设计图纸与bim系统相互关联的方式仍为基于人工的手动bim建模。这种工作量大重复性高的繁琐工序大幅耗费了项目管理的人力成本和资金成本,阻碍了基建行业的信息化发展。
2、另一方面,随着基于深度学习的计算机视觉技术的跃进,目前人工智能在计算机视觉领域中可处理的特定问题种类更为泛化、内容更为细化。从图像分类、检测、分割等基础任务,到视觉推理、信息抽取等复杂任务,研究方法逐层推进。在这样的双重背景下,从应用的角度出发,基于计算机视觉的工程图纸的识别实则能够对智能化工程建模提供较大帮助,因此具有重要的研究意义和可观的发展前景。
3、通常情况下,一个完整的建筑工程包含数百张的工程图纸,并将整体的建筑结构以构件为单位进行拆分,以便在图纸上更详细地进行描述;而为了反映构件的正确形状和尺寸,每一个单独的构件在工程图纸上又以多个视角的平面图形的形式被呈现。而另一边,在bim系统中,一般根据实际工程需
4、由此,当前存在于工程图纸识别任务中的一个主要目标以及亟待解决的技术问题为:对图纸中的不同种类的构件视图进行识别,并与bim系统中相应的构件建模模板进行对应,从而从中提取必要的参数信息。
技术实现思路
1、本专利技术的目的是根据上述现有技术的不足,提供了一种基于图像检测的工程图纸属性参数匹配方法,利用了工程图纸中的文本语义和结构特征、特殊符号形状特征、基元间结构特征和构件结构特征,通过对一系列特征的学习和处理,能够在基于一定数量标注数据的训练下,对特定工程图纸中的构件族进行属性参数的自动提取,并且可进一步将提取得到的参数导入bim系统后,能准确地建模得到相应的模型。
2、本专利技术目的实现由以下技术方案完成:
3、步骤 1:获得大量的工程图纸数据。
4、步骤 2:对原始工程图纸数据进行批量预处理,将其转换为数字图像格式,并对其中的构件视图进行裁剪。
5、步骤 3:对处理后的工程图纸图像进行人工数据标注,人工标注的内容包括图像中的文本信息、符号信息和线段对应的属性类别信息。
6、步骤 4:以部分人工标注的工程图纸图像为基础,使用类图纸图像生成算法进行大量的类图纸数据生成,在类图纸图像中,包含了与真实工程图纸图像中相似的文本内容、线段内容和符号内容,且自动获取其标注;但类图纸图像不包含真实图纸图像中的结构特征等信息。
7、步骤 5:构建文本图像检测网络,使用步骤4中生成的类图纸数据作为数据集,对网络进行训练至其损失函数达到收敛,由此得到在工程图纸数据上表现较好的文本检查模型。
8、步骤 6:对类图纸数据根据文本范围进行裁剪,将得到的裁剪后图像,即文本实例图像,制作为文本识别算法的数据集。
9、步骤 7:构建文本图像识别网络,使用步骤6的数据集对其训练至收敛,由此得到在工程图纸数据上表现较好的文本识别模型。
10、步骤 8:构建目标检测网络,使用步骤4中生成的类图纸数据作为数据集,对网络进行训练至其损失函数达到收敛,由此得到在工程图纸数据上表现较好的符号检测模型。
11、步骤 9:由步骤3得到的图纸数据集,其中包含了大量的属性类别信息,这些属性类别信息的具体类别与其所在的构件视图相关。针对每一个不同种类的构件视图,构建一个基于xgboost的分类模型,对这些属性参数进行分类。选取属性参数所具备的多个特征进行训练,得到在各自属性参数范围内分类效果较好的多个属性参数分类模型。
12、步骤 10:对待预测的工程图纸图像进行数据预处理,将其转换为数字图像格式,并对其中的构件视图进行裁剪。
13、步骤 11:将裁剪得到的构件视图输入文本检测模型中,得到图像中全部文本框的位置。
14、步骤 12:根据步骤11预测得到的文本框,对构件视图图像进行进一步裁剪,得到文本实例图像。
15、步骤 13:将文本实例图像输入文本识别模型中,得到文本识别的结果。保存文本框坐标和文本识别结果。
16、步骤 14:将步骤10得到的结果输入目标检测模型中,得到图像中全部符号的位置。
17、步骤 15:对步骤10得到的构件视图进行水平和垂直方向上的直线检测,得到全部水平/垂直的直线坐标。
18、步骤 16:由步骤14得到的符号检测结果,对由步骤15得到的直线进行裁剪,将其裁剪为与图像中属性参数标尺等长的线段。
19、步骤 17:将步骤16得到的线段使用融合特征匹配法,与步骤13中的文本结果进行匹配,得到完整的标尺参数数据。
20、步骤 18:根据不同的构件视图分类,将标尺参数数据输入对应的属性参数分类模型中进行分类。模型根据其特征,输出标尺参数分类结果。
21、本专利技术的优点是:能够准确有效地检测出图像中存在的全部文本内容,为其下游任务提供支撑;能够准确有效地对文本内容进行识别,用以作为最终属性参数数值结果的取值依据;能够准确有效地检测出图像中存在的指定符号,从而对线条进行分割;能够充分地检测出图像中水平和垂直的标尺线条,在经过后处理后,能唯一地确定标尺线条的直线坐标,结合该线条坐标和符号检测结果,能够准确有效地获取工程图纸视图中全部的标尺线段;能够准确有效地将标尺线段与数值尺寸进行匹配,得到构件视图的标尺参数;能够准确有效地预测出标尺参数对应的属性,由此可得出工程图纸构件视图中全部所需的属性参数的尺寸数值。
22、能够完整有效地从工程图纸中对特定的构件进行属性参数数值提取,以辅助bim系统自动进行建模。
23、实施方式
24、以下通过实施例对本专利技术特征及其它相关特征作进一步详细说明,以便于同行业技术人员的理解:
25、实施例:本实施例中的基于图像检测的工程图纸属性参数匹配方法,将从工程图纸图像的输入,到其中构件视图的具体属性参数匹配结果的输出的处理过程视为一个完整的任务。在本实施例进行说明时,将完整的任务进行拆分,分为多个子任务,并按照其流程顺序逐一说明。
26、本实施例中的方法包括如下步骤:
27、1)对原始工程图纸数据进行预处理,将其转换为数字图像格式,并对其中的构件视图进行裁剪。
28、2)任务的输入为裁剪后的构件视本文档来自技高网...
【技术保护点】
1.一种基于图像检测的工程图纸属性参数匹配方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种基于图像检测的工程图纸属性参数匹配方法,其特征在于:所述文本检测识别和所述符号检测识别分别通过建立检测识别模型实现,所述检测识别模型通过类图纸图像数据进行训练和调优。
3.根据权利要求1所述的一种基于图像检测的工程图纸属性参数匹配方法,其特征在于:在所述直线检测时,比较图像中包括水平直线和垂直直线在内的全部直线的坐标信息,将被重复检测到的线条进行去重并将属于同一直线的全部直线检测结果进行合并,得到全部水平直线和垂直直线的坐标。
4.根据权利要求1所述的一种基于图像检测的工程图纸属性参数匹配方法,其特征在于:使用所述符号检测识别的检测结果,对直线进行裁剪,将其裁剪为与图像中标尺线条等长的线段,记为所述标尺线段。
5.根据权利要求1所述的一种基于图像检测的工程图纸属性参数匹配方法,其特征在于:对所述标尺参数的特征进行提取和处理,并使用提取后的特征训练所述属性参数分类模型;使用模型对标尺参数进行分类,并为每一个属性类别获取对应标尺参数的
6.根据权利要求1所述的一种基于图像检测的工程图纸属性参数匹配方法,其特征在于:所述工程图纸的预处理指的是,将其转换为数字图像格式并对其中的构件视图进行以仅包含一个构件为要求进行裁剪。
...【技术特征摘要】
1.一种基于图像检测的工程图纸属性参数匹配方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种基于图像检测的工程图纸属性参数匹配方法,其特征在于:所述文本检测识别和所述符号检测识别分别通过建立检测识别模型实现,所述检测识别模型通过类图纸图像数据进行训练和调优。
3.根据权利要求1所述的一种基于图像检测的工程图纸属性参数匹配方法,其特征在于:在所述直线检测时,比较图像中包括水平直线和垂直直线在内的全部直线的坐标信息,将被重复检测到的线条进行去重并将属于同一直线的全部直线检测结果进行合并,得到全部水平直线和垂直直线的坐标。
4.根据权利要求1所述的一种...
【专利技术属性】
技术研发人员:冯江宇,李斌,蒋孝云,薛向阳,徐国栋,曲绍博,谢钦方,唐宏华,朱克宏,聂磊,金鑫,
申请(专利权)人:中铁二十四局集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。