利用逐像素分类器来对2D平面图进行语义分割制造技术

技术编号:21716381 阅读:58 留言:0更新日期:2019-07-27 19:46
本发明专利技术特别涉及一种用于确定函数的计算机实现的方法,该函数被配置为确定表示建筑的布局的2D平面图的语义分割。该方法包括提供包括2D平面图的数据集,每个2D平面图与相应的语义分割相关联。该方法还包括基于数据集来学习函数。这种方法提供了用于处理2D平面图的改进的解决方案。

Semantic Segmentation of 2D Planar Maps Using Pixel-by-Pixel Classifier

【技术实现步骤摘要】
利用逐像素分类器来对2D平面图进行语义分割
本专利技术涉及计算机程序和系统领域,并且更具体地涉及用于处理表示建筑的布局的二维(2D)平面图的方法、系统和程序。
技术介绍
市场上提供了许多用于对象设计、工程和制造的系统和程序。CAD是计算机辅助设计的首字母缩写,例如它涉及用于设计对象的软件解决方案。CAE是计算机辅助工程的首字母缩写,例如,它涉及用于模拟未来产品的物理行为的软件解决方案。CAM是用于计算机辅助制造的首字母缩写,例如,它涉及用于定义制造过程和操作的软件解决方案。在这种计算机辅助设计系统中,图形用户界面在技术效率方面起着重要作用。这些技术可以嵌入在产品生命周期管理(PLM)系统中。PLM指的是一种业务战略,它可以帮助公司分享产品数据,应用通用流程,并利用企业知识从概念到生命结束,在扩展企业的概念上开发产品。DassaultSystèmes(商标为CATIA、ENOVIA和DELMIA)提供的PLM解决方案提供了组织产品工程知识的工程中心、管理制造工程知识的制造中心以及实现企业集成和连接到工程中心和制造中心的企业中心。所有这些系统一起交付了一个开放对象模型,将产品、流程和资源联系起来,以实现动态的、基于知识的产品创建和决策支持,其推动优化的产品定义、制造准备、生产和服务。在该上下文和其他上下文中,提供2D平面图的计算机化处理可能是有用的。研究人员和CAD开发人员一直在尝试自动化和加速将2D结构平面图像转换为三维(3D)建筑模型。在下面列出的论文[1]和[2]以及其中引用的参考文献中可以找到几种现有技术方法。用于将2D平面图转换成3D模型的一个阶段可以是识别平面图符号,其可以在一个图案与另一个图案之间极其不同。为此,大多数方法依赖于图像处理和模式识别技术,并且因此缺乏通用性。模式识别器通常被约束为有限的一组预定义符号。下面列出的论文[3]是这种方法的示例。通常,提出的流水线包括第一预处理2D图,例如在下面列出的论文[5]和[6]中所建议的。为此,图像处理和文本处理方法都用于将图形与文本内容分开。然后,通过去除可能导致错误的扰乱性元件(例如,楼梯、陈设元件)来进一步清洁图像。在此过程结束时,目的是在剩余的线中选择代表墙壁的线。为此,必须选择接近标准壁厚的值。然而,取决于构造域和设计者,存在不同的厚度。然后识别室外墙壁和开口。模式识别方法通常用于确定开口类型。例如,在论文[3]建议的方法中,在每个开口周围搜索“弧形”图案-如果找到该图案然后将其设置为门类型,或者在相反的情况下设置为窗户类型。最后,识别出室内墙壁和开口。除了模式识别技术之外,一些著作还使用了学习方法,特别是用于墙壁检测(例如,如文献[6]中所建议的基于墙贴片的对象分割)。似乎很清楚,对于这样的流水线,错误和不一致性自然地从一个步骤累积到另一个步骤,这将导致无效的系统。这就是为什么一些著作试图让用户参与识别过程的原因,例如在开始时修复原始文件中的一些问题,例如下面列出的论文[4]中建议的,或者在一些步骤之后通过例如向用户建议用于修正的多种方法,如论文[5]中建议的。然而,值得一提的是,论文[5]中的统计数据表明,对于大多数测试平面图,需要大约15个用户干预,并且对于某些平面图,需要进行40多次干预。一些用户干预导致昂贵且非常长的过程(非实时)。论文[7]公开了一种使用墙壁分割、对象检测和光学字符识别来分析平面图像的方法。该方法包括解析平面图(部分3),包括使用具有相应的训练的完全卷积网络技术的墙分割和并涉及二元分类,然后使用具有另一种训练的另一种并且不同的卷积网络技术来进行对象(例如门)检测。在此上下文中,仍然需要用于处理2D平面图的改进的解决方案。上面引用的学术论文清单:[1]XuetaoY.etal.,Generating3DBuildingModelsfromArchitecturalDrawings:ASurveyIEEEComputerGraphicsandApplications,2009[2]Gimenez,L.etal..,Review:reconstructionof3dbuildinginformationmodelsfrom2dscannedplans.JournalofBuildingEngineering,pp.24–35,2015.[3]GimenezL.etal.Reconstructionof3Dbuildingmodelsfrom2Dscannedplans-openingthepathforenhanceddecisionsupportinrenovationdesignECPPM2014[4]DominguezB.etal.SemiautomaticdetectionoffloortopologyfromCADarchitecturaldrawingsComputer-AidedDesign,2012[5]GimenezL.etal.Anovelapproachto2Ddrawings-basedreconstructionof3Dbuildingdigitalmodels,Buildinginformationmodeling(BIM)indesignconstructionandoperations,vol149,2015[6]Heras,L.-P.delasetal.WallPatch-BasedSegmentationinArchitecturalFloorplans,ICDAR-2011[7]Dodge,S.etal.Parsingfloorplanimages,FifteenthIAPRInternationConferenceonMachineVisionApplications(MVA),NagoyaUniversity,Nagoya,Japan,May8-12,2017
技术实现思路
因此,提供了一种用于确定函数的计算机实现的方法,该函数被配置为确定表示建筑的布局的2D平面图的语义分割。该方法包括提供包括2D平面图的数据集,每个2D平面图与相应的语义分割相关联。该方法还包括基于数据集来学习函数。在示例中,该函数可以具有神经网络。神经网络呈现卷积编码器-解码器架构。神经网络还包括关于一组类的逐像素分类器。该组类包括墙壁类、门类和窗户类中的至少两个类。神经网络可以包括权重,并且学习可以包括利用优化算法根据数据集和损失函数更新权重。在示例中,优化算法是随机梯度下降。在示例中,损失函数是交叉熵损失函数。对于每个输入的2D平面图,逐像素分类器可以输出用于推断输入的2D平面图的语义分割蒙板(mask)的相应数据。语义分割蒙板是关于该组类的2D平面图的逐像素分类。对于数据集的每个2D平面图,损失函数可以惩罚关于与数据集中的2D平面图相关联的相应语义分割的语义分割蒙板错误的推断。在示例中,惩罚更重要,因为错误很高(推断的语义分割蒙板错误与同数据集中的2D平面图相关联的相应语义分割之间的错误)。可选地,逐像素分类器可以针对输入的2D平面图的每个像素输出用于推断该组类的一类的相应数据。对于数据集的每个2D平面图的每个像素,损失函数可以惩罚与通过与数据集中的2D平面图相关联的相应语义分割针对所述像本文档来自技高网
...

【技术保护点】
1.一种用于确定函数的计算机实现的方法,所述函数被配置为确定表示建筑的布局的2D平面图的语义分割,所述函数具有呈现卷积编码器‑解码器结构的神经网络,所述神经网络包括关于一组类的逐像素分类器,所述一组类包括墙壁类、门类和窗户类中的至少两个类,所述方法包括:提供包括2D平面图的数据集,所述2D平面图中的每个与相应的语义分割相关联;以及基于所述数据集来学习所述函数。

【技术特征摘要】
2017.12.28 EP 17306967.51.一种用于确定函数的计算机实现的方法,所述函数被配置为确定表示建筑的布局的2D平面图的语义分割,所述函数具有呈现卷积编码器-解码器结构的神经网络,所述神经网络包括关于一组类的逐像素分类器,所述一组类包括墙壁类、门类和窗户类中的至少两个类,所述方法包括:提供包括2D平面图的数据集,所述2D平面图中的每个与相应的语义分割相关联;以及基于所述数据集来学习所述函数。2.如权利要求1所述的方法,其中,所述函数呈现高于0.85的平均准确度和/或高于0.75的平均交除并。3.如权利要求1或2所述的方法,其中,所述神经网络包括权重,并且所述学习包括利用优化算法,根据所述数据集和损失函数来更新所述权重。4.如权利要求3所述的方法,其中,所述优化算法是随机梯度下降。5.如权利要求4所述的方法,其中,所述损失函数是交叉熵损失函数。6.如权利要求3、4或5所述的方法,其中,针对每个输入的2D平面图,所述逐像素分类器输出用于推断所述输入的2D平面图的语义分割蒙板的相应数据,所述语义分割蒙板是关于所述一组类的对所述2D平面图的逐像素分类,针对所述数据集的每个2D平面图,损失函数惩罚关于与所述数据集中的2D平面图相关联的相应语义分割的语义分割蒙板错误的推断。7.如权利要求6所述的方法,其中,针对输入的2D平面图的每个像素,所述逐像素分类器输出用于推断所述一组类的一类的相应数据,针对所述数据集的每个2D平面图的每个像素,所述损失函数惩罚与通过与所述数据集中的2D平面图相关联的相应语义分割针对所述像素提供的类不同的相应类...

【专利技术属性】
技术研发人员:A·雷耶步斯夫L·杜邦德迪内尚M·布尔克纳福德
申请(专利权)人:达索系统公司
类型:发明
国别省市:法国,FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1