通过原型网络和弱监督学习对基础设施模型中的要素进行分类并预测属性制造技术

技术编号:38971193 阅读:15 留言:0更新日期:2023-09-28 09:35
在示例性实施例中,软件服务可以采用神经网络来学习将要素特征变换成嵌入的非线性映射。神经网络可被训练成在多维嵌入空间中分配嵌入,使得嵌入之间的距离对于类别或种类分类或属性预测、手头的任务是有意义的。可以使用弱监督机器学习、使用弱标记的基础设施模型来训练神经网络。可用多组的嵌入来确定原型。基础设施模型的要素可以被分类成类别或种类,或者根据具体情况通过找到最接近的原型来预测它们的属性。它们的属性。它们的属性。

【技术实现步骤摘要】
【国外来华专利技术】通过原型网络和弱监督学习对基础设施模型中的要素进行分类并预测属性


[0001]本公开一般涉及基础设施建模,并且更具体讲,涉及用于将要素分类成类别或种类或者预测基础设施模型中要素的属性的改进技术。

技术介绍

[0003]在基础设施(例如,建筑物、工厂、道路、铁路、桥梁、电气和通信网络、设备等)的设计、构建和/或操作中,通常期望创建一些基础设施模型。基础设施模型可以保有基础设施的已建立的基础设施模型(BIM)或数字孪生。BIM是应被构建的基础设施的一种数字表示,其提供了一种用于可视化和协作的机制。数字孪生是实际构建的基础设施的一种数字表示,并且通常与表示当前状态、工作状况、位置或其它质量的信息同步。
[0004]通常需要将基础设施模型的各个要素(例如,保有BIM或数字孪生)分类成属于特定类别或种类,以便在模型上使用分析工具,例如,测量和提供仪表板以用于监视项目性能(例如,进度、成本和安全合规)和设计改变的影响的分析工具。一个要素的类别或种类可以指示该要素是分层排列要素的组的一部分。类别和种类的例子包括梁、墙、柱、支架、窗、门、管等。这样的类别和种类可以包括子类别和子种类(例如,用于不同类型的梁、墙、柱、支架、窗、门、管等)。类别和种类可以使相似的要素一起被分析。在没有将要素准确地分类成类别和种类能力的情况下,运行分析通常是极其困难的。
[0005]类似,通常还需要预测基础设施模型要素的属性(例如,保有BIM或数字孪生)以便在模型上使用分析工具。一个要素的属性可以指示该要素的材料(例如,木材、混凝土、钢等)、数值质量(例如,直径、长度、厚度等)或其他方面。属性(如由类别和种类强加的分层群组)可以使相似的要素被一起分析。在没有准确预测要素属性能力的情况下,运行分析也是极其困难的。
[0006]基础设施模型(例如,保有BIM或数字孪生)可以通过联合来自分布式源的数据来构建。这些数据源可以包括采用了各种不同类型命名的不同量的类别、种类和属性信息。建立命名标准通常是不切实际的,因此它在源处都是一致的。即使建立了标准,如果一致性没有得到严格监控,那么组织或供应商也可能会将不合规的数据源引入。此外,即使用心地实施了标准,但有时数据中仍然会出现错误。例如,由于人为错误,要素可能会被错误地分类,使得它与错误的类别或种类相关联,或者与不正确的属性值相关联。
[0007]因此,一旦要素被联合到基础设施模型中,通常需要将要素分类成类别和种类并预测属性,以校正错误分类并填充丢失的信息。这可以以多种不同的方式来完成。一些技术主要是手动的。例如,用户可以手动添加或更新类别、种类和属性信息。然而,基础设施模型会包括大量的要素。人工分类除了极其耗时之外,也可能是易于出错的。
[0008]其它技术很大程度上是自动化的。例如,可以使用机器学习。可以训练分类模型来将要素分类成类别和种类,并预测属性。然而,现有的机器学习技术具有一些缺点。通常,这种技术会依赖通过标记的数据集(即,其中每个类别、种类或属性的正确性是已知的并且是
已经表明的数据集)的监督学习。如果分类模型要预测错误分类或不正确属性,那么训练数据集就需要包括错误分类或不正确属性的标记示例。然而,通常难以获得大量错误分类或不正确属性的标记示例。在实际基础设施模型中,具有错误分类或不正确属性的要素通常仅代表所有要素的一个极小的部分,因为这样的模型可能已经被编策了多次。可以使用技术来人工生成错误分类或不正确属性。例如,可以通过随机交换两个不同要素的类别、种类或属性就可以创建出一种错误。然而,人工生成的数据集可能不能很好地表现在基础设施模型中自然发生的错误的类型,并且因此可能会在它们能够多好地训练分类模型方面受到限制。
[0009]因此,需要解决将要素分类成类别或种类或者预测基础设施模型中的要素属性问题的技术。

技术实现思路

[0010]在示例性实施例中,提供了在使用原型网络(或者称为“原型的”网络)和弱监督学习的基础设施模型中将要素分类成类别或种类或者预测要素属性的技术。软件服务可以采用神经网络来学习将要素特征变换成嵌入的非线性映射。神经网络可以被训练成在多维嵌入空间中分配嵌入,使得嵌入之间的距离对于类别或种类分类或属性预测、手头的任务是有意义的。可以使用弱监督机器学习、使用弱标记的基础设施模型来训练神经网络。可以使用组的嵌入来确定原型。原型可以简单地是组或组的子集的平均值,或者是组或组的子集的概率分布(例如,多变量高斯分布)。基础设施模型的要素可以被分类成类别或种类,或者根据具体情况通过找到最接近的原型来预测它们的属性。针对每个要素,可以计算属于与每个原型相对应的组的概率。可以将具有最高概率的组的类别、种类或属性分配给该要素。如果已经存在现有分类,那么就可以将该类别、种类或属性的概率与最高概率进行比较以确定该要素是否被错误分类了。
[0011]应当理解,除了在本
技术实现思路
中所讨论的那些之外,还可以实现各种附加特征和替代实施例。本
技术实现思路
仅旨在作为对读者的简要介绍,并且没有提示或暗示本文提及的示例覆盖本公开的所有方面,或者是本公开的必要或基本方面。
附图说明
[0012]以下描述参考了示例性实施例的附图,其中:
[0013]图1是可以实现本文描述的技术的一个示例性软件架构的至少一部分的高级框图;
[0014]图2是可以使用弱监督机器学习来训练以在多维嵌入空间中分配嵌入的一个示例性神经网络(“嵌入网络”)的图;
[0015]图3是用于使用弱监督学习训练诸如图2所示的神经网络(“嵌入网络”)以及用于产生原型的一个示例性步骤序列的流程图;
[0016]图4是用于推断的一个示例性步骤序列的流程图,该推断可以将基础设施模型中的要素分类成类别或种类,或者视情况而定使用原型来预测属性;
[0017]图5A

5E是示出在一个简单基础设施模型上的操作的一个示例的图;
[0018]图6是用于基于嵌入提供基础设施模型的可视化的一个示例性步骤序列的流程
图;
[0019]图7是可以为一个特定示例性基础设施模型产生的一个示例性基于嵌入的可视化;以及
[0020]图8是用于相似要素搜索功能的一个示例性步骤序列的流程图。
具体实施方式
[0021]图1是可以实现本文描述的技术的一个示例性软件架构的至少一部分的高级框图。该架构可以被划分为在本地布置的一个或多个计算设备(统称为“客户端设备”)上执行的客户端侧软件110,以及在通过因特网可访问的一个或多个远程计算设备(“云计算设备”)上执行的基于云的服务软件112。每个计算设备可以包括处理器、存储器/存储装置、显示屏和用于执行软件、存储数据和/或显示信息的其他硬件(未示出)。客户端侧软件110可以包括由用户操作的客户端软件应用(或简称为“客户端”)120。客户端120可以是各种类型的,包括可以直接在客户端设备的操作系统下操作的桌面客户端和在web浏览器内操作的基于web的客户端应用。客户端120可以主要涉及提供允许用户创建、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于使用机器学习对基础设施模型中的要素进行分类或预测要素的属性的方法,包括:由在一个或多个计算设备上执行的软件来确定所述基础设施模型的要素的特征;由所述软件将非线性特征嵌入映射应用在所确定的特征上以产生所述要素的嵌入,所述非线性特征嵌入映射由神经网络学习,所述嵌入是使数据点围绕多维嵌入空间中的原型聚类的数值表示,原型是所述多维嵌入空间中的组的单个表示;基于要素的嵌入与多个组中的每个组的原型之间在多维空间中的距离来计算属于与不同种类别、种类或属性相关联的要素的多个组中的每个组的概率;由所述软件提供输出,所述输出基于属于所述多个组中的每个组的概率来指示预测的类别、种类或属性,所述输出被显示在显示屏上、被存储到存储器或被发送到所述一个或多个计算设备的其他软件中。2.根据权利要求1所述的方法,其中,所述输出包括所述要素被错误分类的指示,以及基于属于所述多个组中的一个或多个其他组的概率对不同类别、种类或属性的一个或多个进行重新分类的建议。3.根据权利要求1所述的方法,其中,所述输出包括所述要素丢失的类别、种类或属性的指示,以及基于属于所述多个组中的一个或多个其它组的概率对所述丢失的类别、种类或属性的建议。4.根据权利要求1所述的方法,其中,所述输出包括基于嵌入的可视化,其中,所述要素的嵌入和所述多个组的其他要素的嵌入被绘制成多维空间中的点。5.根据权利要求4所述的方法,其中,所述提供还包括:减少所述嵌入的维度以产生一组表示要素的点;选择所述点的视觉特征到要素的多方面映射;以及通过所述软件用所选择的视觉特征绘制所述一组点以产生所述基于嵌入的可视化。6.根据权利要求4所述的方法,其中,所述视觉特征包括颜色,并且所述基于嵌入的可视化将类别、种类或属性映射到颜色,使得具有共同的类别、种类或属性的点共享共同的颜色。7.根据权利要求1所述的方法,其中,所确定的特征在k维空间中表示,并且所述多维嵌入空间是n维空间,其中,n不同于k。8.根据权利要求7所述的方法,其中,所述输出包括基于嵌入的可视化,其中,所述要素的嵌入和所述多个组的其他要素的嵌入被绘制成x维空间中的点,并且x<n。9.根据权利要求1所述的方法,还包括通过以下步骤来训练所述神经网络:由所述软件从训练基础设施模型的一个或多个组采样训练要素以产生所述训练要素的特征的训练集;通过所述软件提供所述训练要素的特征的训练集作为对所述神经网络的输入,对于所述一个或多个组中的每一个,计算原型,以及基于嵌入和一个或多个组中的每个组的原型之间在多维空间中的距离来计算嵌入属于每个组的概率,以及根据属于每个组的概率来确定预测的组,以及基于所述预测的组和真实组的比较来确定丢失,所述丢失用于向所述神经网络提供反
馈;以及在多个训练步骤的过程中重复所述采样、提供、计算、运算和确定以训练所述神经网络。10.根据权利要求9所述的方法,其中,所述神经网络经由弱监督机器学习来学习,并且所述训练基础设施模型是弱标记的基础设施模型。11.根据权利要求9所述的方法,其中,所述训练基础设施模型是包括多个基础设施模型的数据集...

【专利技术属性】
技术研发人员:LP
申请(专利权)人:本特利系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1