基础设施模型的错误分类元素的自动标识制造技术

技术编号:37881155 阅读:12 留言:0更新日期:2023-06-15 21:09
在示例实施例中,提供了使用机器学习来自动标识基础设施模型的错误分类元素的技术。在第一组实施例中,监督机器学习用于训练使用描述元素的不同类型的数据的一个或多个分类模型(例如,使用几何数据的几何分类模型、使用文本数据的自然语言处理(NLP)分类模型、以及使用几何和文本数据的组合的全知(Omni)分类模型;或使用几何数据、文本数据以及几何和文本数据的组合的单个分类模型)。比较来自分类模型的预测(例如,来自几何分类模型、NLP分类模型和Omni分类模型的预测)以标识错误分类元素,或直接产生的错误分类元素的预测(例如,来自单个分类模型)。在第二组实施例中,无监督机器学习用于检测指示错误分类的描述元素的数据(例如,几何数据和文本数据)中的异常关联。标识的错误分类被显示给用户以供审核和修正。标识的错误分类被显示给用户以供审核和修正。标识的错误分类被显示给用户以供审核和修正。

【技术实现步骤摘要】
【国外来华专利技术】基础设施模型的错误分类元素的自动标识


[0001]本公开一般地涉及基础设施建模,并且更具体地涉及用于标识基础设施模型的错误分类元素的技术。

技术介绍

[0002]在基础设施(例如,建筑物、工厂、道路、铁路、桥梁、电气和通信网络、设备等)的设计、建造和/或运营中,创建基础设施模型通常是期望的。基础设施模型可以维护构建的基础设施模型(BIM)或基础设施的数字孪生(twin)。BIM是应构建基础设施时基础设施的数字表示,提供可视化和协作机制。数字孪生是实际构建基础设施时基础设施的数字表示,并且通常与表示当前状态、工作条件、位置或其他质量的信息同步。
[0003]通常需要对基础设施模型(例如,维护BIM或数字孪生)的个体元素进行分类,以便在模型上执行分析工具,例如,测量和提供仪表板(dashboard)以监视项目执行(例如,时间表、成本和安全合规性)以及设计改变的影响的分析工具。元素的分类标签可以指示该元素属于允许该元素与其他类似元素分组在一起的多个标准类别(例如,梁、墙、柱、窗、门、管道等)之一。没有分类标签,运行分析可能是不可能的。
[0004]基础设施模型(例如,维护BIM或数字孪生)可以通过联合来自分布式源的数据来构造。这些数据源可能包括不同量的分类信息,这些信息利用各种不同类型的命名法(nomenclature)。为分类信息和命名法建立标准通常是不切实际的,因此它们在源上都是一致的。即使建立了标准,如果不严格监视一致性,则组织或供应商也可能引入不合规的数据源。此外,即使可以通过完善的标准执行来克服这一挑战,有时分类信息也可能在联合数据时执行的变换和转换中丢失。
[0005]因此,一旦元素处于基础设施模型中,通常需要对其进行分类。这可以通过多种不同的方式来完成。有些技术主要是手动的。例如,用户可以手动添加或更新分类信息。然而,基础设施模型可能包含大量的个体元素。除了极其耗时之外,手动分类还可能容易出错。其他技术在很大程度上是自动化的。例如,机器学习可以训练将几何形状(geometry)映射到分类标签的几何分类模型,并且几何分类模型可以用于对基础设施模型的个体元素进行分类。然而,纯粹的几何分类有局限性,并且有时可能会返回错误的分类。
[0006]目前,很难标识基础设施模型的错误分类元素,因此可以修正分类信息。错误分类可以通过用户检查基础设施模型中的每个元素来手动标识。然而,由于这非常耗时,因此通常不切实际。一些错误分类可以通过简单的脚本或工具来标识,这些脚本或工具可能发现(spot)明显的错误。但是,这些简单的技术无法检测到许多类型的错误分类。结果,错误分类持续存在于基础设施模型中,降低了它们的可用性和可信度。
[0007]因此,需要一种技术来解决标识基础设施模型(例如,维护BIM或数字孪生)的错误分类元素的问题。

技术实现思路

[0008]在示例实施例中,提供了使用机器学习自动标识基础设施模型(例如,维护BIM或数字孪生)的错误分类元素的技术。在第一组实施例中,监督机器学习用于训练使用描述元素的不同类型的数据的一个或多个分类模型(例如,使用几何数据的几何分类模型、使用文本(textual)数据的自然语言处理(NLP)分类模型、以及使用几何和文本数据的组合的全知(omniscient)(Omni)分类模型;或使用几何数据、文本数据以及几何和文本数据的组合的单个分类模型)。比较来自分类模型的预测(例如,来自几何分类模型、NLP分类模型和Omni分类模型的预测)以标识错误分类元素,或直接产生的错误分类元素的预测(例如,来自单个分类模型)。在第二组实施例中,无监督机器学习用于检测指示错误分类的描述元素的数据(例如,几何数据和文本数据)中的异常关联。标识的错误分类被显示给用户以供审核(review)和修正。
[0009]在一个示例实施例中,错误分类标识服务的软件将机器学习训练的几何分类模型应用于基础设施模型的几何数据以预测基础设施模型的元素的分类标签,其中用于基础设施模型的元素中的每个元素的基于几何的预测表示为第一概率向量(vector)。该软件还将机器学习训练的NLP分类模型应用于基础设施模型的文本数据以预测基础设施模型的元素的分类标签,其中用于基础设施模型的每个元素的基于NLP的预测表示为第二概率向量。可选地,该软件还将机器学习训练的Omni分类模型应用于基础设施模型的几何和文本数据以预测基础设施模型的元素的分类标签,其中用于基础设施模型的每个元素的基于Omni的预测表示为第三概率向量。该软件针对基础设施模型的每个元素将第一概率向量与第二概率向量和可选的第三概率向量进行比较,以标识已经被错误分类的一个或多个元素,并在用户接口中显示基础设施模型的一个或多个错误分类元素的指示。
[0010]在另一个示例实施例中,错误分类标识服务的软件从基础设施模型的元素的三维(3D)网格(mesh)确定几何特征,从基础设施模型的元素的文本元数据的多个键(key)的子集中确定第一文本特征向量,并且可选地,从基础设施模型的元素的文本元数据的多个键中的每个确定第二文本特征向量。该软件将机器学习训练的单个分类模型应用于几何特征、第一文本特征向量和可选的第二文本特征向量,以预测已被错误分类的基础设施模型的一个或多个元素,并在用户接口中显示基础设施模型的一个或多个错误分类元素的指示。
[0011]在又一示例实施例中,错误分类标识服务的软件确定基础设施模型的元素的几何特征和/或基础设施模型的元素的文本元数据的键。该软件将无监督机器学习算法应用于元素的几何特征和/或元素的文本元数据的键以标识多个聚类(cluster),并确定偏离其相应聚类的一个或多个元素,以标识基础设施模型的一个或多个错误分类元素。可选地,该软件还将无监督机器学习算法应用于基础设施模型的元素的几何特征和/或基础设施模型的元素的文本元数据的键,以标识元素的无监督特征,将元素分组为一个或多个组,并将距其相应组中心大于预定距离的一个或多个元素标识为基础设施模型的一个或多个附加错误分类元素。然后,该软件在用户接口中显示基础设施模型的所有错误分类元素的指示。
[0012]在又一个示例实施例中,错误分类标识服务的软件将第一机器学习训练的分类模型应用于基础设施模型的几何数据以预测基础设施模型的元素的分类标签,并且将第二机器学习训练的分类模型应用到基础设施模型的文本数据以预测基础设施模型的元素的分
类标签。可选地,软件将第三机器学习训练的分类模型应用于基础设施模型的几何数据和文本数据以预测基础设施模型的元素的分类标签。该软件应用机器学习训练的错误分类模型来比较来自第一分类模型的预测分类标签和来自第二分类模型的预测分类标签,以及可选地来自第三分类模型的预测分类标签,并基于其中的不一致(disagreement)标识已经被错误分类的一个或多个元素,针对这些元素的指示显示在用户接口中。
[0013]应当理解,除了本
技术实现思路
中讨论的那些之外,还可以实现各种附加特征和替代实施例。本
技术实现思路
仅旨在作为对读者的简要介绍,并不表明或暗示本文提到的示例涵本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于使用机器学习自动标识基础设施模型的错误分类元素的方法,包括:通过在一个或多个计算设备上执行的软件将机器学习训练的几何分类模型应用于基础设施模型的几何数据以预测基础设施模型的元素的分类标签,其中针对基础设施模型的元素中的每个元素的基于几何的预测被表示为第一概率向量;通过所述软件将机器学习训练的自然语言处理(NLP)分类模型应用于基础设施模型的文本数据以预测基础设施模型的元素的分类标签,其中针对基础设施模型的每个元素的基于NLP的预测被表示为第二概率向量;针对基础设施模型的每个元素将第一概率向量与第二概率向量进行比较,以标识已经被错误分类的基础设施模型的一个或多个元素;以及在所述软件的用户接口中显示基础设施模型的一个或多个错误分类元素的指示。2.根据权利要求1所述的方法,其中,与几何分类模型一起使用的基础设施模型的几何数据是从针对基础设施模型的元素的清洁的三维网格获得的几何特征。3.根据权利要求1所述的方法,其中,与NLP分类模型一起使用的基础设施模型的文本数据包括从针对基础设施模型的元素的文本元数据的多个键的子集获得的文本特征向量。4.根据权利要求1所述的方法,还包括通过以下内容训练几何分类模型:获得包括其中每个都具有相关联的分类标签的分类元素的数据集并且生成包括分类元素的三维(3D)网格;通过清洁3D网格以将3D网格转换为流形3D网格来预处理3D网格;使用3D网格确定每个分类元素的几何特征;和将机器学习算法应用于数据集的分类元素的几何特征以产生训练的几何分类模型。5.根据权利要求1所述的方法,还包括通过以下内容训练NLP分类模型:获得包括其中每个都具有相关联的分类标签的分类元素的数据集并且针对分类元素提取文本元数据的多个键;通过联结词、标准化词表示和从元数据的多个键的选择子集降低维度来预处理文本元数据;和将来自元数据的键的选择的子集的联结的、标准化的和降低维度词编码为文本特征向量;将机器学习算法应用于来自数据集的分类元素的元数据的键的选择的子集的文本特征向量以产生训练的NLP分类模型。6.根据权利要求1所述的方法,还包括通过所述软件将机器学习训练的全知(Omni)分类模型应用于基础设施模型的几何和文本数据以预测基础设施模型的元素的分类标签,其中针对基础设施的每个元素的基于Omni的预测被表示为第三个概率向量,并且其中,比较针对基础设施模型的每个元素将第一概率向量与第二概率向量和第三概率进行比较以标识已经被错误分类的一个或多个元素。7.根据权利要求6所述的方法,其中,与Omni分类模型一起使用的基础结构模型的文本数据包括从元素的文本元数据的多个键中的每个获得的文本特征向量。8.根据权利要求6所述的方法,还包括通过以下内容训练Omni分类模型:获得包括其中每个都具有相关联的分类标签的分类元素的数据集,生成包括分类元素
的三维(3D)网格,并且针对分类元素提取文本元数据的多个键;通过清洁3D网格以将3D网格转换为流形3D网格来预处理3D网格并且通过联结词、标准化词表示和从元数据的多个键降低维度来预处理文本元数据;将机器学习算法应用于来自数据集的分类元素的元数据的多个键的几何特征和文本特征向量以产生训练的Omni分类模型。9.根据权利要求1所述的方法,其中,比较将训练的错误分类模型应用于至少第一概率向量和第二概率向量以标识已经被错误分类的一个或多个元素。10.根据权利要求1所述的方法,还包括:针对一个或多个错误分类元素中的每个确定错误分类的概率和正确分类的预测,其中,在用户接口中显示的指示包括错误分类的概率和正确分类的预测。11.根据权利要求1所述的方法,还包括使用加权数据集...

【专利技术属性】
技术研发人员:KA
申请(专利权)人:本特利系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1