预测管道泄漏的新型自动人工智能系统技术方案

技术编号:22392527 阅读:38 留言:0更新日期:2019-10-29 07:59
本公开的实施例针对管道泄漏预测系统,该管道泄漏预测系统被配置为预测管道(例如,携带诸如水之类的某种物质的公用设施管道)是否可能泄漏。管道泄漏预测系统可以包括基于一种或多种机器学习技术的一个或多个预测模型,并且可以使用各种管道的特点数据来训练预测模型,以便确定与无泄漏的管道相关联的模式和与有泄漏的管道相关联的模式。预测模型可以被验证、被用于构造混淆矩阵、以及被用于生成与用于进行预测的决定因素变量相关联的见解和推论。预测模型能够应用于各种管道的数据,以便预测这些管道中的哪些管道将泄漏。

A new automatic artificial intelligence system for predicting pipeline leakage

【技术实现步骤摘要】
【国外来华专利技术】预测管道泄漏的新型自动人工智能系统相关申请的交叉引用本申请要求标题为“ANOVELAUTONOMOUSARTIFICIALLYINTELLIGENTSYSTEMTOPREDICTPIPELEAKS”的于2017年4月13日提交的美国临时申请62/485,314和于2017年11月21日提交的美国非临时申请15/820,316的权益和优先权,并且出于所有目的,每个申请通过引用全文并入本文。
技术介绍
公用事业公司常常使用管道来输送和递送公用设施(例如,用于递送水的管道)。但是,随着时间的推移,这些管道可能由于各种原因而发生故障并开始发生泄漏。出于多种原因,这些泄漏对公用事业公司来说非常昂贵。公用事业公司可能必须承担泄漏的损失(例如,从管道泄漏的水的成本)或与泄漏相关联的任何损坏(例如,由水引起的溢流)。由于某些管道不易接近(例如,埋在地下),因此还存在与识别和修复泄漏相关联的成本,并且在一些情况下,泄漏可能不会立即显现。管道泄漏造成总水管破裂和落水洞(sinkholes),这除了对环境和公共健康造成危害,还对周围企业造成经济损失、纳税人的钱的浪费、交通延误和机会成本。为了修复泄漏的管道,公用设施必须将水重新路由到其它管道。这对那些管道施加大量附加的应力,这可以导致在非常大的地理区域和远离原始管道泄漏的地方发生管道泄漏的连锁反应。此外,由于能够预测某个管道是否会泄漏,公用事业公司可以为未来的管道设计和实施新的施工招标合同的制造商采购标准,以降低泄漏的可能性。这些公用事业公司将极大地受益于能够预先预测哪些管道将泄漏,因为这将允许公司将其资源用于在这些泄漏发生之前停止这些泄漏。但是,在实践中,这可能很难做到。在不同的情况下,管道具有变化的维度和材料,并且它们也在各种地点并以各种方式安装。换句话说,可以有许多因素决定具体管道是否会泄漏。因此,需要可靠、准确的管道泄漏预测系统,该管道泄漏预测系统可以考虑影响管道泄漏的众多因素。本公开的实施例针对解决至少这些需求。
技术实现思路
本公开中描述的实施例针对管道泄漏预测系统,该管道泄漏预测系统被配置为预测管道(例如,携带诸如水之类的某种物质的公用设施管道)是否可能泄漏。管道泄漏预测系统可以包括基于一种或多种机器学习技术的预测模型。例如,可以使用监督机器学习方法生成预测模型(诸如随机森林模型),用于将输出分类为类别(例如,泄漏或无泄漏)。可以使用训练数据集中包含的管道数据来训练预测模型,该训练数据集可以包含关于各种管道的特点的信息(例如,这些管道的维度、这些管道的材料、这些管道的年龄、这些管道的地点等),以及关于这些管道是否泄漏的知识。预测模型可以使用训练数据集中的数据以便确定与无泄漏的管道相关联的模式以及与有泄漏的管道相关联的模式。这些模式可以应用于任何管道的特点,以便预测该管道是否会泄漏。在一些实施例中,一旦已经生成了预测模型,就可以通过将管道泄漏预测与这些管道中的哪些管道实际泄漏的知识进行比较来针对验证数据集验证该预测模型。之后,可以基于这些结果生成混淆矩阵,并且可以对其进行解释以获得关于该预测模型的有价值的见解(insight)。一旦已经验证了预测模型,就可以将预测模型应用于任何管道,以便预测该管道是否会泄漏。任何被识别为有可能泄漏的管道都可以被指派进行进一步调查,以进行潜在的维修或预防性维护。在一些实施例中,公开了一种用于预测管道泄漏的计算系统和/或计算机实现的方法。例如,该方法可以包括访问训练数据集,该训练数据集包括与第一多个管道中的相应管道相关联的第一数据项和已知泄漏,其中第一数据项包括相应管道的特点。可以将监督机器学习技术应用于这个训练数据集以生成预测模型,该预测模型被配置为通过基于与第一多个管道中的相应管道相关联的第一数据项训练预测模型来确定管道的泄漏预测。一旦已经生成了预测模型,该方法就还可以包括访问验证数据集,该验证数据集包括与第二多个管道中的相应管道相关联的第二数据项和已知泄漏,其中第二数据项包括相应管道的特点。使用验证数据集,可以通过将预测模型应用于第二数据项来确定第二多个管道中的管道的泄漏预测集合来验证预测模型。可以将第二多个管道中的管道的泄漏预测与第二多个管道中的管道的已知泄漏进行比较,以确定第二多个管道中的管道的泄漏预测的准确度。之后,可以基于第二多个管道中的管道的泄漏预测的准确度来生成混淆矩阵。根据混淆矩阵,可以确定与第二多个管道中的管道的泄漏预测的准确度相关联的真阳性率和真阴性率。一旦确定预测模型有效(例如,确定真阳性率高于第一阈值并且确定真阴性率高于第二阈值),该方法就还可以包括访问管线数据集,该管线数据集包括与第三多个管道相关联的第三数据项。可以将经验证的预测模型应用于这个管线数据集,以确定第三多个管道中的相应管道的泄漏预测。附图说明图1图示了根据本公开实施例的管道泄漏预测的系统图。图2图示了根据本公开实施例的管道泄漏预测的流程图。图3图示了根据本公开实施例的与各种管道相关联的示例数据。图4图示了根据本公开实施例的管道数据库中的示例数量的管道记录。图5图示了根据本公开实施例的随机森林模型的混淆矩阵。图6图示了根据本公的实施例的随机森林模型的变量重要性图。图7图示了根据本公开实施例的逻辑回归的概率的统计分布。图8图示了根据本公开实施例的逻辑回归的混淆矩阵。图9图示了根据本公开实施例的逻辑回归的系数的列表。图10图示了根据本公开实施例的朴素贝叶斯模型(Bayesmodel)的混淆矩阵。图11图示了根据本公开实施例的用于实现管道泄漏预测的框图。图12图示了根据本公开实施例的用于管道泄漏预测的混合系统图。图13描绘了用于实现实施例之一的分布式系统的简化图。图14是根据本公开实施例的系统环境的组件的简化框图,通过该系统环境,可以将由实施例系统的组件提供的服务作为云服务供应。图15图示了示例性计算机系统,其中可以实现本专利技术的各种实施例。具体实施方式在以下描述中,出于解释的目的,阐述了具体细节以便提供对本专利技术实施例的透彻理解。但是,将显而易见的是,可以在没有这些具体细节的情况下实践各种实施例。附图和描述不旨在是限制性的。可以以各种配置提供一些附图中描绘的系统。在某些实施例中,系统可以被配置为分布式系统,其中系统的一个或多个组件分布在云计算系统中的一个或多个网络上。在某些实施例中,系统可以被配置为在虚拟或非虚拟环境中操作。简介管道泄漏预测系统可以由任何采用管道的实体(诸如公用事业公司(例如,运输水、气体、污水等的公司)或能源勘探/生产公司(例如,经由管道运输石油、天然气和燃料的公司))使用,以便预先预测管道是否可能发生故障。可以使用这个预测以便采取预防措施,诸如对管道执行维护。一些预测管道泄漏的传统方法是基于理论的,并且可以依赖于假设而不是经验数据。例如,管道泄漏预测系统的一个实施例假设诸如管道泄漏的过去历史之类的因素是最重要的因素。换句话说,过去管道是否已经泄漏是决定管道将来是否会再次泄漏的最重要决定因素。但是,这样的系统可能忽略其它重要因素,并且还可能依赖于未经经验性验证或完全理解的假设。例如,系统可以正确地假设先前泄漏的管道很可能再次泄漏,但是这样的系统没有提供关于为什么管道在第一个地方泄漏的任何解释。因而,这种系统对于预测管道中第一次发本文档来自技高网
...

【技术保护点】
1.一种用于预测管道泄漏的计算机实现的方法,所述方法包括:访问训练数据集,所述训练数据集包括与第一多个管道中的相应管道相关联的第一数据项和已知泄漏,其中第一数据项包括相应管道的特点;应用监督机器学习技术以生成预测模型,所述预测模型被配置为通过基于与第一多个管道中的相应管道相关联的第一数据项训练该预测模型来确定管道的泄漏预测;访问验证数据集,所述验证数据集包括与第二多个管道中的相应管道相关联的第二数据项和已知泄漏,其中第二数据项包括相应管道的特点;至少通过以下操作来验证所述预测模型:通过将所述预测模型应用于第二数据项来确定第二多个管道中的管道的泄漏预测集合;将第二多个管道中的管道的泄漏预测与第二多个管道中的管道的已知泄漏进行比较,以确定第二多个管道中的管道的泄漏预测的准确度;基于第二多个管道中的管道的泄漏预测的准确度来生成混淆矩阵;基于所述混淆矩阵,确定与第二多个管道中的管道的泄漏预测的准确度相关联的真阳性率、假阳性率、真阴性率和假阴性率;确定真阳性率高于第一阈值;以及确定真阴性率高于第二阈值;访问管线数据集,所述管线数据集包括与第三多个管道相关联的第三数据项;以及将所述预测模型应用于所述管线数据集,以确定第三多个管道中的相应管道的泄漏预测。...

【技术特征摘要】
【国外来华专利技术】2017.04.13 US 62/485,314;2017.11.21 US 15/820,3161.一种用于预测管道泄漏的计算机实现的方法,所述方法包括:访问训练数据集,所述训练数据集包括与第一多个管道中的相应管道相关联的第一数据项和已知泄漏,其中第一数据项包括相应管道的特点;应用监督机器学习技术以生成预测模型,所述预测模型被配置为通过基于与第一多个管道中的相应管道相关联的第一数据项训练该预测模型来确定管道的泄漏预测;访问验证数据集,所述验证数据集包括与第二多个管道中的相应管道相关联的第二数据项和已知泄漏,其中第二数据项包括相应管道的特点;至少通过以下操作来验证所述预测模型:通过将所述预测模型应用于第二数据项来确定第二多个管道中的管道的泄漏预测集合;将第二多个管道中的管道的泄漏预测与第二多个管道中的管道的已知泄漏进行比较,以确定第二多个管道中的管道的泄漏预测的准确度;基于第二多个管道中的管道的泄漏预测的准确度来生成混淆矩阵;基于所述混淆矩阵,确定与第二多个管道中的管道的泄漏预测的准确度相关联的真阳性率、假阳性率、真阴性率和假阴性率;确定真阳性率高于第一阈值;以及确定真阴性率高于第二阈值;访问管线数据集,所述管线数据集包括与第三多个管道相关联的第三数据项;以及将所述预测模型应用于所述管线数据集,以确定第三多个管道中的相应管道的泄漏预测。2.如权利要求1所述的计算机实现的方法,其中所述预测模型包括随机森林模型。3.如权利要求1所述的计算机实现的方法,其中所述预测模型包括逻辑回归。4.如权利要求1所述的计算机实现的方法,其中所述预测模型包括朴素贝叶斯模型。5.如权利要求1所述的计算机实现的方法,其中,基于根据应用所述预测模型得到的第二多个管道中的管道的泄漏预测集合的统计分布,自动确定第一阈值。6.如权利要求1所述的计算机实现的方法,其中,基于根据应用所述预测模型得到的第二多个管道中的管道的泄漏预测集合的统计分布,自动确定第二阈值。7.如权利要求1所述的计算机实现的方法,其中所述方法还包括:基于所确定的第三多个管道中的管道的泄漏预测来订购第三多个管道中的管道。8.一种计算系统,包括:一个或多个数据存储库,存储:训练数据集,所述训练数据集包括与第一多个管道中的相应管道相关联的第一数据项和已知泄漏,其中第一数据项包括相应管道的特点;验证数据集,所述验证数据集包括与第二多个管道中的相应管道相关联的第二数据项和已知泄漏,其中第二数据项包括相应管道的特点;计算机处理器;以及存储程序指令的计算机可读存储介质,所述程序指令被配置为由所述计算机处理器执行以便使所述计算机处理器执行以下操作:访问所述训练数据集;应用监督机器学习技术以生成预测模型,所述预测模型被配置为通过基于与第一多个管道中的相应管道相关联的第一数据项训练该预测模型来确定管道的泄漏预测;访问所述验证数据集;至少通过以下操作来验证所述预测模型:通过将所述预测模型应用于第二数据项来确定第二多个管道中的管道的泄漏预测集合;将第二多个管道中的管道的泄漏预测与第二多个管道中的管道的已知泄漏进行比较,以确定第二多个管道中的管道的泄漏预测的准确度;基于第...

【专利技术属性】
技术研发人员:H·阿巴斯
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1