用于工业中的性能指标的基于数据的优化的方法和系统技术方案

技术编号:19547147 阅读:24 留言:0更新日期:2018-11-24 21:11
本发明专利技术涉及用于加工和制造厂的性能指标的基于数据的优化的系统和方法。该系统包括用于收集和合并来自工业处理单元的数据、对数据进行预处理以消除离群值和缺失的模块。此外,系统根据数据生成定制输出并识别影响给定处理性能指标的重要变量。该系统还为包括重要特征的关键性能指标构建预测模型,并确定用于在用户干预最少的情况下优化关键性能指标的操作点。特别地,系统接收来自用户的关于要优化的关键性能指标的输入并且向用户通知来自各分析步骤的输出,以帮助用户有效地管理分析并且采取合适的操作决策。

Data-based optimization methods and systems for performance indicators in industry

The present invention relates to a data-based optimization system and method for performance indicators of processing and manufacturing plants. The system includes modules for collecting and merging data from industrial processing units, preprocessing data to eliminate outliers and missing values. In addition, the system generates customized output based on the data and identifies important variables that affect the given processing performance indicators. The system also constructs a prediction model for key performance indicators including important features, and determines the operating points for optimizing key performance indicators with minimal user intervention. In particular, the system receives input from users about key performance indicators to be optimized and notifies users of output from various analysis steps to help users effectively manage analysis and take appropriate operational decisions.

【技术实现步骤摘要】
用于工业中的性能指标的基于数据的优化的方法和系统优先权要求本专利申请要求2017年5月15日提交的印度申请第201721009012号的优先权。前述申请的全部内容通过引用并入本文中。
本文中实施方式总体上涉及数据分析的领域,并且具体地涉及用于优化加工和制造业的关键性能指标的系统和方法。
技术介绍
诸如生产率、产品质量、能源消耗、正常运行时间百分比、排放水平等的指标用于监测制造业和加工厂的表现。当今工业面临着实现雄心勃勃的生产目标、最大限度地降低能耗、满足排放标准和定制其产品的挑战,同时还要应对原材料质量和其他影响参数例如环境温度、湿度等的广泛变化。工业努力通过调整已知对性能指标有影响或起作用的若干参数来不断改进其性能指标。当加工涉及有限数量的变量时,这是容易的。但是,大多数工业处理由串联和/或并联的许多单元组成,并且涉及数千个变量或参数。在这种情况下识别影响关键性能指标(KPI)和(它们的)最优水平的变量并非易事,并且这样做会需要大量时间和专业知识。诸如统计技术、机器学习和数据挖掘等的数据分析方法具有解决这些复杂的优化问题的潜力,并且可用于分析工业数据并发现更新的操作域(regimeofoperation)。识别影响KPI的相关变量是与处理数据分析相关联的挑战。这是由于工业处理中的大量变量以及它们之间复杂的非线性相互作用。存在几个变量(或特征)选择技术,但不存在单一变量选择技术能够识别所有相关变量,特别是在复杂的工业过程中。因此,需要一种能够选择最重要变量的更好的变量选择技术。此外,在所有描述数据分析向制造和加工工业的应用的方法中,焦点均限于KPI、其他感兴趣的变量和来自预测模型的结果的可视化,以及/或者向最终用户提供处理建议。在最终用户的决策过程中提供的巨大帮助的其他一些输出例如对应于KPI的期望范围和不期望范围的变量的范围、不同吞吐量水平处的KPI范围等等在任何现有方法中均不作为特征。
技术实现思路
以下内容呈现了本公开内容的一些实施方式的简化概要,以提供对于实施方式的基本理解。该概要不是实施方式的广泛概述。其并非意在标识实施方式的关键/紧要要素或描绘实施方式的范围。其唯一目的是以简化的形式呈现一些实施方式,作为下面呈现的更详细描述的序言。考虑到的前述内容,本文的实施方式提供了用于分析来自一个或更多个工业处理单元的多个数据以用于优化工业的关键性能指标的系统和方法。在一个方面中,以下内容呈现了用于分析来自一个或更多个工业处理单元的多个数据以优化工业的关键性能指标的系统。该系统包括具有指令的存储器、与存储器通信地耦接的至少一个处理器、多个接口和多个模块。接收模块被配置成接收一个或更多个工业处理单元的多个数据,其中所述多个数据包括原材料的特性、中间产品的特性、副产品的特性、最终产品的特性、工艺参数和处理设备的状况。单元级融合模块被配置成合并所接收的多个数据以获得一个或更多个工业处理单元中的每一个的单元式数据集,其中每个处理单元的单元式数据集包括期望的采样频率。验证模块被配置成验证一个或更多个工业处理单元的经合并的单元式数据集,其中,计算处理单元的所有变量的百分比可用性、标准差、四分位间距和不合理值的存在。数据预处理模块被配置成预处理经验证的多个数据以获得一个或更多个工业处理单元中的每一个的经预处理的数据集,其中,预处理是迭代过程,其包括以下步骤:离群值去除、缺失值插补和聚类。企业级融合模块被配置成将一个或更多个工业处理单元中的每一个的预处理数据与一个或更多个基于物理的模型的模拟变量的一个或更多个值以及来自用户的一个或更多个域输入进行集成以获得企业级数据集,其中,在考虑由于各个单元中的停留时间、一个或更多个工业处理单元之间的运输时间以及处理单元的一个或更多个传感器的响应时间引起的时间滞后的情况下将单元式数据集合并和同步。域识别模块被配置成在企业级数据集上使用一种或更多种聚类技术来识别一个或多个操作域,其中,所述一种或更多种聚类技术包括基于距离的聚类、基于密度的聚类和分层聚类。基线统计模块被配置成确定对应于企业级数据集的KPI的一个或更多个变量的范围。范围确定是基于预定义的基线统计和一个或多个操作域,其中,所确定的一个或更多个变量的范围被用于在执行分析的时间段期间生成一个或更多个KPI图。特征选择模块被配置成选择企业级数据集的一个或更多个特征以获得企业级数据集的一个或更多个选定特征的超集,其中,特征选择在所有的域式数据集和企业级数据集上被执行。模型构建模块被配置成针对每个KPI开发一个或更多个预测模型,其中,使用企业级数据集和企业级数据集的一个或更多个选定特征的超集来开发一个或更多个预测模型。优化模块被配置成使用一种或更多种优化技术基于关于一个或更多个KPI的一个或更多个预测模型和约束来优化至少一个KPI,其中,所述一种或更多种优化技术包括梯度搜索、线性编程、目标规划、模拟退火和演化算法。在另一方面,以下内容呈现了用于分析来自一个或更多个工业处理单元的多个数据以优化工业的关键性能指标的方法。该方法包括以下步骤:接收一个或更多个工业处理单元的多个数据,其中,所述多个数据包括原材料的特性、中间产品、副产品和最终产品的特性、工艺参数和处理设备的状况;合并所接收的多个数据以获得所述一个或更多个工业处理单元中的每一个的单元式数据集;验证所述一个或更多个工业处理单元的经合并的单元式数据集,其中,计算处理单元的所有变量的垃圾值、百分比可用性、标准差和四分位间距的存在;对经验证的多个数据进行预处理以获得所述一个或更多个工业处理中的每一个的预处理的数据集,其中,预处理是迭代过程,包括步骤离群值去除、缺失值的插补和聚类;将所述一个或更多个工业处理单元中的每一个的预处理数据集与一个或更多个基于物理的模型的模拟变量的一个或更多个值以及来自用户的一个或更多个域输入进行集成以获得企业级数据集,其中,在考虑由于各个单元中的停留时间、从一个或更多个工业处理单元的材料运输时间以及处理单元的一个或更多个传感器的响应时间引起的时间滞后的情况下将单元式数据集合并和同步;在企业级数据集上使用一种或更多种聚类技术来识别一个或更多个操作域,其中,所述一种或更多种聚类技术包括基于距离的聚类、基于密度的聚类和分层聚类;基于预定义的基线统计和一个或更多个操作域来确定对应于企业级数据集的KPI的一个或更多个变量的范围,其中,所确定的一个或更多个变量的范围被用于在执行分析的时间段期间生成一个或更多个KPI图;选择企业级数据集的一个或更多个特征以获得企业级数据集的一个或更多个选定特征的超集,其中,特征选择在所有域式数据集以及企业级数据集上被执行;针对每个KPI开发一个或多个预测模型,其中,所述一个或更多个预测模型使用企业级数据集和企业级数据集的一个或更多个选定特征的超集;使用一种或更多种优化技术基于一个或更多个KPI的一个或更多个预测模型和约束来优化至少一个KPI,其中,一个或多个优化技术包括梯度搜索、线性规划、目标规划、模拟退火和演化算法。在另一个方面,本文中的实施方式提供了包括一个或更多个指令的一个或更多个非暂态机器可读信息存储介质,所述一个或更多个指令在由一个或更多个硬件处理器执行时执行动作,所述动作包括:接收一个或更多个工业处理单元的多个数据,其本文档来自技高网
...

【技术保护点】
1.一种用于分析来自一个或更多个工业处理单元的多个数据以优化处理厂的一个或更多个单元的关键性能指标KPI的计算机实现方法,所述方法包括以下步骤:在接收模块(108)处接收一个或更多个工业处理单元的多个数据,其中,所述多个数据包括原材料特性、中间产品特性、副产品特性、最终产品特性、处理参数、环境参数、市场需求、原材料的可用性和处理设备的状况;在单元级融合模块(110)处合并所接收的多个数据以获得所述一个或更多个工业处理单元中的每一个的单元式数据集,其中每个处理单元的单元式数据集包括期望的采样频率;在验证模块(112)处验证所述一个或更多个工业处理单元的合并的单元式数据集,其中对所述处理单元的所有变量的百分比可用性、标准差、四分位距和不合理值的存在进行计算;在数据预处理模块(114)处对经验证的多个数据进行预处理以获得所述一个或更多个工业处理单元中的每一个的预处理数据集,其中所述预处理是迭代过程,所述迭代过程包括以下步骤:去除离群值、插补缺失值和聚类;在企业级融合模块(116)处将所述一个或更多个工业处理单元中的每一个的预处理与一个或更多个基于物理的模型的模拟变量的一个或更多个值以及来自用户的一个或更多个域输入进行集成,以获得企业级数据集,其中在考虑由于各单元中的停留时间、一个或更多个工业处理单元之间的材料运输时间以及所述处理单元中的一个或更多个传感器的响应时间导致的时间滞后的情况下,将所述单元式数据集合并和同步;在域识别模块(118)处在所述企业级数据集上使用一种或更多种聚类技术来识别一个或更多个操作域,其中所述一种或更多种聚类技术包括基于距离的聚类、基于密度的聚类和分层聚类;在基线统计模块(120)处基于预定义的基线统计量和所述一个或更多个操作域,来确定与所述企业级数据集的KPI相对应的一个或更多个变量的范围,其中,所确定的一个或更多个变量的范围用于在执行分析的时间段中生成一个或更多个KPI图;在特征选择模块(122)处选择所述企业级数据集的一个或更多个特征或关键变量以获得所述企业级数据集的一个或更多个选定特征的超集,其中对所有域式数据集以及所述企业级数据集执行特征选择;在模型构建模块(124)处针对每个KPI开发一个或更多个预测模型,其中所述一个或更多个预测模型使用企业级数据集和所述企业级数据集的一个或更多个选定特征的超集;以及在优化模块(126)处使用一种或更多种优化技术基于关于所述一个或更多个KPI的一个或更多个预测模型和约束来优化至少一个KPI,其中一种或更多种优化技术包括梯度搜索、线性规划、目标规划、模拟退火和演化算法。...

【技术特征摘要】
2017.05.15 IN 2017210090121.一种用于分析来自一个或更多个工业处理单元的多个数据以优化处理厂的一个或更多个单元的关键性能指标KPI的计算机实现方法,所述方法包括以下步骤:在接收模块(108)处接收一个或更多个工业处理单元的多个数据,其中,所述多个数据包括原材料特性、中间产品特性、副产品特性、最终产品特性、处理参数、环境参数、市场需求、原材料的可用性和处理设备的状况;在单元级融合模块(110)处合并所接收的多个数据以获得所述一个或更多个工业处理单元中的每一个的单元式数据集,其中每个处理单元的单元式数据集包括期望的采样频率;在验证模块(112)处验证所述一个或更多个工业处理单元的合并的单元式数据集,其中对所述处理单元的所有变量的百分比可用性、标准差、四分位距和不合理值的存在进行计算;在数据预处理模块(114)处对经验证的多个数据进行预处理以获得所述一个或更多个工业处理单元中的每一个的预处理数据集,其中所述预处理是迭代过程,所述迭代过程包括以下步骤:去除离群值、插补缺失值和聚类;在企业级融合模块(116)处将所述一个或更多个工业处理单元中的每一个的预处理与一个或更多个基于物理的模型的模拟变量的一个或更多个值以及来自用户的一个或更多个域输入进行集成,以获得企业级数据集,其中在考虑由于各单元中的停留时间、一个或更多个工业处理单元之间的材料运输时间以及所述处理单元中的一个或更多个传感器的响应时间导致的时间滞后的情况下,将所述单元式数据集合并和同步;在域识别模块(118)处在所述企业级数据集上使用一种或更多种聚类技术来识别一个或更多个操作域,其中所述一种或更多种聚类技术包括基于距离的聚类、基于密度的聚类和分层聚类;在基线统计模块(120)处基于预定义的基线统计量和所述一个或更多个操作域,来确定与所述企业级数据集的KPI相对应的一个或更多个变量的范围,其中,所确定的一个或更多个变量的范围用于在执行分析的时间段中生成一个或更多个KPI图;在特征选择模块(122)处选择所述企业级数据集的一个或更多个特征或关键变量以获得所述企业级数据集的一个或更多个选定特征的超集,其中对所有域式数据集以及所述企业级数据集执行特征选择;在模型构建模块(124)处针对每个KPI开发一个或更多个预测模型,其中所述一个或更多个预测模型使用企业级数据集和所述企业级数据集的一个或更多个选定特征的超集;以及在优化模块(126)处使用一种或更多种优化技术基于关于所述一个或更多个KPI的一个或更多个预测模型和约束来优化至少一个KPI,其中一种或更多种优化技术包括梯度搜索、线性规划、目标规划、模拟退火和演化算法。2.根据权利要求1所述的方法,其中,对具有预定义百分比可用性和预定义缺失模式的变量执行所述预处理。3.根据权利要求1所述的方法,其中,基于预定义的基线处理单元对来自一个或更多个工业单元的预处理的多个数据进行集成。4.根据权利要求1所述的方法,其中,所述一个或更多个图包括KPI的趋势图、KPI的箱线图、散点图和热度图。5.根据权利要求1所述的方法,其中,所述特征选择在两个阶段中执行,包括:在第一阶段中,根据一个或更多个特征选择技术获得重要特征,在第二阶段中,使用几何平均评分法对从所述第一阶段获得的特征进行排序并组合,以获得一个或更多个特征的单个超集。6.根据权利要求5所述的方法,其中,在第一阶段中选择的一个或更多个特征中的较低得分的特征与KPI的相关性较高。7.根据权利要求5所述的方法,其中,一个或更多个特征选择技术的第一阶段包括基于模型的方法和非基于模型的方法。8.根据权利要求1所述的方法,其中,在所有域式数据集以及企业级数据集上执行所述特征选择。9.根据权利要求1所述的方法,其中,从所述数据预处理模块(114)至所述用户的输出包括:丢弃变量的列表;针对每个变量移除的离群值的数目和百分比;用于在每个变量中插补缺失值的技术;预处理前后各变量的均值、中值和标准差;以及预处理前后所有变量的趋势图。10.根据权利要求1所述的方法,其中,从所述企业级融合模块(116)至所述用户的输出包括:模拟参数的列表;以及集成数据集中的所有变量的范围、均值、中值和标准差。11.根据权利要求1所述的方法,其中,从所述基线统计模块(120)至所述用户的输出包括:与KPI的期望范围和不期望范围相对应的变量的范围;在不同生产率水平下KPI的范围;以及KPI和其他变量之间的相关性系数。12.根据权利要求1所述的方法,其中,从所述基线统计模块(120)至所述用户的输出包括:KPI和其他变量的趋势图和箱线图;KPI和所关注变量之间的散点图;以及KPI的平均值的热度图。13.根据权利要求1所述的方法,其中,从所述特征选择模块(122)至所述用户的输出包括特征的超集及所述特征针对域式数据集和集成数据集的重要性得分以及所述特征的平行坐标图。14.根据权利要求1所述的方法,其中,从模型构建和辨别模块至用户的输出包括:所有预测模型的性能度量;基于均方根误差和平均绝对误差开发的前三的预测模型;所述前三的模型的健壮性得分;所述健壮模型中所有变量的敏感性得分。15.根据权利要求1所述的方法,其中,从模型构建和辨别模块至所述用户的输出还包括:所述KPI的实际值和预测值的趋势图;所述KPI的实际值对预测值的散点图;以及所述健壮模型中绝对误差对所有变量的残差图。16.根据权利要求1所述的方法,其中,从所述优化模块(126)至所述用户的输出包括:产生最优KPI(帕累托最优操作点)的变量的值;以及所述KPI的最优值和帕累...

【专利技术属性】
技术研发人员:文卡塔拉曼纳·伦卡纳罗汉·潘德亚拉扬·库马尔阿尼鲁达·潘达马赫什·梅纳姆斯里·哈沙·尼斯塔拉普拉迪普·拉托尔贾亚斯里·比斯瓦斯
申请(专利权)人:塔塔顾问服务有限公司
类型:发明
国别省市:印度,IN

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1