一种基于Pearson相关性的大系统图论分解方法技术方案

技术编号:19340147 阅读:54 留言:0更新日期:2018-11-07 13:11
本发明专利技术公开了一种基于Pearson相关性的大系统图论分解方法,包括步骤:S101:根据工业过程中变量间的关系建立有向图。S102:求解变量间的皮尔逊相关系数,并将其作为有向图中对应边上的权重。S103:分别建立输入输出变量节点集,并将节点个数少的节点集作为中心变量集。S104:分别以中心变量集中节点为中心建立子图并根据变量分配规则完成初始子图集的建立。S105:选择当前最小子图,分别与其他子图试融合,计算各试融合后子图的融合指标,将对应最大融合指标的结果作为本轮融合的结果。S106:进行终止条件判断,若满足,停止继续融合,否则,返回S105。本发明专利技术避免了传统方法中获取系统状态空间方程这一复杂的过程,从数据的角度实现对图的分割,系统分解更加易于实现。

A graph theoretic decomposition method for large scale systems based on Pearson correlation

The invention discloses a graph theory decomposition method for large-scale systems based on Pearson correlation, which comprises steps: S101: establishing a directed graph according to the relationship between variables in industrial process. S102: to solve the Pearson correlation coefficient among variables, and regard it as the weight on the corresponding edge of a directed graph. S103: The node sets of input and output variables are established respectively, and the node sets with fewer nodes are taken as the central variable sets. S104: The sub-graphs are built with the central variable centralized nodes as the center, and the initial sub-graphs are built according to the variable allocation rules. S105: Select the current minimum subgraph and fuse with other subgraphs separately. Calculate the fusion index of each subgraph after fusing, and take the result of the corresponding maximum fusion index as the result of this round of fusion. S106: judge the termination condition. If satisfied, stop continuing to merge or return to S105. The invention avoids the complicated process of obtaining the system state space equation in the traditional method, realizes the Graph Segmentation from the perspective of data, and makes the system decomposition easier to realize.

【技术实现步骤摘要】
一种基于Pearson相关性的大系统图论分解方法
本专利技术涉及对化工过程建模过程中的系统分解算法,属于系统工程领域。
技术介绍
随着实际化工过程的结构越来越复杂,系统的维数越来越高,若对整个系统进行集中控制,会使得控制问题变得极其繁琐,并且对计算机的性能要求非常高。如果将大系统进行分解,用对若干简单子系统的控制来代替对系统整体的控制,这样可以在一定程度上降低问题的复杂度,因此如何较好地分解大系统是一个重要的课题。图论是近些年发展迅速且应用十分广泛的一个数学分支,它在网络理论、物理学、运筹学、控制论和经济管理等领域都有着广泛的应用。在图论中,图的结点表示各种元素,元素之间的关系用边来表示。这里所说的图并不是通常所讲的几何图形或事物的形状图,而是一种表示事物之间关系的数学模型。工业过程的工艺流程往往描述的是工业系统中各节点的信息以及节点之间的关系,所以利用有向图可以有效地反映工业过程的工艺流程。当有向图建立完成后,采用图论的性质对系统进行分析,将系统分解问题转变为图的分割问题,为复杂系统的分解提供了一种行之有效的方法。大多数现存的基于图论的系统分解方法,是利用状态空间方程来设定有向图中边上的权重以体现系统中各个变量之间的相互影响,但是实际的工业系统中,状态空间方程大多难以获取。鉴于此,本专利技术公开了一种基于Pearson相关性的大系统图论分解方法,利用皮尔逊相关系数衡量两变量之间的相关性,根据变量之间皮尔逊相关系数的绝对值来设置相应边的权重。并且在子图融合时定义一个融合指标,既使得融合后的子图被切割的边尽可能的少以确保更多的系统信息被保留下来,又保证在子图融合时关联性更大的子图被聚类到一起。
技术实现思路
本专利技术所要解决的技术问题在于,提供一种基于Pearson相关性的大系统图论分解方法,本专利技术避免了传统方法中对系统状态空间方程的获取这一复杂的过程,从数据的角度出发,利用变量间的相关性进行系统分解,无需提前了解系统的机理知识,使得系统分解更加易于实现。为了解决上述技术问题,本专利技术提供了基于Pearson相关性的大系统图论分解方法,包括步骤:S101:采集工业过程输入输出数据,根据实际工业过程中变量间的关系建立有向图。S102:求解变量间的皮尔逊相关系数,并将该相关系数的绝对值作为有向图中对应边上的权重。S103:建立输入变量节点集和输出变量节点集,根据这两个变量集中节点个数的大小关系,将包含节点个数少的节点集作为中心变量集,将另一个节点集作为非中心变量集。S104:分别以中心变量集中节点为中心建立子图并根据变量分配规则完成初始子图集的建立。S105:融合子图,选择当前最小子图,分别与其他子图进行试融合,计算每个试融合结果子图的融合指标,选取具有最大融合指标的试融合结果作为本次融合的最终融合结果。S106:进行终止条件判断,若不满足,返回S105,若满足,停止继续融合。进一步的,所述S101具体包括步骤:S1011:采集工业过程中的输入输出数据。S1012:图是由节点集合与连接节点的边的集合组成的,记为G(V,E),其中V为节点集,E为边集。节点通常表示各个元素,而边则表示元素与元素之间的关系。根据图中的边是否有方向可将图分为无向图和有向图。由于工业系统是一个流程,所以可以利用有向图来表示。假定系统由m个输入变量xi(i=1...m)和n个输出变量yj(j=1...n)组成并且各输入变量对所有输出变量均有影响。首先建立有向图。该有向图包含m+n个节点,并且每个输入节点与所有的输出节点均由有向边连接,有向边的方向为输入变量指向输出变量。但是由于在实际工业系统中,输入变量不一定对所有输出变量都有影响,即某些输入变量只与部分输出变量有边相连,通过对每条边设置连通参数Aij以反映第i个输入变量与第j个输出变量是否存在关系。其中此时得到的初始有向图如图1-1所示。进一步的,所述S102具体包括步骤:S1021:计算各输入变量与所有输出变量的皮尔逊相关系数。第i个输入变量和第j个输出变量的皮尔逊相关系数如下:其中,E为数学期望或均值,σ为标准差,称为变量xi与yj的协方差,记为cov(xi,yj),即S1022:皮尔逊相关系数可以衡量输入输出变量间的关系。利用该相关系数对有向图中的相应边设置权重以反映输入变量对各输出变量的不同影响。权重Wij设置如下:Wij为连接第i个输入变量与第j个输出变量的有向边上的权重。此时得到有权重的初始有向图如图1-2所示。进一步的,所述S103具体包括步骤:S1031:在有向图中,每个节点所连的边可根据边的指向被分为出边和入边,连接该有向边的两个节点可分为始点和终点。定义一个节点的度为与该节点相连的边的数目,记为D(v)。若图为有向图,则将以该节点为终点的边的数目称为该节点的入度,记为ID(v),将以该节点为始点的边的数目称为该节点的出度,记为OD(v)。将初始有向图中出度为0的节点作为输出变量节点,入度为0的节点作为输入变量节点,分别建立输入变量节点集和输出变量节点集两大点集。S1032:若输入变量数m大于输出变量数n,将输出变量节点集作为中心节点集,输入变量节点集作为非中心节点集。否则,将输入变量节点集作为中心节点集,输出变量节点集作为非中心节点集。进一步的,所述S104具体包括步骤:S1041:将中心变量节点集中的节点作为中心,分别建立子图,此时子图个数与中心变量节点集中节点个数相同。假设输入变量数m大于输出变量数n,则将输出变量节点集作为中心节点集,即以yj(j=1...n)为中心,分别建立子图,此时每个子图中仅包含一个节点,并且子图集中包含的子图数为n。得到的子图集如图1-3所示。S1042:为每个子图预分配一个非中心节点,该非中心节点为与每个子图的中心节点有最大权重边相连的非中心节点,分配完后将已被分配的点从非中心节点集中删除。假设在输入变量集中的节点xi为节点yj的最大权重边所连接的节点,则在预分配时,将节点xi分配至以节点yj为中心的子图中,并将xi从非中心节点集中删除。此时该子图中包含xi和yj这两个节点以及连接这两个节点的边,同理可以为其余子图预分配节点。得到的子图集如图1-4所示。S1043:对于剩下的未被分配的非中心节点,将这些非中心节点分配至其最大权重边所对应的中心节点所在的子图中。分配结束后,得初始子图集。对于未分配节点xk,假设在xk的所有出边中,与输出变量集中节点yl相连的边上的权重最大,所以,将xk分配至以节点yl为中心的子图中。同理,对剩余的未分配节点进行分配。分配结束后,得初始子图集,此时的初始子图集中子图个数为n。分配结束后的以节点yl为中心的子图如图1-5所示。进一步的,所述S105具体包括步骤:S1051:选取最小子图分别与其他子图进行试融合。最小子图为子图集内节点数最少的子图。假设子图集中第i个子图节点数最少,则将子图i作为最小子图。以子图i和子图u的试融合为例,假定子图i中包含3个节点xi1,xi2和yi,子图u中包含4个节点xu1,xu2,xu3和yu。试融合为将子图i和子图u中的所有节点合并起来,并按照初始有向图中的节点之间的连接方式将这些节点连接起来,形成子图i和子图u的试融合结果子图。该试融合结果子图中包含xi1,xi2,xu1本文档来自技高网
...

【技术保护点】
1.本专利技术提供了一种基于Pearson相关性的大系统图论分解方法,其特征在于,包括步骤:S101:采集工业过程输入输出数据,根据实际工业过程中变量间的关系建立有向图;S102:求解变量间的皮尔逊相关系数,并将其绝对值作为有向图中对应边上的权重;S103:建立输入输出变量节点集,根据这两个变量集中节点个数的大小关系,将包含节点个数少的节点集作为中心变量集,将另一个节点集作为非中心变量集;S104:以中心变量集中各节点为中心建立子图并根据变量分配规则完成初始子图的建立;S105:选择当前最小子图,分别与其他子图进行试融合,计算每个试融合结果子图的融合指标,选取具有最大融合指标的试融合结果作为本次融合的最终结果;S106:进行终止条件判断,若不满足,返回S105,若满足,停止继续融合。

【技术特征摘要】
1.本发明提供了一种基于Pearson相关性的大系统图论分解方法,其特征在于,包括步骤:S101:采集工业过程输入输出数据,根据实际工业过程中变量间的关系建立有向图;S102:求解变量间的皮尔逊相关系数,并将其绝对值作为有向图中对应边上的权重;S103:建立输入输出变量节点集,根据这两个变量集中节点个数的大小关系,将包含节点个数少的节点集作为中心变量集,将另一个节点集作为非中心变量集;S104:以中心变量集中各节点为中心建立子图并根据变量分配规则完成初始子图的建立;S105:选择当前最小子图,分别与其他子图进行试融合,计算每个试融合结果子图的融合指标,选取具有最大融合指标的试融合结果作为本次融合的最终结果;S106:进行终止条件判断,若不满足,返回S105,若满足,停止继续融合。2.根据权利要求1所述的基于Pearson相关性的大系统图论的系统分解方法,其特征在于,所述S101具体包括步骤:S1011:采集工业过程中的输入输出数据;S1012:图由节点集合与连接节点的边集合组成,记为G(V,E),其中V为节点集,E为边集,节点表示各个元素,而边则表示元素与元素之间的关系;建立工业系统的有向图。假定系统由m个输入变量xi(i=1...m)和n个输出变量yj(j=1...n)组成并且各输入变量对所有输出变量均有影响,有向图包含m+n个节点,并且每个输入节点与所有的输出节点均由有向边连接,有向边的方向为输入变量指向输出变量,由于在实际工业系统中,输入变量不一定对所有输出变量都有影响,即某些输入变量只与部分输出变量有边相连,通过对每条边设置连通参数Aij以反映第i个输入变量与第j个输出变量是否存在关系,其中3.根据权利要求1所述的基于Pearson相关性的大系统图论的系统分解方法,其特征在于,所述S102具体包括步骤:S1021:计算各输入变量与所有输出变量的皮尔逊相关系数。第i个输入变量和第j个输出变量的皮尔逊相关系数如下:其中,E为数学期望或均值,σ为标准差,称为变量xi与yj的协方差,记为cov(xi,yj),即S1022:皮尔逊相关系数可以衡量输入输出变量间的关系,利用该相关系数对有向图中的相应边设置权重以反映输入变量对各输出变量的不同影响,权重Wij设置如下:Wij为连接第i个输入变量与第j个输出变量的有向边上的权重。4.根据权利要求1所述的基于Pearson相关性以及的大系统图论的系统分解方法,其特征在于,所述S103具体包括步骤:S1031:在有向图中,每个节点所连的边可根据边的指向被分为出边和入边,连接该有向边的两个节点可分为始点和终点,定义一个节点的度为与该节点相连的边的数目,记为D(v),若图为有向图,则将以该节点为终点的边的数目称为该节点的入度,记为ID(v),将以该节点为始点的边的数目称为该节点的出度,记为OD(v);将初始有向图中出度为0的节点作为输出变量节点,入度为0的节点作为输入变量节点,分别建立输入变量节点集和输出变量节点集;S1032:若输入变量数m大于输出变量数n,将输出变量节点集作为中心节点集,输入变量节点集作为非中心节点集。否则,将输入变量节点集作为中心节点集,输出变量节点集作为非中心节点集。5.根据权利要求1所述的基于Pearson相关性的大系统图论分解方法,其特征在于,所述S104具体包括步骤:S1041:将中心变量节点集中的节点作为中心,分别建立子图,此时子图个数与中心变量节点集中节点个数相同,假设输入变量数m大于输出变量数n,则将输出变量节点集作为中心节点集,即以yj(j=1...n)为中心,分别建立子图,此时每个子图中仅包含一个节点,并且子图集中包含的子图数为n;S1042:为每个子图预分配一个非中心节点,该非中心节点为与每个子图的中心节点有最大权重边相连的非中心节点,分配完后将已被分配的点从非中心节点集中删除,假设在输入变量集中的节点xi为节点yj的最大权重边所连接的节点,则在预分配时,将节点xi分配至以节点yj为中心的子图中,并将xi从非中心节点集中删除,此时该子图中包含xi和yj这两个节点以及连接这两个节点的边,同理可以为其余子图预分配节...

【专利技术属性】
技术研发人员:李丽娟张姝金晶叶景易辉
申请(专利权)人:南京工业大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1