一种分布式实时故障处理方法技术

技术编号:19938264 阅读:45 留言:0更新日期:2018-12-29 06:29
本发明专利技术提供一种分布式实时故障处理方法,其特征在于,所述的方法包括:S1:建立实时故障处理的任务集τ={τi|1≤i≤n},其中,n表示构成任务集τ的n个任务,每个任务τi分别对应着一颗具有混合关键性的故障树TRi;S2:根据故障的执行状态,确定故障任务的调度方法;S3:利用步骤S1得到的任务集,按照步骤S2的调度方法将系统产生的故障与其故障处理的安全操作图进行匹配,完成故障的消除。该方法可在分布式环境下完成实时的故障处理,并考虑到故障潜在蔓延情况下的恢复机制。

【技术实现步骤摘要】
一种分布式实时故障处理方法
本专利技术属于实时反应式系统和实时
,具体涉及一种分布式实时故障处理方法。
技术介绍
为了实现对大型、复杂的分布式系统进行实时监视和控制,将功能强大的传感节点部署在系统中的关键节点,并直接接入到了互联网,将采集到的信息实时地传递到相应的服务器集群中进行计算,并将其需要执行的指令返回到传感节点或控制节点,完成预定的安全目标。这类由多种类型网络融合协同形成集中式与分布式协调运行的超大规模复杂网络的实时反应式系统,称为复杂实时反应式系统。智能电网是复杂实时反应式系统的一个典型代表。复杂实时反应式系统通常关系到生命财产安全、社会及环境安全,是安全攸关的,有极高的实时性要求,即当需要关注的事件发生后,系统必须在给定期限内完成相应的动作对这些事件进行响应,大量甚至海量的智能化操作需要在不同的节点、不同的设备上进行,这些操作的执行次序和时间有着严格的规定;一旦响应超出了其时限或有操作在错误的设备上、错误的时刻执行、执行时间超长、执行次序错误,则会造成灾难性的后果:人员重伤或死亡,或者设备的严重毁损,或者环境的危害。复杂实时反应式系统的网络纵横数千公里、设备千差万别、环境千变万化,在全网范围内通过能够实时采集信息、快速数据运算、及时完成相关的业务操作,对整个系统的运行进行监控;一旦出现故障,需要通过实时安全攸关反应式系统进行快速排查、诊断等方式减少损失、迅速修复。在正常运行时应以预防故障为目标及时地完成复杂的智能化业务操作;故障发生时及时发现故障,根据当前故障状态、多种网络的融合情况和网络信息状态、分布式的设备状态等多种状态在期限内对出现的故障进行紧急处置和自我修复来消除故障,从而保证系统的安全性;其核心问题是研究其分布式故障处理任务的实时调度问题。复杂实时反应式系统中有故障发生时,如果由于系统资源有限而得不到及时处理,可能引发其他存在业务或数据关联的新故障,从而出现故障在分布式环境下不断发生蔓延的情况。针对这种故障可能发生的连锁反应,目前的复杂实时反应式系统并没有考虑其连锁反应下如何保证故障处理的实时性,从而影响了故障恢复的成功率和安全性。
技术实现思路
针对复杂实时反应式系统现有技术的不足,本专利技术提供了一种新的分布式实时故障处理方法,该方法可在分布式环境下完成实时的故障处理,并考虑到故障潜在蔓延情况下的恢复机制。本专利技术的技术方案是按以下方式实现的:一种分布式实时故障处理方法,所述的方法包括:S1:建立实时故障处理的任务集τ={τi|1≤i≤n},其中,n表示构成任务集τ的n个任务,每个任务τi分别对应着一颗具有混合关键性的故障树TRi;S2:根据故障的执行状态,确定故障任务的调度方法;S3:利用步骤S1得到的任务集,按照步骤S2的调度方法将系统产生的故障与其故障处理的安全操作图进行匹配,完成故障的消除。进一步的,步骤S1的具体实现过程为:S11:创建任务τi对应故障树的初始故障节点τi,1;S12:根据以往的故障数据,推导故障τi,1引发的后续故障节点,形成τi,1的后继节点,直至所有故障节点τi,j全部建立;S13:建立所有故障节点τi,j的集合形成任务τi;S14:利用任务τi建立实时故障处理的任务集τ。进一步的,故障节点τi,j与安全操作图之间的对应关系为:其中,Gi,j代表了处理τi,j对应的故障所需执行的安全操作图,包括了ni,j个进行安全操作的子任务Di,j是Gi,j的相对截止期,是子任务完成安全操作所需的执行时间。进一步的,故障节点τi,j的集合τi(ri,TRi)={τi,j|1≤j≤ni},其中,TRi表示有向树,ri是TRi初始的故障节点的就绪时间,τi,j表示TRi的每个节点。进一步的,步骤S2的具体实现过程为:S21:分析故障τi默认的执行状态,根据故障树TRi源节点所在的关键性,确认关键节点;S22:根据关键节点形成MCE2E任务簇,其中,每个簇中的普通节点选取根据关键节点的紧迫程度和普通节点所在的关键性状态及其紧迫程度综合决定;若尚未出现关键节点,则根据当前最高关键性状态的节点先形成MCE2E任务簇的候选集;S23:按照关键节点的轮次,建立每个簇中节点的调度方法。进一步的,任务τi所代表的故障其默认的执行状态是其故障树TRi的源节点所在的关键性,即τi=τi,1,TRi的源节点其中,Gi,1代表处理τi,1需执行的安全操作图,Gi,1只有一个源任务和一个终任务,包括ni,j个进行安全操作的子任务进一步的,步骤S23中,调度方法的执行方法为:每轮在该簇关键节点的调度窗口内判断簇中普通节点可能出现的三个阶段,若处于关键性状态保留阶段,所有节点都在当前混合关键性状态下执行,此时,累积的执行时间均未达到该混合关键性状态的上限;若是处于关键性状态切换阶段,普通节点为关键节点的成功执行而让出处理器资源;若是处于关键性状态更新阶段,由于第二个阶段产生的关键性状态切换,更新普通节点中,其他簇中的后续节点信息。进一步的,在关键性状态切换阶段,具体的执行方法为:根据普通节点所在的关键性状态及其紧迫程度,选取关键性状态较低并且空闲时间相对充裕的普通节点进行降级执行;若被降级执行的普通节点发生关键性状态转换,则从候选集中选取下一个普通节点进行降级执行。进一步的,普通节点降级执行的具体步骤为:1)对最高关键性的任务子集合进行调度,给每个关键节点在偏序图上的子任务找到一种可调度的局部截止期分配方案,2)根据当前关键性状态下的执行时间需求和截止期,结合局部截止期划分方案来分析能否在多智能体上找到足够长的空闲处理器长度来完成执行;3)如果任务可被成功调度,则该任务按当前的关键性状态准入并执行;否则,该任务激活下个等级关键性状态的相关任务,并转到2)继续执行。本专利技术的有益效果是:本专利技术针对复杂实时反应式系统的安全需求,围绕复杂实时反应式系统中存在的调度问题,设计了分布式环境下的实时故障处理方法,以增加故障节点安全操作处理的成功率,并减少故障的后续触发率。本专利技术根据可调度条件来判断现有的系统资源能否满足系统中推理任务的截止期约束,按照其调度策略为推理任务的确定处理顺序、为实时推理过程分配合理的系统资源,并判断新到达的推理任务能否在不影响系统中已有推理任务的前提下安全地完成,若能满足则系统进入正常运行时的实时推理过程;否则,以总修复时间最短、故障蔓延长度最短为目标,对系统中的自愈多智能体进行调度,求解有效的故障修复解决方案,使系统在最坏情况下也能尽量避免损失。该方法适用于复杂实时反应式系统,既保证多智能体整体的安全运行,又能使故障处理过程出现的后继故障率少、故障扩展程度小,从而提高了复杂实时反应式系统的高实时性和高可靠性。附图说明图1是本专利技术的故障树和安全操作图的映射示意图;图2是本专利技术的分布式实时故障处理任务模型图;图3是本专利技术方法的流程图。具体实施方式以下结合附图详细说明本专利技术的具体实施方式,下文的公开提供了具体实施方式用来实现本专利技术的装置及方法,使本领域的技术人员更清楚地理解如何实现本专利技术。为了简化本专利技术的公开,下文中对特定例子的部件和设置进行描述。此外,本专利技术可以在不同例子中重复参考数字或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例或设置之间的关系。应当本文档来自技高网
...

【技术保护点】
1.一种分布式实时故障处理方法,其特征在于,所述的方法包括:S1:建立实时故障处理的任务集τ={τi|1≤i≤n},其中,n表示构成任务集τ的n个任务,每个任务τi分别对应着一颗具有混合关键性的故障树TRi;S2:根据故障的执行状态,确定故障任务的调度方法;S3:利用步骤S1得到的任务集,按照步骤S2的调度方法将系统产生的故障与其故障处理的安全操作图进行匹配,完成故障的消除。

【技术特征摘要】
1.一种分布式实时故障处理方法,其特征在于,所述的方法包括:S1:建立实时故障处理的任务集τ={τi|1≤i≤n},其中,n表示构成任务集τ的n个任务,每个任务τi分别对应着一颗具有混合关键性的故障树TRi;S2:根据故障的执行状态,确定故障任务的调度方法;S3:利用步骤S1得到的任务集,按照步骤S2的调度方法将系统产生的故障与其故障处理的安全操作图进行匹配,完成故障的消除。2.根据权利要求1所述的一种分布式实时故障处理方法,其特征在于,步骤S1的具体实现过程为:S11:创建任务τi对应故障树的初始故障节点τi,1;S12:根据以往的故障数据,推导故障τi,1引发的后续故障节点,形成τi,1的后继节点,直至所有故障节点τi,j全部建立;S13:建立所有故障节点τi,j的集合形成任务τi;S14:利用任务τi建立实时故障处理的任务集τ。3.根据权利要求2所述的一种分布式实时故障处理方法,其特征在于,故障节点τi,j与安全操作图之间的对应关系为:其中,Gi,j代表了处理τi,j对应的故障所需执行的安全操作图,包括了ni,j个进行安全操作的子任务Di,j是Gi,j的相对截止期,是子任务完成安全操作所需的执行时间。4.根据权利要求3所述的一种分布式实时故障处理方法,其特征在于,故障节点τi,j的集合τi(ri,TRi)={τi,j|1≤j≤ni},其中,TRi表示有向树,ri是TRi初始的故障节点的就绪时间,τi,j表示TRi的每个节点。5.根据权利要求1所述的一种分布式实时故障处理方法,其特征在于,步骤S2的具体实现过程为:S21:分析任务τi默认的执行状态,根据故障树TRi源节点所在的关键性,确认关键节点;S22:根据关键节点形成MCE2E任务簇,其中,每个簇中的普通节点选取根据关键节点的紧迫程度和普通节点所在的关键性状态及其紧迫程度综合决定;若尚未出现关键节点,则根据当前最高关键...

【专利技术属性】
技术研发人员:秦佳峰杨祎林颖李程启白德盟冯新岩周超刘洋贾然李龙龙郑文杰孙景文韩明明乔颖王娟娟王宏安罗雄飞郭超平
申请(专利权)人:国网山东省电力公司电力科学研究院中国科学院软件研究所国家电网有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1