基于Z语言的存储系统抗软错误可靠性建模与评估方法技术方案

技术编号:28419199 阅读:14 留言:0更新日期:2021-05-11 18:26
本发明专利技术公开了一种基于Z语言的存储系统抗软错误可靠性建模与评估方法,包括:根据存储系统结构划分存储系统功能模块,并根据Z语言规范对存储系统进行分级建模,得到可靠性模型,包括整体和功能模块可靠性模型;采用隐马尔可夫模型描述模型;通过连续时间马尔可夫链计算功能模块失效率,对存储系统功能模块进行可靠性评估;将存储系统功能模块失效与否的状态序列作为观测变量,将存储系统整体状态作为隐马尔可夫模型的状态变量,建立隐马尔可夫模型,计算存储系统整体的失效率,对存储系统进行可靠性评估。本发明专利技术将存储系统分级建模,具有模型结构清晰,支持严谨地存储系统及各个功能模块可靠性分析,便于形式化验证等优点,具有很好的可扩展性。

【技术实现步骤摘要】
基于Z语言的存储系统抗软错误可靠性建模与评估方法
本专利技术属于可信计算、形式化建模与验证领域,特别是一种基于Z语言的存储系统抗软错误可靠性建模与评估方法。
技术介绍
存储系统是计算机中重要的组成部分之一,它是外存与CPU进行沟通的桥梁。计算机中所有程序的运行都是在存储系统中进行的,因此存储系统的性能对计算机的影响非常大。其作用是用于暂时存放CPU中的运算数据,以及与硬盘等外部存储器交换的数据。只要计算机在运行中,操作系统就会把需要运算的数据从存储系统调到CPU中进行运算,当运算完成后CPU再将结果传送出来,存储系统的稳定运行也决定了计算机的稳定运行。由于物理结构原因,存储系统只能将数据保持很短的时间。为了保持数据,存储系统使用电容存储,所以必须隔一段时间刷新一次,如果存储单元没有被刷新,存储的信息就会丢失,关机就会丢失数据。存储系统可以分解为存储模块、数据寄存器、地址寄存器和内存控制器四个功能模块:1、存储模块是内存中负责存储数据的模块,当存储模块发生翻转导致软错误的时候,数据发生变化,引发内存故障;2、数据寄存器(MemoryDataRegister),是计算机控制单元中的寄存器,寄存了将要写入到计算机主存储器(DRAM)的数据,或由计算机主存储器读取后的数据。它就像缓冲器,持有从内存复制的数据,以准备给处理器使用,当数据寄存器发生翻转导致软错误时,其中所转存的数据改变,造成存储系统故障;3、地址寄存器(MemoryAddressRegister),地址寄存器用来保存当前CPU所访问的内存单元的地址。由于在内存和CPU之间存在着操作速度上的差别,所以必须使用地址寄存器来保持地址信息,直到内存的读/写操作完成为止,当地址寄存器发生翻转导致软错误时,访问的内存地址发生改变,引发数据错读,造成存储系统故障;4、内存控制器(MemoryController),内存控制器控制内存并使内存与CPU之间进行数据交换。内存控制器决定了计算机系统所能使用的最大内存容量、内存Bank数、内存类型和速度、内存颗粒数据深度和数据宽度等等重要参数,决定了计算机系统的内存性能,当内存控制器发生软错误时,会引发存储系统故障。为了对存储系统功能模块进行更为细致的分析,将其继续分解,以存储模块为例,存储模块分解为以下三部分,1.存储体,由若干个存储单元(Cell)组成,当存储数据库中的存储单元发生翻转时,所存数据发生改变,造成存储模块故障;2.地址译码器,分为行译码器和列译码器,行译码器负责输出行地址选择信号,列译码器负责输出列地址选择信号;当地址译码器输出信号错误时,将访问错误的内存地址。3.行缓冲区,行缓冲区负责将读出的行内容暂存,等待列位址送到后输出正确的位元,以及判断存储的内容是0还是1。当行缓冲区里的存储单元发生翻转时,也将造成存储模块故障。在存储系统硬件建模方面,目前主要的建模方法是从元器件、子系统、总系统三个层面来描述硬件的可靠性信息。在可靠性分析中主要是基于可靠性任务框图来分析,在存储系统硬件设计时,根据存储系统硬件的任务为其设计可靠性任务框图,框图中所涉及的子模块及其整个任务路径的可靠性代表该功能的可靠性,而所有功能的可靠性又代表整个系统的可靠性。这类方法能够评估内存硬件特定功能执行路径的可靠性,路径中所涉及的可靠性在其中所起到的作用被视为是等价的,所以无法准确的评估可靠性。随着存储系统的日益复杂,传统方法现已难以描述其动态特征和其可靠性与时间的相关性。Z语言是由牛津大学程序设计研究组设计开发的。Z语言是以Zermelo-Fraenkel集合论和一阶谓词逻辑为基础的形式规格说明规范,具有精确描述系统状态与操作的能力,并且支持谓词演算和模式演绎的数学方法对模型进行数据约束的证明。与其他形式化方法相比,Z语言具有很强的描述能力、支持可扩展、建模形式呈现模块化等优点,这些优点使其成为软件形式化建模常用方法之一。
技术实现思路
本专利技术的目的在于提供一种基于Z语言的存储系统抗软错误可靠性建模与评估方法,采用隐马尔可夫模型为存储系统建立可靠性模型,并提供评估方法,以谓词约束的形式对存储系统的可靠性进行描述,便于形式化验证,且具有很好的可扩展性。实现本专利技术目的的技术解决方案为:一种基于Z语言的存储系统抗软错误可靠性建模与评估方法,所述方法包括以下步骤:步骤1,根据存储系统MS结构划分存储系统功能模块MFM,并根据Z语言规范,对存储系统进行分级建模,得到可靠性模型,包括存储系统可靠性模型Z-MS-RM和其子模型存储系统功能模块可靠性模型Z-MFM-RM;步骤2,采用隐马尔可夫模型HMM描述Z-MS-RM模型,为存储系统建立HMMMS模型;步骤3,根据连续时间马尔可夫链CTMC计算存储系统功能模块的失效率,对存储系统功能模块的可靠性进行评估;步骤4、将存储系统失效与否状态定义为存储系统整体的状态变量空间S,各功能模块失效与否状态序列定义为存储系统整体的观测变量空间O,O中的状态通过步骤3中的存储系统功能模块的可靠性评估结果计算得到,利用HMMMS模型对存储系统整体的可靠性进行评估。本专利技术与现有技术相比,其显著优点为:1)本专利技术采用分级建模的形式,以存储系统功能模块为单位,为存储系统建立可靠性模型,模型清晰,易于理解;2)使用了隐马尔可夫模型描述可靠性模型,明确可存储系统整体与各功能模块之间的联系;3)继承了Z语言强大的数据约束能力和良好的可扩展性,可以对概率进行描述,并能方便的添加可靠性元素。下面结合附图对本专利技术作进一步详细描述。附图说明图1为基于Z语言的存储系统抗软错误可靠性建模与评估方法流程图。图2为存储系统相关模块及包含组件抽象图。图3为隐马尔可夫模型示意图。图4为存储系统功能模块的状态转移关系图。图5为典型存储系统功能模块状态转移图,其中图(a)为MFM典型状态转移图,(b)为瞬时状态简化后的状态转移图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。为了更加准确地描述存储系统可靠性的动态可观测特征与隐含的状态的相关性,并对其进行严格的可靠性评估,本专利技术采用可以严格描述数据约束的Z语言来对存储系统硬件的可靠性进行分级建模,以存储系统功能组件为单位为其建立可靠性模型Z-MFM-RM;利用HMM的状态、观测值与时间的连续性特征,将Z-MS-RM刻画为HMMMS,并基于HMMMS来严格评估存储系统可靠性。结合图1,本专利技术提供了一种基于Z语言的总线抗SEU的可靠性建模与评估方法,所述方法包括以下步骤:步骤1,根据存储系统MS结构划分存储系统功能模块MFM,并根据Z语言规范,对存储系统进行分级建模,得到可靠性模型,包括存储系统可靠性模型Z-MS-RM和其子模型存储系统功能模块可靠性模型Z-MS-RM;步骤2,采用隐马尔可夫模型HM本文档来自技高网
...

【技术保护点】
1.一种基于Z语言的存储系统抗软错误可靠性建模与评估方法,其特征在于,所述方法包括以下步骤:/n步骤1,根据存储系统MS结构划分存储系统功能模块MFM,并根据Z语言规范,对存储系统进行分级建模,得到可靠性模型,包括存储系统可靠性模型Z-MS-RM和其子模型存储系统功能模块可靠性模型Z-MFM-RM;/n步骤2,采用隐马尔可夫模型HMM描述Z-MS-RM模型,为存储系统建立HMM

【技术特征摘要】
1.一种基于Z语言的存储系统抗软错误可靠性建模与评估方法,其特征在于,所述方法包括以下步骤:
步骤1,根据存储系统MS结构划分存储系统功能模块MFM,并根据Z语言规范,对存储系统进行分级建模,得到可靠性模型,包括存储系统可靠性模型Z-MS-RM和其子模型存储系统功能模块可靠性模型Z-MFM-RM;
步骤2,采用隐马尔可夫模型HMM描述Z-MS-RM模型,为存储系统建立HMMMS模型;
步骤3,根据连续时间马尔可夫链CTMC计算存储系统功能模块的失效率,对存储系统功能模块的可靠性进行评估;
步骤4,将存储系统失效与否状态定义为存储系统整体的状态变量空间S,各功能模块失效与否状态序列定义为存储系统整体的观测变量空间O,O中的状态通过步骤3中的存储系统功能模块的可靠性评估结果计算得到,利用HMMMS模型对存储系统整体的可靠性进行评估。


2.根据权利要求1所述的基于Z语言的存储系统抗软错误可靠性建模与评估方法,其特征在于,步骤1中存储系统功能模块可靠性模型Z-MFM-RM表示为一个四元组:
Z-MFM-RM=(FRateMFM,StateMFM,STRMFM,t)
式中,FRateMFM表示存储系统功能模块的失效率,StateMFM表示存储系统功能模块的状态空间,STRMFM表示状态转移关系,t表示时刻。


3.根据权利要求2所述的基于Z语言的存储系统抗软错误可靠性建模与评估方法,其特征在于,步骤1中所述存储系统包括存储模块MM、数据寄存器MDR、地址寄存器MAR和内存控制器MC共四个功能模块,上述模块的失效率分别用λMM、λMDR、λMAR和λMC表示;其中,所述存储模块MM包括存储体BA、地址译码器AD、行缓冲区RB共三个组件,则存储模块MM的失效率λMEM为:
λMM=1-(1-λBA)(1-λAD)(1-λRB)
式中,λBA、λAD和λRB分别为组件BA、AD和RB的失效率;
同理可获得λMDR、λMAR和λMC。


4.根据权利要求3所述的基于Z语言的存储系统抗软错误可靠性建模与评估方法,其特征在于,步骤2中所述HMMMS是一个六元组,如下所示:
HMMMS=(I,Q,aij,bij,π,t)
其中,
(1)I表示长度为T的状态序列,记作I=(i1,i2,...,iT),
(2)Q表示I对应的观测序列,记作Q=(q1,q2,...,qT);
(3)aij表示隐含状态转移概率,即存储系统在各个状态间转换的概率,记为矩阵A=[aij]N×N,其中:
aij=P(it+1=sj|it=si),i≤j,j≤N
表示在任意时刻t,若状态为si,则在下一时刻状态为sj的概率,N表示总时间;
(4)bij表示HMMMS的输出观测概率,即模型在当前状态下取得各个观测值的概率,记为矩阵B=[bij]M×M,其中:
bij=P(qt=oj|it=si),1≤i≤N,1≤j≤M
表示在任意时刻t,若状态为si,则观测值oj被获取的概率,M表示表示总时间;
(5)π表示HMMMS的初始状态概率,模型在初始时刻各状态出现的概率,记为π=(π1,π2,...,πN),其中:
πi=P(i1=si),1≤i≤N
表示模型的初状态为sj的概率;
(6)t表示时刻;
对于HMMMS,qt∈Q表示第t时刻的存储系统功能模块状态序列,取值范围为O=(o1,o2,...,oN),oi表示第i个状态序列,N=2n,n为功能模块的数量,以0表示正常状态,以1表示失效状态;it∈I表示第t时刻存储系统的状态值,即存储系统是否失效,取值范围为S=(s1,s2,...,sM)={0,1};
在任一时刻,观测变量的取值仅依赖于状态变量,即qt依赖于it,与其他状态变量及观测变量的取值无关;同时,t时刻的状态it仅依赖于t-1时刻的状态it-1...

【专利技术属性】
技术研发人员:庄毅刘阳晏祖佳顾晶晶
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1