组合模型是计算机容错系统可靠性最常用的方法。一个系统只要满足以下条件,就可以用组合模型来计算其可靠性。作如下假设。
(1)系统只有两种状态:运行状态和失效状态。
(2)系统可以划分成若干个不重叠的部件,每个部件也只有两种状态:运行状态和失效状态。
(3)部件的失效是独立的。
(4)系统失效当且仅当系统中的剩余资源不满足系统运行的最低资源要求(系统的状态只依赖于部件的状态)时。
(5)已知每个部件的可靠性,可靠性指可用度或可靠度等概率参数。组合模型的目标就是根据各部件的可靠性 Ri(t)来计算系统的可靠度 Rsys(t),组合模型的基本思想如下。
1.枚举所有系统状态
假设系统被划分为 n 个部件,则系统状态是一个 n 维向量, q = (s1,s2 ,---,sn ) ,其中:
si={0,如果部件 i 处于运行状态;1,如果部件 i 处于失效状态( i = 1, 2,---, n )},一个具有 n 个部件的系统共有 2 n 个状态。
2.计算每个系统状态的概率系统状态的概率是指系统处于该状态的概率。设系统状态 q = (s1,s2 ,---,sn ) ,q 的所有 0分量对应的部件用 A0 来表示( A0 是所有处于运行状态的部件的集合),q 的所有 1 分量对应的部件用 A1 来表示( A1 是所有处于失效状态的部件的集合)。于是,系统状态的概率为:
3.可靠性计算直接计算一个复杂系统的可靠性是很困难的,通常的方法是把整个系统分解为简单的子系统,通过子系统的组合来计算整个系统的可靠性。
(1)串联系统。在一个由 n 个模块(部件)构成的系统中,如果系统中任意一个模块失效将导致系统失败(系统的最低资源要求是所有模块全部运行,只有全 0 系统(0,0,…, 0)能够使系统运行)。
用随机变量 ξi 表示模块 i 发生失效的时间,用随机变量 ξs 表示系统发生失效的时间,则 ξs 可表示为:
则系统可靠度为:
其中, Ri(t)是模块 i 的可靠度,串联系统的可靠度是各个模块可靠度的乘积。这种系统可抽象地看成一个如图示的串联系统,因此,上式称为串联可靠性公式。
串联系统的失效率为:
其中, Qi(t) =1− Ri(t) 是模块 i 的失效概率。
(2)并联系统。在一个由 n 个模块(部件)构成的系统中,只要有一个模块可运行,系统就可运行(系统的基本资源是一个模块,除了全 1 系统状态(1,1,1,…,1)外,系统都是可运行的),因此:
系统的失效概率分布函数可以表示为:
其中 Qi(t) 是模块i的失效分布函数。
并联系统的可靠度为:
其中,Qi(t)=1-Ri(t) 是模块 i 的失效概率
这种系统可抽象地看成一个如图 所示的并联系统,因此,上式称为并联可靠性公式。
(3)串并联系统。如果一个系统由 N 个子系统并联而成,而每个并联的子系统又由 n个元件串联而成,这样的系统称为串并联系统。
设第 j 个子系统的第 i 个元件的可靠度为Rij(i=1,2,L,n;j=1,2,L,N),则该串并联系统的可靠度为:
如果Rij 全相等为 R,则:
马尔柯夫模型的两个核心概念是状态和状态转移。系统的状态表示了在任何瞬间用以描述该系统所必须知道的一切。对于可靠性分析,马尔柯夫模型的每个状态表示了有效和失效模块的不同组合。如果每个模块都是处于有效和失效两种情况之一,则一个 n 模块系统的完整模型有 2 n 个状态。
状态转移是指随着时间的流逝,因模块的失效和修复,系统发生的状态变化。
作为马尔柯夫模型基础的基本假设是:给定状态的转移概率仅取决于当前的状态。系统从一个状态 i 转移到另一个状态 j 的转移率定义为单位时间内从状态 i 转移到状态 j 的概率。对于一个模块来说,从运行状态到失效状态的转移率就是模块的失效率,从失效状态到运行状态的转移率就是模块的修复率。一个失效率为 λ,修复率为 μ 的模块的状态图如图所示。
对于由 n 个模块构成的系统,共有 2 n 个状态。从理论上说,任意两个状态之间都存在转移的可能性。但因失效是独立的,在很短的时间内发生多个失效的可能性远小于发生一个失效的可能性。因此,只考虑任一时刻只有一个模块失效的转移;同样,也只考虑任意时刻只有一个模块修复的转移。系统的状态图也可以表示为层次图。第一层只有一个状态,对应于所有模块都运行的情况;第二层有 n 个状态,对应于一个模块失效的各种情况;第i +1 层有 Ci 个状态,对应于 n 个模块中有 i 个失效的各种情况;第 n+1层也只有一个状态,对应于全部模块都失效的情况。
根据系统的状态图,可以计算出系统处于任意状态的概率。
设系统在 t 时刻处于状态 0 和 1 的概率分别为 P0(t)和 P1(t),于是,在 t + Δt 时刻系统处于 0 状态的概率为:
同样,在 t + Δt 时刻系统处于 1 状态的概率为:
令 Δt → 0 取极限,得微分方程组:
其中,Pi(t) 是 Pi(t) 对 t 的一阶导数( i = 0,1 )。
只要解此微分方程组就可以得出 P0(t)和 P1(t)。
对于有 n 个状态的状态图,设状态 i 到 j 的转移率为αaij。考虑其中的任意一个状态 j,其他状态到 j 的转移和 j 到其他状态的转移,系统在 t + Δt 时刻,处于状态 j 的概率可以表示为:
由此可得:
用矩阵方程把 Pj(t)( j = 1, 2, , n) 全部表示出来就是:
P (t) =T ⋅ P(t)
或
其中, T 称为状态转移矩阵,其对角线上的元素:
这一矩阵方程称为查普曼—科尔莫戈罗夫(Chapman-Kolmoqorov)方程,由它可解出系统处于任意状态的概率。解方程最常用的是拉普拉斯变换解法。
马尔柯夫模型是计算系统可靠性的强有力工具,用组合模型能计算的可靠性,用马尔柯夫模型也能计算,马尔柯夫模型还能计算许多组合模型不能计算的可靠性。
个人技术集锦还为您提供以下相关内容希望对您有帮助:
系统架构设计师考试知识点有哪些?
5.安全性与可靠性技术4.1 信息安全与保密加密和解密身份认证(数字签名、密钥、口令)访问控制安全保密管理(防泄漏、数字水印)安全协议(SSL、PGP、IPSec)系统备份与恢复防治病毒4.2 系统可靠性可靠性设计(容错技术、避错技术)可靠性指标与评估4.3 安全性规章与保护私有信息规则信息系统安全法规与制度计算机防病毒制度保护...
2020年软考考试大纲:系统架构设计师考试大纲
分析设计图示(DFD、ERD、UML、流程图、NS 图、PAD) 结构化分析与设计 模块设计 面向对象的分析与设计 I/O 设计、人机界面设计 设计模式 3.6 基于构件的开发 构件的概念与分类 中间件技术 典型应用架构(J2EE、.NET) 3.7 应用系统构建 应用系统设计与开发(分析与设计方法的使用、外部设计、内部设计、程序设计、测试...
系统架构设计师案例分析考什么?
异构分布式系统的互操作性设计;7.嵌入式系统设计;实时系统和嵌入式系统特征;实时任务调度和多任务设计;中断处理和异常处理;嵌入式系统开发设计;8.系统的可靠性分析与设计;系统的故障模型和可靠性模型;系统的可靠性分析和可靠度计算;提高系统可靠性的措施;系统的故障对策和系统的备份与恢复;9.系统...
系统分析师的主要考试内容
1、信息系统基础知识信息系统概念信息系统的功能、类型、结构信息系统的生命周期,各阶段的目标和主要工作内容信息系统建设的原则信息系统开发方法2、需求分析和设计方法分析设计图示(DFD、ERD、UML、流程图、NS图、PAD)面向对象设计(继承、抽象、代理、封装、多态)结构化分析设计模块设计(内聚、耦合)I/O设计(报表设计、...
系统可靠性设计与分析内容简介
全书共10章,内容包括系统可靠性的基本概念、不可修复系统和可修复系统可靠性、可靠性分配与预计、故障树分析、电子产品可靠性设计与分析、机械可靠性设计原理、机械可靠性优化设计、可靠性试验与综合评定、系统储存可靠性等。该书内容阐述循序渐进,由浅入深,理论联系实际,具有较强的系统性和逻辑性。第1...
系统分析师要具备哪些知识
系统的故障模型和可靠性模型系统的可靠性分析和可靠度计算提高系统可靠性的措施系统的故障对策和系统的备份与恢复系统分析的实用技术流行的系统分析方法论系统设计需求建模的步骤用例驱动的开发方式结构化建模技术、数据流图面向对象建模技术数据库建模系统设计处理流程设计系统人机界面设计数据库管理系统的选择与数据库设计...
什么是FRACAS
什么是FRACAS由世界著名的可靠性公司一一美国RELEX公司推出的FRACAS(故障报告、分析和纠正措施,Failure Report Analysis and Corrective Action System,缩写为FRACAS)专业系统软件,通过报告产品的故障,分析故障
什么是系统的可靠性计算?
定量分析是指根据数据和数学模型进行分析计算,得到具体数据的可靠性指标,常用的有故障树分析法、事件树分析法、风险矩阵法等;定性分析是指通过专家判断、经验积累等方式进行质的分析,主要用于灵活性高的系统或数据缺乏时的可靠性分析。其中,常用的可靠性定量分析公式包括:1.故障率(Failure Rate):...
怎样计算计算机系统的可靠度
怎样计算计算机系统的可靠度?结合案例某计算机系统的可靠性结构是如下图所示的双重串并联结构,若所构成系统的每个部件的可靠度为0.9 ,即R=0.9 ,则系统的可靠度为()?|---(R)———(R)---| ———| |-- |---(R)---(R)---| 类似于串两个电阻,在并两个电阻...
可靠性怎样计算?
可靠性是指系统在规定条件下和规定时间内完成规定功能的能力。要计算可靠性,通常需要考虑以下几个关键因素:1. 失效概率:可靠性计算的核心是了解系统或组件的失效概率。这通常通过收集和分析历史数据,如故障率、平均无故障时间(MTBF)等来评估。例如,如果一个设备的MTBF为1000小时,那么在1000小时内...