电子产品MTBF的意义及工程化计算方法
冯敬东,来萍
(信息产业部电子第五研究所,广东
广州
510610)
摘要:对电子产品平均无故障工作时间(MTBF)的实际意义进行了深入的探讨,旨在使业界能正确理解这
一表征电子产品可靠性的常用概念;并通过大量的案例,介绍了MTBF的工程计算方法,以期能为业界人士提供帮助。
关键词:平均无故障工作时间;案例;工程计算中图分类号:TB114.3
文献标识码:A
文章编号:1672-5468(2008)02-0015-10
DiscussiononActualMeaningandCalculatingMethod
ofMTBFforElectronicProduct
FENGJing-dong,LAIPing
(CEPREI,Guangzhou510610,China)
MeanTimeBeforeFailure(MEBF)”forelectronicproductAbstract:Theactualmeaningof“
isdiscussedhereinorderthatthisconceptthatmainlydescribethereliabilityoftheproductscan
becorrectlyunderstoodinthisfield.CalculatingmethodofMTBFinthereliabiltyengineeringisintroducedandsomecasesarealsopresented.
Keywords:MTBF;cases;calculating
method
1
引言
在电子工业界,几乎每个人都熟悉的一个术语
性与环境试验研究所出版的《可靠性数学》一书的结果,所有的公式均无推导过程,如希望了解公式推导过程请参考相关的书籍。除有说明外,文章列举的公式和计算均采用指数分布公式。
叫“平均无故障工作时间”(简称MTBF),这是表征产品可靠性的一个重要参数。但是,这个术语经常被错误地解释和使用。本文仅希望通过对
2MTBF的意义和概念误区
MTBF(MeanTimeBetweenFailure)其直译是
失效之间的平均时间”平均无“,用中文解释就是“故障工作时间”小时”为单。这个时间一般是以“位计算。对于一批产品来说,MTBF这个技术指标
MTBF实际意义的探讨和具体的计算,使业界能正
确理解MTBF概念;同时也使消费者了解这一电子行业常用的可靠性术语。
文中所用的公式直接引用了中国电子产品可靠
收稿日期:2007-10-19修回日期:2007-10-25
作者简介:冯敬东(1954-),男,湖北安陆人,信息产业部电子第五研究所可靠性研究分析中心、电子元器件可靠性物理及
其应用技术国家级重点实验室高级工程师,主要从事电子产品可靠性研究工作。
YUSHIYAN
15
电子产品可靠性与环境试验2008年
越高,则这批产品的可靠性就越好,出故障的可能性就越低。但要明确以下几个认识:
平均无故障工作时间”和“无故障工作时2.1“
间”是两个不同的概念
平均无故障工作时间”表示的是一批产品无“
故障工作时间的平均值,
无故障工作时间”是指“
批产品第一次出现故障前的工作时间。某批产品的可靠度随时间变化的曲线如图1所示。从中可以看出,当一批产品的可靠度R为1时的这段时间才是“无故障工作时间”平均无故,约200h,而“障工作时间”约为1200h(计算如例2所示)。
r30=10+20+30=60
答:产品的MTBF为30h,工作到30h时相
应的失效数为60台。
由此可见,这批产品在平均无故障工作时间(MTBF)30h时已有60台失效了,无故障工作的产品仅有40台。所以上面的说法应改为“MTBF为45000h的产品批,在连续运行5年多的时间里,约有60%的产品会发生硬件故障。”
上面的例子主要是说明产品的MTBF和失效数量的关系,重点是通过简单例子的解释来明确什么是“平均无故障工作时间”和“无故障工作时间”,避免由于失效分布的解释而引起主要概念的模糊。再看看下面的一个统计失效的例子。
例2:抽取80个样品进行全寿命试验,失效时间和相应的失效数量整理后如表1所示,估计这批产品的MTBF。
表1产品失效统计表
组号
失效时间范围/h
组中值/h
失效数/n
12
图1某批产品的可靠度随时间变化的曲线
4000~400~800800~120016001200~20001600~2000~240028002400~2800~3200
200600100014001800220026003000
31826159621
345678
如果产品的MTBF指标达到45000h,意味“
着如果1台机器24h开机连续正常运行,大约平均可以运行5年(8760h/年)多的时间不发生硬件故障。”这是经常出现在产品宣传中的一句话,它就是通过混淆以上两个概念来误导消费者的,让无故障工作时间”消费者认为MTBF就是“;这同时也使许多可靠性专职人员无从判断什么是MTBF的真实意思。以下的例子,通过了解MTBF与失效数量的关系,从而明确这两个概念的区别。
例1:从一批产品中抽取n=100件样品进行试验,工作10h的失效数(r1)10台,20h失效数(r2)20台,30h失效数(r3)30台,40h失效数(r4)40台,至此所有的产品全部失效,求该产品的MTBF和相应的失效数。
解:产品在试验中全部失效,满足全寿命试验,可代入公式:
(1)MTBF=T/n=(nt1+nt2…….+nti)/n
得出:MTBF=(10×10+20×20+30×30+40×40)/100=3000/100=30h
工作到30h的失效数r为:
解:试验样品全部失效,满足全寿命试验,先求出80个样品的总工作时间T:
T=(200×3)+(600×18)+(1000×26)+……+(3000×1)=96000h再求这批样品的MTBF:
MTBF=T/n=96000/80=1200h答:这批样品的MTBF为1200h。
在这个例子中,我们通过失效时间和数量的直方图(如图2所示)可以看出,失效的分布形态是对数正态分布,我们可以求出MTBF在1200h时样品的失效数量大于47台,失效比例约为样品总数的60%。
这两个例子充分说明了“平均无故障工作时间”和产品失效数量的关系,即当一批产品在达到平均无故障工作时间时,约有60%的产品会发生硬件故障。实际上在各种失效分布形态中求出的
CHANPINYU
第2期冯敬东等:电子产品MTBF的意义及工程化计算方法
瞬时”这两个字。MIL-便,在业界通常去掉了“
HDBK-338标准中所提到的平均失效率(指浴盆曲
线的盆底阶段)也仅是针对盆底阶段的平均值,未考虑损耗阶段。这样从产品的整个使用阶段看还是瞬时失效率的概念。
业界常用元器件的失效率(10-n/h)来表征产品的可靠性,是指在元器件工作一小时内的失效
图2失效样品的直方图
率。当然产品工作一年或两年其失效率都是不一样的。这就是为什么钽电容的基础失效率以0.5%
平均无故障工作时间”“,其对应的失效数量约占总数的50%~60%。
1000h来表示而不用5×10-6/h表示。因此,单纯
地通过瞬时失效率来表征产品的终了寿命是不行的(哪怕是指数分布),事实上MTBF根本就不是为了求证产品的终了寿命而提出的。举一个简单的例子来说明,我们在大学学生中统计年死亡率为0.02
2.2MTBF与产品的平均终了寿命是不能等同的概念
曾经有文章说当前半导体器件的失效率(λ)已经可以达到10/h,根据MTBF=1/λ的公式计算
-10
下来其寿命可以达到112万年,这种说法就是将
%,在老人院中统计年死亡率为2%,如果以此数
据代入求终了寿命就存在100倍的差别,明显地不符合实际的情况。因此,不能简单地用瞬时失效率来表征产品的终了寿命。
但是,很显然这两组人群的健康程度(不考虑年龄)是不一样的,就像产品一样,好的产品年失效率为0.02%,而差的产品年失效率为2%,那么评价这两组产品哪一组更“健康”,更能够可靠工作的“平均无故障工作时间”就有意义了。
MTBF与器件的平均终了寿命等同看待才会出现
的。试想想一个器件别说工作了,就是放置112万年还剩下些什么?
在这里,失效率(λ)被引入了计算,因此,我们必须了解什么是失效率,失效率的定义是“已工作到t时刻的产品,在时刻t后单位时间内发生失效的概率,称为该产品在时刻t的失效率函数,又称为失效率”。失效率计算公式为:
λ(t)=△n(t)/△t[N-n(t)]
看看下面的例子是如何计算失效率的。
(2)
2.3可靠性学科中的寿命和MTBF的意义2.3.1可靠性学科中的寿命和平均寿命
可靠性学科中的产品寿命与公认的寿命是有区别的,公认的寿命是指自然或不自然的消亡,在生命过程中的生病、意外伤害是不影响寿命统计的。但在可靠性学科中,产品的寿命是指产品从开始工作到发生故障的一段时间,发生故障的原因可能是一个焊点的脱开或是一个器件的失效,都被认为是产品寿命的结束,当故障修复后产品的寿命被重新统计计算。具体地说就是可靠性学科中的产品寿命,不是指产品报废前的工作时间,而是发生故障前的一段时间。
事实上,在可靠性学科中常被提起的“平均无故障工作时间”就是平均寿命,只不过这个平均寿命与公认的平均寿命是有区别的,它不表示产品的消亡和报废的平均时间,而只表示产品能正常工作的平均时间。
在可靠性学科中,与公认的平均寿命概念相同的是“平均无故障时间”(MeanTimeToFail-
例3:如图3所示,100个试验样品,试验到时刻t1=500h共失效10个,再继续试验t2=50h仅一个样品失效,求在时刻t0和t1的失效率。
图3失效的线段图
解:代入失效率的公式,则有:
λ(t0)=48/500×100=0.00096
λ(t1)=1/50×(100-48)=0.00038
答:在时刻t0和t1的失效率分别是0.00096和0.00038。
通过以上的例子可以看出,失效率在不同的阶段是不同的。必须明确的是,失效率的准确意思是指瞬时失效率,这个瞬时失效率在不同的时刻是不同的,所以说失效率是时刻t的函数,为了使用方
YUSHIYAN
17
电子产品可靠性与环境试验2008年
ures),简称MTTF,它一般用来表征一次消亡或报
废的产品(如元器件产品)。由于MTBF和MTTF在计算方法上一致,因此,很容易将两者的寿命概念也等同看待,这就是解释不清MTBF和MTTF区别的主要原因,也是导致产品寿命的定义和公认寿命意义混淆的原因。
泛使用。
上面所提到的几个可靠性学科中的寿命概念,在制定产品的可靠性指标或对产品寿命进行估算时会经常使用。尤其是在制定产品的寿命指标时,需要特别注意可靠水平r的取值,r取值的高低会直接反映产品完成任务的能力(计算见例9题)。
2.3.2可靠寿命、中位寿命与特征寿命
一批产品的可靠度R(t)是时间的函数,随着时间的延长,这批产品的可靠度会越来越低。假定开始工作时t=0,可靠度R(0)=1。以后在不同的时刻,产品的可靠度将具有不同的r值(如图
3MTBF常用的计算途径
一个产品在设计、生产、材料、运输、保存、使用环境中存在各种不确定的因素,使得产品的寿命成为随机变量,对于随机出现问题的时间,可通过各种统计计算得出,通常MTBF可以通过以下3种计算途径求出。
4所示)。在可靠性工作中经常需要知道,对于给
定可靠水平r,产品的可靠度下降到r时的时间tr是多少?这个时间tr就被称为产品的可靠寿命,用可靠度公式表示为:
3.1可靠性预计计算
预计产品MTBF的好处是:首先,在产品设计阶段就可以满足客户的制造要求;其次,对生产方而言,可使其以最少的费用对预计的产品弱点进行关注和改进。目前国内有3个普遍被接受的标准用来计算MTBF:军品和高可靠产品大都采用MIL-
R(tr)=r
的关系为:
(3)
当失效服从指数分布时,可靠寿命tr与失效率
tr=2.302(lg1/r)/λ(4)
STD-217FN2和GJB299B这两个标准,民用产品
则用Bellcore方法。MIL-STD-217FN2是根据美国可靠性分析中心和罗姆试验室多年的工作经验而制定的,其最新版本为217-F2;GJB299B是由信息产业部电子第五研究所根据国内电子元器件使用失效率所总结出的中国自己的预计标准,其最新版本为GJB299C;Bellcore版本则是由AT&T与Bell实验室提出并成为商用电子产品MTBF值计算的行
图4可靠性的寿命曲线
业标准。
上述的3个标准都包括了用于典型电子产品中元器件的失效率模型,比如IC、二极管、晶体管、电容器、继电器、开关和连接器。这些元器件的失效率都是以各国和各厂家实际应用中获得的、最适用的数据为依据的,在对产品进行可靠性预计时可以直接查找。军标和Bellcore版本之间虽有几个不同点,但计算的方式基本上没有太大的差别,其中较明显的一个不同点是失效率的表示法,MIL-
当可靠水平r=0.5时,即可靠度为一半时有
R(t0.5)=0.5,此时称为中位寿命,此时产品约有
一半失效了。实际上,如果产品寿命服从标准正态分布,此时的均值μ就是中位寿命,就是“平均无故障工作时间”或是平均寿命;如为对数正态分布或指数分布时,中位寿命不等于平均寿命。
当可靠水平r=exp(-1)=0.368时,称为特征寿命。在指数分布时,特征寿命与平均寿命重合,即等于MTBF,所以有MTBF=1/λ的简单计算公式。虽然公式简单,但由于指数分布符合大部分整机的失效分布形式,因此它在很多计算场合被广
STD-217和GJB299B都将失效率表示为:失效次
数/10-6h,而Bellcore失效率表示为:失效次数/
10-9h。此外,MIL-STD-217将环境对失效率的影
响概括成14种类型,而Bellcore标准则概括成5种类型。但是这些不同点并不影响我们对预计计算
CHANPINYU
第2期冯敬东等:电子产品MTBF的意义及工程化计算方法
方法的掌握和了解。
在预计的方法上,针对整机可靠性试验的失效模式多为指数分布的情形,各标准所采用的是产品中所有元器件的使用失效率累加后代入MTBF=1/λ的公式,求出MTBF。当然计算时要考虑的失效率修正系数相当多和复杂,事实上预计的准确度与各种修正系数(π——环境系数、π——质量系数、e—q———电流额定值系数、π——应用系数、π——πr—a—s—电压应力系数、π——配置系数等)关系密切,因c—此,预计人员对失效率模型和修正系数的掌握和了解程度是准确预计的关键。在国外的文献中曾报道过,一个相同的产品由不同的可靠性预计人员计算,其MTBF值可以有一到几个数量级的差别。可这并不说明可靠性预计没有价值,反而说明准确预计需要相当有经验的预计人员。纵观目前的预计人员多为可靠性质量管理人员,甚至有些预计人员对产品的工作原理并不明白,对元器件的典型失效现象也不清楚,这样算出的可靠性预计值当然是没有价值的。这是题外话以后另外讨论。
我们看看下面的例子是如何通过可靠性预计的方法来求出MTBF的。
例4:通过表2各元器件的失效率和使用量,求出该产品的MTBF。
表2所列的是一个产品构成的主要元器件,(显然这个例子并不像一个产品的元器件构成要素,
失效率也省略不少修正系数和环境因素,但通过这些计算可以解释可靠性预计的方法)。其中功率管
T的失效率λ=0.5645×10-6h,在这个产品中共使
用了5个,失效率的总和=0.5645×5=2.823,其它各项也如此计算,最后我们将各项的失效率总和累加,求出该产品的累计失效率为31.74,代入
MTBF=1/λ公式得出:
MTBF=1/1000000×31.74=31505h
由计算和统计表可以看出,有两项内容直接影响了累计结果,一是失效率的大小,二是元器件数量的多少。设计人员可以通过对C3类电解电容的重新选型和降额设计来减少失效率,或通过减少
C3的使用数量(简化设计)来减少累计失效率,
使产品的MTBF更高。
目前有不少预计软件也提供电子产品可靠性的计算,例如:以失效率预计方法编制的MTBFcal软件就提供了完善的MIL-HDBK-217F2和Bellcore两种标准的分析环境和相应的器件库,使得预计工作的操作更为简单和方便。
但要明确的是,这些预计的结果都是产品的设计期望,也就是我们常说的“潜在可靠性”,最终这些预计结果还是需要经过对产品实际工作的检验来验证,这个验证无论是由生产方进行还是由独立的第三方实验室进行,都是在试验室的条件下完成,因此,MTBF的第2种计算方法是实验室试
验。
表2一个产品的失效率统计表(失效率单位“1×10-6h)
名称功率管:T全桥:B
规格
失效率/λ
数量
失效率总和
3.2实验室试验和计算
产品设计结束后必须通过元器件的采购控制和生产工艺的保证,才能生产出好的产品,这时产品具有的可靠性被称为“固有可靠性”,这是无论是生产方还是使用方都急需了解的。在产品设计定型阶段和量产阶段,生产单位一般是通过实验室试验来对产品进行可靠性寿命评价。因此,实验室试验是产品研制单位和使用单位了解产品可靠性、获得可靠性数据最常用的途径。
实验室的可靠性寿命评价
0.5645
1.5A/600V
0.76190.5876
100℃105℃105℃105℃
0.72570.19672.27200.66941.20300.0262
1.0A/200V1.0A/1000V
0.58760.5876
525215101115
2.8231.5242.9381.4510.19711.3606.6941.2030.0260.5882.93831.74
肖特基二极管:D410.0A/100V电解电容:C1电解电容:C2电解电容:C3电解电容:C4场效应管:Q1电感:L1
整流二极管:D2整流二极管:D1累计失效率
YUSHIYAN
33uf/400V0.22uf/275V680uf/16V100uf/16V4.0A/600V
19
电子产品可靠性与环境试验2008年
试验具有一定的破坏性,因而不可能对所有的产品都进行试验,而且这样的工作量也确实太大了。因此,通过实验室试验来获取试验样品的基本方法是,从同型号(同批次)有限的一批产品中抽取一部分产品来进行试验,这些产品在可靠性术语中被称为“子样”(或“样本”),其中的每个产品被称为“样品”。显然从概率统计的观点看,抽取的试验样品数量越多,就越能真实地反映该批产品的可靠性水平。
在前面的例1、例2中,我们可以观察到,所抽取子样的每个样品在试验中最终都失效了,这种试验被称为全寿命试验。全寿命试验的MTBF计算只需采用简单的算术平均值(又称平均寿命的点估计值)的计算就可以了。事实上全寿命试验需要试验样品在试验过程中全部失效,所需要的试验时间可能长达几年、十几年甚至几十年,因此,这种算术平均值的计算方法在很大程度上仅仅是作为认识和了解MTBF概念(当然产品的寿命时间都比较短时是可用的)而言。
在实际的寿命评价试验中,由于试验时间和失效数量的不确定性,在整个试验过程中,试验样品往往无失效或部分失效时,就需要采用截尾试验的方法,截尾试验可分为定时截尾试验(试验到规定的时间而中止)或定数截尾试验(试验到出现规定的故障数或失效数时而中止),这两类试验方法是实验室估算MTBF最为常用的试验方法。
在截尾试验中,通过部分失效的样品和较短的试验时间来推算整批产品的MTBF时,需要涉及大
量的概率论知识。所幸的是研究可靠性的数学前辈们在通过大量统计的基础上,给出了3种可用于估算仅有部分产品失效或未失效的MTBF计算方法的公式,它们分别是“平均寿命的点估计”双侧、“置信区间估计”和“单侧置信下限估计”。
通过这3种涉及概率统计方法计算出的MTBF结果,可信度是一个大问题。为解决这个问题提出了“置信度”的概念,其含义是:通过计算对未知的参数θ(平均寿命)估计出一个取值的范围,如的取值会以一定的(θL,θU)的区间,而未知参数θ概率落入这个估计区间的范围内,这个概率值就被称为数值估计的“置信度”或“置信水平”,以字母C来表示。而不落入估计区间的的概率被称为数值估计的“风险度”或“显著性水平”,以字母
α表示,它们之间的关系如下:
C=p(θ≤θL≤θU)=1-α
下面是3种定时截尾无替换样品的平均寿命估计公式,这些计算公式需要查X2(α,2r+2)分位数表(如表3所示)来计算。
a)点估计
(5)
b)双侧区间估计
(6)
c)单侧置信下限估计
(7)
表3X2分位数表(部分)
自由度
显著性水平
0.99
123456
0.9750.950.90.0160.2110.5841.0641.612.204
0.80.0640.4461.0051.6492.3433.07
0.750.1020.5751.2131.9232.6753.455
0.50.4551.3862.3663.3574.3515.348
0.251.3232.7734.1085.3856.6267.841
0.21.6423.2194.6425.9897.2898.558
0.12.7064.6056.2517.7799.23610.64
0.053.8415.9917.8159.48811.0712.59
0.0255.0247.3789.34811.1412.8314.45
0.016.6359.2111.3413.2815.0916.81
0.00110.8313.8216.2718.4720.5222.46
2E-041E-030.0040.020.1150.2970.5540.872
0.0510.2160.4840.8311.237
0.1030.3520.7111.1451.635
CHANPINYU
第2期冯敬东等:电子产品MTBF的意义及工程化计算方法
式中:T——总试验时间;——失效数;r—
——样本量;n—
———显著性水平;α
——自由度;2r+2—
——分位数表。X2—
一般情况下,MTBF的评价试验仅抽取一次试验样本进行,那么试验结果就有可能会存在偏差,即存在试验的计算结果与产品的实际寿命不一致的情况。为了保证试验结果在大部分情况下能反映产品的实际情况,就需要提高计算的置信水平(置信度)。但置信水平提高后,双侧区间的范围会加大,单侧置信下限估计值也会降低。因此,使用以上公式时要注意,如果需要保证试验结果的置信度,估算的寿命结果就会随置信度的提高而降低,特别需要指出的是点估计值是没有置信度可言,这个结论可看下面的例子。
以下是在试验过程中无失效和少量失效时,估算MTBF的例子。
例5:一批产品抽取45个样品进行3个月的寿命试验,在试验过程中无失效,求平均寿命M的置信水平为80%的单侧置信下限;如果3个月时仅有一个样品在500h失效,求MTBF的点估计值以及置信水平为80%的双侧置信区间和置信水平为90%单侧置信下限。
解1:由于试验过程无失效r=0,显然如果利用点估计计算公式MTBF=T/r=∞,就得出MTBF为无穷大,肯定是不正确的。但在定时截尾寿命的试验场合,还是可以通过单侧置信下限公式计算和查X2分布表,求出其一定置信水平下的单侧置信下限。
2θL=2T/X(1-c,2r+2)=
解3:置信度为80%的双侧置信区间:
2
θL=2T/X((1-c)/2,2r+2)=
2×95540小时/7.779=24564h
2θU=2T/X((1+c)/2,2r+2)=
2×95540h/1.064=179586h
答:MTBF的双侧置信区间的下限是24564
h,上限为179586。
解4:置信度为90%的单侧置信下限:
θL=2T/X2((1-c),2r+2)=
2×95540h/7.779=24564h
答:MTBF的单侧置信下限为24564h。讨论上面的估算结果可以发现:
1)试验中无样品失效时,只能采用单侧置信
下限来估算平均寿命;
2)单侧置信下限和点估计的计算结果相差很
大,这是因为点估计值往往是最大可能的结果,计算的数值虽不保守,但没有置信度;
3)当估算的置信下限相同时(解3、解4),
单侧置信下限的置信度是90%,而双侧置信下限的置信度只有80%,显然相对于采用双侧置信区间估算的区间(θL,θU)来说,单侧置信下限估算的区间(θ)使得试验结果落入该区间的可能L,∞性更大也就是说置信度更高。
在实际的应用中,接收单位对产品的试验结果,一般采用单侧置信下限估计的方法计算。这是因为除了计算简单外,同时还有较高的置信度。
点估计的计算方法往往是生产单位喜欢采用的,因为点估计值的计算结果是最大可能的结果,从解2和解4的计算中可以看出它们之间约有3倍的差距。
如希望了解产品的大致寿命范围,以便对产品进行可靠性增长改进或对维护时间、维护备件进行控制时,就会采用双侧置信区间估计的方法。
在截尾试验方法中,还有失效产品可替换和无替换等试验方法可用于估算MTBF;另外,利用成败型抽样检验平均寿命等方法也是实验室的工作。总之,大部分的可靠性试验方法和MTBF的计算,以及大量有关可靠性的工作内容都会在实验室完成。但是需要清醒地认识到,实验室试验的条件还是不能和实际使用的条件一样,如高温老化试验就很难暴露因潮湿环境造成的失效。因此,所有实验
2×(24小时×30天×3月×45)/X2(1-0.80,
2)=2×97200h/3.219=60391h
答:该批产品在置信水平为0.80时,的单侧置信下限为60391h。
解2:点估计计算公式为MTBF=T/r,代入数值计算:
MTBF
θ=(24小时×30天×3月×44台+500)/1=
95540h
答:MTBF的点估计值为95540h。
YUSHIYAN
21
电子产品可靠性与环境试验2008年
室的MTBF结果还是有待现场使用来验证。
T11=(500×8×15)+(500×8×1个月)
!!!!!!!!!!!!!!!第十一个月T12=(500×8×15)
!!!!!!!!!!!!!!!第十二个月
总工作时间为各月工作时间的累加和
3.3现场失效数统计计算
产品在完成设计改进、准备批量生产前,原则上需要通过部分样机进行试验室试验来评价产品的
MTBF,再确定是否批量生产。而实际上,由于新
产品在推出时间上的需要,不可能进行长时间的
T总=T1+T2+…………+T12
通过合并同类项并考虑每天产品的使用率70
MTBF试验。对于民用产品来说,试验室试验由于
时间和费用的关系根本无法操作;对于部分军用产品来说,由于生产的数量极有限,不可能抽取过多的试验样品进行MTBF试验,这样通过极少样品评价出的MTBF可信度是个大问题。
同时,由于实验室试验条件的单一性和产品在外场使用条件的多样性,因此,试验室试验的真实性与产品的外场使用会有较大的差异。这时就需要通过现场失效统计的数据来了解产品真实的
%,最终的计算结果为:
T
总
=[(500×8×6个月)+500×8×(1+2+500台×8h×2160天×70%=6048000h
…………+11)]×70%=500×8×72个月×70%=
求:MTBF=T总/返修数=6048000/100=60480
h。
答:该批产品的MTBF值为60480h。可以将上面T总的计算公式用代数方式表达,以方便对现场统计计算的应用。
MTBF。当然这种方法带来的时间滞后性是无法克
服的,但对于验证实验室的试验数据和连续生产同类产品的生产厂家还是有价值的。
对于大量投入市场的民用产品,可以通过对维修率的统计,求出MTBF的大致水平,其计算方法如下例:
例6:某厂生产的产品年销售量为6000台,一年内返修产品100台,求该批产品的MTBF。
解:对于现场使用的情况必须要有以下的调研:1)产品的月平均销售量;2)用户每天的平均使用时间;3)每天约有多少产品在开机使用。这
T总=N(月销量)×t(每天开机时间)×2160
(一年总开机天数))×K(开机率)
当然这个计算公式并不是唯一的,在对现场统计的研究中,根据不同的情况还有许多不同的计算方法都是可以参考的。
3.4从几个计算实例看MTBF的应用
例7:一台DVD产品,每天工作15h,工作了一年失效,维修后继续工作的条件不变又工作了一年失效,问这台DVD的MTBF是一年还是两年?
解:由于MTBF所指的是工作时间,因此在维修前的工作时间是:
3项数据直接影响产品统计结果的准确度。
对该产品的调查结果为:月平均销售数量N=
15h×365d=5475h
维修后由于条件不变又工作一年,所以同样为
500台;平均每天的使用时间为t=8h;每天的使
用率约为K=70%。对于当月售出的产品的工作时间为:T=销售台数×每天使用时间×平均使用天数,由于每个月的销售是逐步进入用户,因此,当月平均使用天数是15天,往后每月天数为30天,计算结果为:
第一个月售出产品的总工作时间和各月产品的工作时间如下:
5475h,从试验结果看投入的试验样品全失效,
失效数是2,因此可以判定该试验为全寿命试验,套用公式MTBF=(nt1+nt2……+nti)/n计算:
MTBF=(1×5474+1×5474)/2=5474h
答:这台DVD的MTBF是5474h。
以上的例子说明在MTBF的计算中,累计的时间是指产品的开机工作时间,停止工作的时间需要被扣除,因此每年的实际工作时间是5000多小时;另外要注意的是,试验中虽然只用了一台
T1=(500×8×15)+(500×8×11个月)
!!!!!!!!!!!!!!!!第一个月T2=(500×8×15)+(500×8×10个月)
!!!!!!!!!!!!!!!!第二个月
…………
DVD产品,但失效数却是两次。
例8:使用方要求生产方提供的DVD产品年返修率为2.5%,生产方至少要达到什么水平的
CHANPINYU
第2期冯敬东等:电子产品MTBF的意义及工程化计算方法
MTBF才行?
解1:产品的失效分布满足指数规律时,可以套用MTBF=1/λ的公式:
解得:tr=2.302×0.0458/(9%/年)=0.10543/(9%/年)=1.171年=1.171×8760h=10262h
答:使用时间为10262h时,产品有90%的把握不出故障。
在例9中我们可以看出,如果希望该批产品有
MTBF=1/(2.5%/年)=1年/0.025=40年=40×8760h=350400h
答:产品的失效分布满足指数规律时,生产方的MTBF至少要达到350400h。
解2:产品的失效分布满足标准正态分布规律时,均值μ的位置在正态分布曲线的中心点上,曲线的左右两边对称,因此,MTBF(均值μ)对应的失效数应约为50%。
90%的把握不出故障,它的使用时间约是MTBF
的十分之一,这点希望专业人员和消费者都要明确。
在上例的MTBF计算中,提到了可靠水平r(即90%不出故障的时间),这是制定产品可靠性的一个关键技术指标,它所表达的是执行任务的可靠能力。对用户而言,当然是完成任务的可靠水平越高越好。对高可靠的产品来说,可靠水平有时需要高达99%以上。这就是文章开头提到的“无故障工作时间”,简单地说就是一批产品可靠水平为
MTBF=50%/(2.5%/年)=20年=20×8760h=175220h
答:产品的失效分布服从标准正态分布规律时,生产方的MTBF至少要达到175220h。
从以上的计算可以看出,失效分布不同时所使用的计算方法也不同,计算MTBF时要注意失效分布在计算中的意义:
100%时的工作时间。
4消费者需要知道的MTBF
2003年以来,各电脑厂家的MTBF从4万小
1)产品的失效分布不同时,MTBF是有较大
差异的,因此,失效分布的形态对MTBF的计算有很大的影响;
时到12万小时,不断刷新“世界记录”,说明国内各生产单位对产品质量越来越重视,也说明产品的可靠性确实在不断进步。但由于很多人(包括专业可靠性和质量人员,以及工程技术和销售人员)对于MTBF的认识理解或解释还存在许多误区,因而难免会有用MTBF的数据误导消费者的嫌疑。
就消费者而言,对本文阐述的MTBF概念和解释可能并不能完全理解,但只需要记住以下几点:
2)对设计、制造良好的整机产品来说失效分
布多为指数分布,也就是常说的偶然失效的情形,如果不了解产品的失效分布形态,可以先直接采用指数分布的公式计算;
3)正态分布常用来表示磨损失效的情形,通
常设计、制造不良的产品在较短的时间内就会进入磨损损耗期,如果在试验中发现失效分布呈现的是正态分布,且寿命时间较短时要注意产品本身存在的问题。
例9:已知设备失效是服从指数分布规律,且年返修率9%,请求出平均无故障工作时间是多少?如果要求有90%的把握不出故障,其使用时间应如何选择?
解:产品的失效分布满足指数规律时,可用
a)通过预计方法(MIL-STD-217、GJB299B)得到的MTBF并不是产品真正的MTBF,仅
仅是对产品设计和元器件选用达到可靠性要求的期望,对消费者而言不看也罢。
b)实验室试验得出的MTBF比预计方法得出
的MTBF具有可信度,但一定要看到第三方实验室提供的试验报告(工厂自已的实验室的报告说服力不够)。如果报告出现依据xxx标准及委托方要求时,希望能够说明试验标准和委托方的要求有什么区别(委托方对标准要求的一个改动,可以相当容易地增加几万小时的MTBF)。
MTBF=1/λ的公式计算:
MTBF=1/(9%/年)≈11年=11×8760h=96360h
由于要求90%的把握不出故障(即可靠水平r
c)无论你相信哪种方案计算出的MTBF,先
将它除以10的时间才是保证你自己购买的产品90
=90%),则根据可靠寿命公式:
tr=2.302(lg1/r)/λ
YUSHIYAN
%不出问题的时间。同时你也要明白,即使你购买
23
电子产品可靠性与环境试验2008年
的产品很快出了问题,也不能以此判断这批产品的同样,可靠寿命这个概念,对不可修复产品来说,就是我们通常理解的寿终正寝的寿命;而对可修复产品来说,可靠寿命也并非指产品耗损期的寿命。
第三,不同的应用目的,MTBF的计算方法也不同。
MTBF不高。因为,对一批产品而言,随机现象和
六合偶然性是存在的,只不过刚好这个随机的“彩”被你选中。但如果你所了解的情况是有许多同型号的产品出了问题,那就要小心了。
d)实验室提供的MTBF不能模拟你正常使用
的条件,起码你不会开机运行而不按键盘吧?而计算机的MTBF试验既不会按键盘一般也不会一天4次开关机。因此,最可信的MTBF还是先去维修部看看,如果年返修率低,MTBF值肯定高。只是维修人员有时恐怕不愿意告诉你真实的情况,尤其是在返修率高的情况下更是如此。
a)在可靠性预计中,MTBF的计算主要根据
相关标准以及组成元器件的基本失效率和各种修正系数来进行的。这时得到的MTBF值只是产品的设计期望,也就是我们常说的“潜在可靠性”。并且,由于存在指数分布等理想假设、元器件基本失效率与实际值的差异、以及修正系数选取方法的不同,计算得到的MTBF值可以有很大的差异(差几个数量级)。但就同样的产品来说,对选择不同的设计方案或是选择不同的元器件进行可靠性预计比较时,还是很有意义的。
e)如果生产厂家提出的维修条款是免费保换
(包换)时间,那么当然是时间越长,表明厂家对自己产品的MTBF也就是可靠性越有信心。而如果条款是免费保修(包修),那么哪怕时间再长,也不代表产品的可靠性高。包换是让你放心使用的承诺,而保修只是让你放心掏钱的一种说法。
b)生产单位一般是通过实验室试验来对产品
进行可靠性寿命评价,并计算得到产品的MTBF数据。MTBF试验往往采用定时或定数截尾的试验方平均法,当仅有部分产品失效或未失效,可采用“寿命的点估计”双侧置信区间估计”和“单侧、“置信下限估计”3种MTBF计算方法,从而得到
5
结束语
平均无故障工作时间(MTBF)是电子产品表
征可靠性水平的一个重要参量。但长期以来,业界工程技术人员包括质量和可靠性人员,在对MTBF的理解和解释方面存在较多的误区,导致在工作中出现一些困难,或是在产品宣传方面造成消费者的误解。因此,本文对电子产品MTBF的实际意义进行深入的探讨,旨在使业界能正确理解这一表征电子产品可靠性的常用概念;并通过大量的案例,介绍了MTBF的工程计算方法,以期能为业界人士提供帮助。
首先,
平均无故障工作时间”表示的是一批“
产品无故障工作时间的平均值,而“无故障工作时间”指该批产品第一次出现故障前的工作时间。实际上,当一批电子产品在工作到平均无故障工作时间时,已经约有60%的产品会发生硬件故障。而无故障工作时间(出现首次故障的时间)则远低于
MTBF的估算值。具体应用时,可通过计算公式及
查表来得到在某个置信水平下的试验方案或是计算得到MTBF值。
c)还可通过现场失效统计的数据来计算MTBF,用这种方法得到的MTBF可以比较准确地
反映产品的真实可靠性水平。具体的计算方法也相对简单,只要能得到产品的年返修率和年销售量及年总的开机时间(估算),就可以通过简单的算术运算获得MTBF值。实际上产品的年返修率的高低与MTBF的大小也就是说可靠性水平的高低是最直接相关的。
最后,本文还从5个方面,告诉消费者应如何理解MTBF这一概念,以及如何通过MTBF来了解自己所购产品的可靠性水平以及它们之间的相互关系。
MTBF时间。
其次,在一些可靠性工程书籍中,有时也会把
MTBF/MTTF叫做平均寿命。这对不可修复的产品,
如电子元器件是完全可以理解的;但对可修复的整机电子产品来说,MTBF表征的平均寿命并不是指产品的平均终了寿命,而只是发生故障的平均时间。
参考文献:
[1]唐宪明,罗绮心.电子产品的可靠性与安全性[M].武
汉:华中科技大学出版社,2002:25-27.
[2]秦英孝.可靠性维修性保障性概论[M].北京:国防工
业出版社,2002:44-49.
CHANPINYU
电子产品MTBF的意义及工程化计算方法
冯敬东,来萍
(信息产业部电子第五研究所,广东
广州
510610)
摘要:对电子产品平均无故障工作时间(MTBF)的实际意义进行了深入的探讨,旨在使业界能正确理解这
一表征电子产品可靠性的常用概念;并通过大量的案例,介绍了MTBF的工程计算方法,以期能为业界人士提供帮助。
关键词:平均无故障工作时间;案例;工程计算中图分类号:TB114.3
文献标识码:A
文章编号:1672-5468(2008)02-0015-10
DiscussiononActualMeaningandCalculatingMethod
ofMTBFforElectronicProduct
FENGJing-dong,LAIPing
(CEPREI,Guangzhou510610,China)
MeanTimeBeforeFailure(MEBF)”forelectronicproductAbstract:Theactualmeaningof“
isdiscussedhereinorderthatthisconceptthatmainlydescribethereliabilityoftheproductscan
becorrectlyunderstoodinthisfield.CalculatingmethodofMTBFinthereliabiltyengineeringisintroducedandsomecasesarealsopresented.
Keywords:MTBF;cases;calculating
method
1
引言
在电子工业界,几乎每个人都熟悉的一个术语
性与环境试验研究所出版的《可靠性数学》一书的结果,所有的公式均无推导过程,如希望了解公式推导过程请参考相关的书籍。除有说明外,文章列举的公式和计算均采用指数分布公式。
叫“平均无故障工作时间”(简称MTBF),这是表征产品可靠性的一个重要参数。但是,这个术语经常被错误地解释和使用。本文仅希望通过对
2MTBF的意义和概念误区
MTBF(MeanTimeBetweenFailure)其直译是
失效之间的平均时间”平均无“,用中文解释就是“故障工作时间”小时”为单。这个时间一般是以“位计算。对于一批产品来说,MTBF这个技术指标
MTBF实际意义的探讨和具体的计算,使业界能正
确理解MTBF概念;同时也使消费者了解这一电子行业常用的可靠性术语。
文中所用的公式直接引用了中国电子产品可靠
收稿日期:2007-10-19修回日期:2007-10-25
作者简介:冯敬东(1954-),男,湖北安陆人,信息产业部电子第五研究所可靠性研究分析中心、电子元器件可靠性物理及
其应用技术国家级重点实验室高级工程师,主要从事电子产品可靠性研究工作。
YUSHIYAN
15
电子产品可靠性与环境试验2008年
越高,则这批产品的可靠性就越好,出故障的可能性就越低。但要明确以下几个认识:
平均无故障工作时间”和“无故障工作时2.1“
间”是两个不同的概念
平均无故障工作时间”表示的是一批产品无“
故障工作时间的平均值,
无故障工作时间”是指“
批产品第一次出现故障前的工作时间。某批产品的可靠度随时间变化的曲线如图1所示。从中可以看出,当一批产品的可靠度R为1时的这段时间才是“无故障工作时间”平均无故,约200h,而“障工作时间”约为1200h(计算如例2所示)。
r30=10+20+30=60
答:产品的MTBF为30h,工作到30h时相
应的失效数为60台。
由此可见,这批产品在平均无故障工作时间(MTBF)30h时已有60台失效了,无故障工作的产品仅有40台。所以上面的说法应改为“MTBF为45000h的产品批,在连续运行5年多的时间里,约有60%的产品会发生硬件故障。”
上面的例子主要是说明产品的MTBF和失效数量的关系,重点是通过简单例子的解释来明确什么是“平均无故障工作时间”和“无故障工作时间”,避免由于失效分布的解释而引起主要概念的模糊。再看看下面的一个统计失效的例子。
例2:抽取80个样品进行全寿命试验,失效时间和相应的失效数量整理后如表1所示,估计这批产品的MTBF。
表1产品失效统计表
组号
失效时间范围/h
组中值/h
失效数/n
12
图1某批产品的可靠度随时间变化的曲线
4000~400~800800~120016001200~20001600~2000~240028002400~2800~3200
200600100014001800220026003000
31826159621
345678
如果产品的MTBF指标达到45000h,意味“
着如果1台机器24h开机连续正常运行,大约平均可以运行5年(8760h/年)多的时间不发生硬件故障。”这是经常出现在产品宣传中的一句话,它就是通过混淆以上两个概念来误导消费者的,让无故障工作时间”消费者认为MTBF就是“;这同时也使许多可靠性专职人员无从判断什么是MTBF的真实意思。以下的例子,通过了解MTBF与失效数量的关系,从而明确这两个概念的区别。
例1:从一批产品中抽取n=100件样品进行试验,工作10h的失效数(r1)10台,20h失效数(r2)20台,30h失效数(r3)30台,40h失效数(r4)40台,至此所有的产品全部失效,求该产品的MTBF和相应的失效数。
解:产品在试验中全部失效,满足全寿命试验,可代入公式:
(1)MTBF=T/n=(nt1+nt2…….+nti)/n
得出:MTBF=(10×10+20×20+30×30+40×40)/100=3000/100=30h
工作到30h的失效数r为:
解:试验样品全部失效,满足全寿命试验,先求出80个样品的总工作时间T:
T=(200×3)+(600×18)+(1000×26)+……+(3000×1)=96000h再求这批样品的MTBF:
MTBF=T/n=96000/80=1200h答:这批样品的MTBF为1200h。
在这个例子中,我们通过失效时间和数量的直方图(如图2所示)可以看出,失效的分布形态是对数正态分布,我们可以求出MTBF在1200h时样品的失效数量大于47台,失效比例约为样品总数的60%。
这两个例子充分说明了“平均无故障工作时间”和产品失效数量的关系,即当一批产品在达到平均无故障工作时间时,约有60%的产品会发生硬件故障。实际上在各种失效分布形态中求出的
CHANPINYU
第2期冯敬东等:电子产品MTBF的意义及工程化计算方法
瞬时”这两个字。MIL-便,在业界通常去掉了“
HDBK-338标准中所提到的平均失效率(指浴盆曲
线的盆底阶段)也仅是针对盆底阶段的平均值,未考虑损耗阶段。这样从产品的整个使用阶段看还是瞬时失效率的概念。
业界常用元器件的失效率(10-n/h)来表征产品的可靠性,是指在元器件工作一小时内的失效
图2失效样品的直方图
率。当然产品工作一年或两年其失效率都是不一样的。这就是为什么钽电容的基础失效率以0.5%
平均无故障工作时间”“,其对应的失效数量约占总数的50%~60%。
1000h来表示而不用5×10-6/h表示。因此,单纯
地通过瞬时失效率来表征产品的终了寿命是不行的(哪怕是指数分布),事实上MTBF根本就不是为了求证产品的终了寿命而提出的。举一个简单的例子来说明,我们在大学学生中统计年死亡率为0.02
2.2MTBF与产品的平均终了寿命是不能等同的概念
曾经有文章说当前半导体器件的失效率(λ)已经可以达到10/h,根据MTBF=1/λ的公式计算
-10
下来其寿命可以达到112万年,这种说法就是将
%,在老人院中统计年死亡率为2%,如果以此数
据代入求终了寿命就存在100倍的差别,明显地不符合实际的情况。因此,不能简单地用瞬时失效率来表征产品的终了寿命。
但是,很显然这两组人群的健康程度(不考虑年龄)是不一样的,就像产品一样,好的产品年失效率为0.02%,而差的产品年失效率为2%,那么评价这两组产品哪一组更“健康”,更能够可靠工作的“平均无故障工作时间”就有意义了。
MTBF与器件的平均终了寿命等同看待才会出现
的。试想想一个器件别说工作了,就是放置112万年还剩下些什么?
在这里,失效率(λ)被引入了计算,因此,我们必须了解什么是失效率,失效率的定义是“已工作到t时刻的产品,在时刻t后单位时间内发生失效的概率,称为该产品在时刻t的失效率函数,又称为失效率”。失效率计算公式为:
λ(t)=△n(t)/△t[N-n(t)]
看看下面的例子是如何计算失效率的。
(2)
2.3可靠性学科中的寿命和MTBF的意义2.3.1可靠性学科中的寿命和平均寿命
可靠性学科中的产品寿命与公认的寿命是有区别的,公认的寿命是指自然或不自然的消亡,在生命过程中的生病、意外伤害是不影响寿命统计的。但在可靠性学科中,产品的寿命是指产品从开始工作到发生故障的一段时间,发生故障的原因可能是一个焊点的脱开或是一个器件的失效,都被认为是产品寿命的结束,当故障修复后产品的寿命被重新统计计算。具体地说就是可靠性学科中的产品寿命,不是指产品报废前的工作时间,而是发生故障前的一段时间。
事实上,在可靠性学科中常被提起的“平均无故障工作时间”就是平均寿命,只不过这个平均寿命与公认的平均寿命是有区别的,它不表示产品的消亡和报废的平均时间,而只表示产品能正常工作的平均时间。
在可靠性学科中,与公认的平均寿命概念相同的是“平均无故障时间”(MeanTimeToFail-
例3:如图3所示,100个试验样品,试验到时刻t1=500h共失效10个,再继续试验t2=50h仅一个样品失效,求在时刻t0和t1的失效率。
图3失效的线段图
解:代入失效率的公式,则有:
λ(t0)=48/500×100=0.00096
λ(t1)=1/50×(100-48)=0.00038
答:在时刻t0和t1的失效率分别是0.00096和0.00038。
通过以上的例子可以看出,失效率在不同的阶段是不同的。必须明确的是,失效率的准确意思是指瞬时失效率,这个瞬时失效率在不同的时刻是不同的,所以说失效率是时刻t的函数,为了使用方
YUSHIYAN
17
电子产品可靠性与环境试验2008年
ures),简称MTTF,它一般用来表征一次消亡或报
废的产品(如元器件产品)。由于MTBF和MTTF在计算方法上一致,因此,很容易将两者的寿命概念也等同看待,这就是解释不清MTBF和MTTF区别的主要原因,也是导致产品寿命的定义和公认寿命意义混淆的原因。
泛使用。
上面所提到的几个可靠性学科中的寿命概念,在制定产品的可靠性指标或对产品寿命进行估算时会经常使用。尤其是在制定产品的寿命指标时,需要特别注意可靠水平r的取值,r取值的高低会直接反映产品完成任务的能力(计算见例9题)。
2.3.2可靠寿命、中位寿命与特征寿命
一批产品的可靠度R(t)是时间的函数,随着时间的延长,这批产品的可靠度会越来越低。假定开始工作时t=0,可靠度R(0)=1。以后在不同的时刻,产品的可靠度将具有不同的r值(如图
3MTBF常用的计算途径
一个产品在设计、生产、材料、运输、保存、使用环境中存在各种不确定的因素,使得产品的寿命成为随机变量,对于随机出现问题的时间,可通过各种统计计算得出,通常MTBF可以通过以下3种计算途径求出。
4所示)。在可靠性工作中经常需要知道,对于给
定可靠水平r,产品的可靠度下降到r时的时间tr是多少?这个时间tr就被称为产品的可靠寿命,用可靠度公式表示为:
3.1可靠性预计计算
预计产品MTBF的好处是:首先,在产品设计阶段就可以满足客户的制造要求;其次,对生产方而言,可使其以最少的费用对预计的产品弱点进行关注和改进。目前国内有3个普遍被接受的标准用来计算MTBF:军品和高可靠产品大都采用MIL-
R(tr)=r
的关系为:
(3)
当失效服从指数分布时,可靠寿命tr与失效率
tr=2.302(lg1/r)/λ(4)
STD-217FN2和GJB299B这两个标准,民用产品
则用Bellcore方法。MIL-STD-217FN2是根据美国可靠性分析中心和罗姆试验室多年的工作经验而制定的,其最新版本为217-F2;GJB299B是由信息产业部电子第五研究所根据国内电子元器件使用失效率所总结出的中国自己的预计标准,其最新版本为GJB299C;Bellcore版本则是由AT&T与Bell实验室提出并成为商用电子产品MTBF值计算的行
图4可靠性的寿命曲线
业标准。
上述的3个标准都包括了用于典型电子产品中元器件的失效率模型,比如IC、二极管、晶体管、电容器、继电器、开关和连接器。这些元器件的失效率都是以各国和各厂家实际应用中获得的、最适用的数据为依据的,在对产品进行可靠性预计时可以直接查找。军标和Bellcore版本之间虽有几个不同点,但计算的方式基本上没有太大的差别,其中较明显的一个不同点是失效率的表示法,MIL-
当可靠水平r=0.5时,即可靠度为一半时有
R(t0.5)=0.5,此时称为中位寿命,此时产品约有
一半失效了。实际上,如果产品寿命服从标准正态分布,此时的均值μ就是中位寿命,就是“平均无故障工作时间”或是平均寿命;如为对数正态分布或指数分布时,中位寿命不等于平均寿命。
当可靠水平r=exp(-1)=0.368时,称为特征寿命。在指数分布时,特征寿命与平均寿命重合,即等于MTBF,所以有MTBF=1/λ的简单计算公式。虽然公式简单,但由于指数分布符合大部分整机的失效分布形式,因此它在很多计算场合被广
STD-217和GJB299B都将失效率表示为:失效次
数/10-6h,而Bellcore失效率表示为:失效次数/
10-9h。此外,MIL-STD-217将环境对失效率的影
响概括成14种类型,而Bellcore标准则概括成5种类型。但是这些不同点并不影响我们对预计计算
CHANPINYU
第2期冯敬东等:电子产品MTBF的意义及工程化计算方法
方法的掌握和了解。
在预计的方法上,针对整机可靠性试验的失效模式多为指数分布的情形,各标准所采用的是产品中所有元器件的使用失效率累加后代入MTBF=1/λ的公式,求出MTBF。当然计算时要考虑的失效率修正系数相当多和复杂,事实上预计的准确度与各种修正系数(π——环境系数、π——质量系数、e—q———电流额定值系数、π——应用系数、π——πr—a—s—电压应力系数、π——配置系数等)关系密切,因c—此,预计人员对失效率模型和修正系数的掌握和了解程度是准确预计的关键。在国外的文献中曾报道过,一个相同的产品由不同的可靠性预计人员计算,其MTBF值可以有一到几个数量级的差别。可这并不说明可靠性预计没有价值,反而说明准确预计需要相当有经验的预计人员。纵观目前的预计人员多为可靠性质量管理人员,甚至有些预计人员对产品的工作原理并不明白,对元器件的典型失效现象也不清楚,这样算出的可靠性预计值当然是没有价值的。这是题外话以后另外讨论。
我们看看下面的例子是如何通过可靠性预计的方法来求出MTBF的。
例4:通过表2各元器件的失效率和使用量,求出该产品的MTBF。
表2所列的是一个产品构成的主要元器件,(显然这个例子并不像一个产品的元器件构成要素,
失效率也省略不少修正系数和环境因素,但通过这些计算可以解释可靠性预计的方法)。其中功率管
T的失效率λ=0.5645×10-6h,在这个产品中共使
用了5个,失效率的总和=0.5645×5=2.823,其它各项也如此计算,最后我们将各项的失效率总和累加,求出该产品的累计失效率为31.74,代入
MTBF=1/λ公式得出:
MTBF=1/1000000×31.74=31505h
由计算和统计表可以看出,有两项内容直接影响了累计结果,一是失效率的大小,二是元器件数量的多少。设计人员可以通过对C3类电解电容的重新选型和降额设计来减少失效率,或通过减少
C3的使用数量(简化设计)来减少累计失效率,
使产品的MTBF更高。
目前有不少预计软件也提供电子产品可靠性的计算,例如:以失效率预计方法编制的MTBFcal软件就提供了完善的MIL-HDBK-217F2和Bellcore两种标准的分析环境和相应的器件库,使得预计工作的操作更为简单和方便。
但要明确的是,这些预计的结果都是产品的设计期望,也就是我们常说的“潜在可靠性”,最终这些预计结果还是需要经过对产品实际工作的检验来验证,这个验证无论是由生产方进行还是由独立的第三方实验室进行,都是在试验室的条件下完成,因此,MTBF的第2种计算方法是实验室试
验。
表2一个产品的失效率统计表(失效率单位“1×10-6h)
名称功率管:T全桥:B
规格
失效率/λ
数量
失效率总和
3.2实验室试验和计算
产品设计结束后必须通过元器件的采购控制和生产工艺的保证,才能生产出好的产品,这时产品具有的可靠性被称为“固有可靠性”,这是无论是生产方还是使用方都急需了解的。在产品设计定型阶段和量产阶段,生产单位一般是通过实验室试验来对产品进行可靠性寿命评价。因此,实验室试验是产品研制单位和使用单位了解产品可靠性、获得可靠性数据最常用的途径。
实验室的可靠性寿命评价
0.5645
1.5A/600V
0.76190.5876
100℃105℃105℃105℃
0.72570.19672.27200.66941.20300.0262
1.0A/200V1.0A/1000V
0.58760.5876
525215101115
2.8231.5242.9381.4510.19711.3606.6941.2030.0260.5882.93831.74
肖特基二极管:D410.0A/100V电解电容:C1电解电容:C2电解电容:C3电解电容:C4场效应管:Q1电感:L1
整流二极管:D2整流二极管:D1累计失效率
YUSHIYAN
33uf/400V0.22uf/275V680uf/16V100uf/16V4.0A/600V
19
电子产品可靠性与环境试验2008年
试验具有一定的破坏性,因而不可能对所有的产品都进行试验,而且这样的工作量也确实太大了。因此,通过实验室试验来获取试验样品的基本方法是,从同型号(同批次)有限的一批产品中抽取一部分产品来进行试验,这些产品在可靠性术语中被称为“子样”(或“样本”),其中的每个产品被称为“样品”。显然从概率统计的观点看,抽取的试验样品数量越多,就越能真实地反映该批产品的可靠性水平。
在前面的例1、例2中,我们可以观察到,所抽取子样的每个样品在试验中最终都失效了,这种试验被称为全寿命试验。全寿命试验的MTBF计算只需采用简单的算术平均值(又称平均寿命的点估计值)的计算就可以了。事实上全寿命试验需要试验样品在试验过程中全部失效,所需要的试验时间可能长达几年、十几年甚至几十年,因此,这种算术平均值的计算方法在很大程度上仅仅是作为认识和了解MTBF概念(当然产品的寿命时间都比较短时是可用的)而言。
在实际的寿命评价试验中,由于试验时间和失效数量的不确定性,在整个试验过程中,试验样品往往无失效或部分失效时,就需要采用截尾试验的方法,截尾试验可分为定时截尾试验(试验到规定的时间而中止)或定数截尾试验(试验到出现规定的故障数或失效数时而中止),这两类试验方法是实验室估算MTBF最为常用的试验方法。
在截尾试验中,通过部分失效的样品和较短的试验时间来推算整批产品的MTBF时,需要涉及大
量的概率论知识。所幸的是研究可靠性的数学前辈们在通过大量统计的基础上,给出了3种可用于估算仅有部分产品失效或未失效的MTBF计算方法的公式,它们分别是“平均寿命的点估计”双侧、“置信区间估计”和“单侧置信下限估计”。
通过这3种涉及概率统计方法计算出的MTBF结果,可信度是一个大问题。为解决这个问题提出了“置信度”的概念,其含义是:通过计算对未知的参数θ(平均寿命)估计出一个取值的范围,如的取值会以一定的(θL,θU)的区间,而未知参数θ概率落入这个估计区间的范围内,这个概率值就被称为数值估计的“置信度”或“置信水平”,以字母C来表示。而不落入估计区间的的概率被称为数值估计的“风险度”或“显著性水平”,以字母
α表示,它们之间的关系如下:
C=p(θ≤θL≤θU)=1-α
下面是3种定时截尾无替换样品的平均寿命估计公式,这些计算公式需要查X2(α,2r+2)分位数表(如表3所示)来计算。
a)点估计
(5)
b)双侧区间估计
(6)
c)单侧置信下限估计
(7)
表3X2分位数表(部分)
自由度
显著性水平
0.99
123456
0.9750.950.90.0160.2110.5841.0641.612.204
0.80.0640.4461.0051.6492.3433.07
0.750.1020.5751.2131.9232.6753.455
0.50.4551.3862.3663.3574.3515.348
0.251.3232.7734.1085.3856.6267.841
0.21.6423.2194.6425.9897.2898.558
0.12.7064.6056.2517.7799.23610.64
0.053.8415.9917.8159.48811.0712.59
0.0255.0247.3789.34811.1412.8314.45
0.016.6359.2111.3413.2815.0916.81
0.00110.8313.8216.2718.4720.5222.46
2E-041E-030.0040.020.1150.2970.5540.872
0.0510.2160.4840.8311.237
0.1030.3520.7111.1451.635
CHANPINYU
第2期冯敬东等:电子产品MTBF的意义及工程化计算方法
式中:T——总试验时间;——失效数;r—
——样本量;n—
———显著性水平;α
——自由度;2r+2—
——分位数表。X2—
一般情况下,MTBF的评价试验仅抽取一次试验样本进行,那么试验结果就有可能会存在偏差,即存在试验的计算结果与产品的实际寿命不一致的情况。为了保证试验结果在大部分情况下能反映产品的实际情况,就需要提高计算的置信水平(置信度)。但置信水平提高后,双侧区间的范围会加大,单侧置信下限估计值也会降低。因此,使用以上公式时要注意,如果需要保证试验结果的置信度,估算的寿命结果就会随置信度的提高而降低,特别需要指出的是点估计值是没有置信度可言,这个结论可看下面的例子。
以下是在试验过程中无失效和少量失效时,估算MTBF的例子。
例5:一批产品抽取45个样品进行3个月的寿命试验,在试验过程中无失效,求平均寿命M的置信水平为80%的单侧置信下限;如果3个月时仅有一个样品在500h失效,求MTBF的点估计值以及置信水平为80%的双侧置信区间和置信水平为90%单侧置信下限。
解1:由于试验过程无失效r=0,显然如果利用点估计计算公式MTBF=T/r=∞,就得出MTBF为无穷大,肯定是不正确的。但在定时截尾寿命的试验场合,还是可以通过单侧置信下限公式计算和查X2分布表,求出其一定置信水平下的单侧置信下限。
2θL=2T/X(1-c,2r+2)=
解3:置信度为80%的双侧置信区间:
2
θL=2T/X((1-c)/2,2r+2)=
2×95540小时/7.779=24564h
2θU=2T/X((1+c)/2,2r+2)=
2×95540h/1.064=179586h
答:MTBF的双侧置信区间的下限是24564
h,上限为179586。
解4:置信度为90%的单侧置信下限:
θL=2T/X2((1-c),2r+2)=
2×95540h/7.779=24564h
答:MTBF的单侧置信下限为24564h。讨论上面的估算结果可以发现:
1)试验中无样品失效时,只能采用单侧置信
下限来估算平均寿命;
2)单侧置信下限和点估计的计算结果相差很
大,这是因为点估计值往往是最大可能的结果,计算的数值虽不保守,但没有置信度;
3)当估算的置信下限相同时(解3、解4),
单侧置信下限的置信度是90%,而双侧置信下限的置信度只有80%,显然相对于采用双侧置信区间估算的区间(θL,θU)来说,单侧置信下限估算的区间(θ)使得试验结果落入该区间的可能L,∞性更大也就是说置信度更高。
在实际的应用中,接收单位对产品的试验结果,一般采用单侧置信下限估计的方法计算。这是因为除了计算简单外,同时还有较高的置信度。
点估计的计算方法往往是生产单位喜欢采用的,因为点估计值的计算结果是最大可能的结果,从解2和解4的计算中可以看出它们之间约有3倍的差距。
如希望了解产品的大致寿命范围,以便对产品进行可靠性增长改进或对维护时间、维护备件进行控制时,就会采用双侧置信区间估计的方法。
在截尾试验方法中,还有失效产品可替换和无替换等试验方法可用于估算MTBF;另外,利用成败型抽样检验平均寿命等方法也是实验室的工作。总之,大部分的可靠性试验方法和MTBF的计算,以及大量有关可靠性的工作内容都会在实验室完成。但是需要清醒地认识到,实验室试验的条件还是不能和实际使用的条件一样,如高温老化试验就很难暴露因潮湿环境造成的失效。因此,所有实验
2×(24小时×30天×3月×45)/X2(1-0.80,
2)=2×97200h/3.219=60391h
答:该批产品在置信水平为0.80时,的单侧置信下限为60391h。
解2:点估计计算公式为MTBF=T/r,代入数值计算:
MTBF
θ=(24小时×30天×3月×44台+500)/1=
95540h
答:MTBF的点估计值为95540h。
YUSHIYAN
21
电子产品可靠性与环境试验2008年
室的MTBF结果还是有待现场使用来验证。
T11=(500×8×15)+(500×8×1个月)
!!!!!!!!!!!!!!!第十一个月T12=(500×8×15)
!!!!!!!!!!!!!!!第十二个月
总工作时间为各月工作时间的累加和
3.3现场失效数统计计算
产品在完成设计改进、准备批量生产前,原则上需要通过部分样机进行试验室试验来评价产品的
MTBF,再确定是否批量生产。而实际上,由于新
产品在推出时间上的需要,不可能进行长时间的
T总=T1+T2+…………+T12
通过合并同类项并考虑每天产品的使用率70
MTBF试验。对于民用产品来说,试验室试验由于
时间和费用的关系根本无法操作;对于部分军用产品来说,由于生产的数量极有限,不可能抽取过多的试验样品进行MTBF试验,这样通过极少样品评价出的MTBF可信度是个大问题。
同时,由于实验室试验条件的单一性和产品在外场使用条件的多样性,因此,试验室试验的真实性与产品的外场使用会有较大的差异。这时就需要通过现场失效统计的数据来了解产品真实的
%,最终的计算结果为:
T
总
=[(500×8×6个月)+500×8×(1+2+500台×8h×2160天×70%=6048000h
…………+11)]×70%=500×8×72个月×70%=
求:MTBF=T总/返修数=6048000/100=60480
h。
答:该批产品的MTBF值为60480h。可以将上面T总的计算公式用代数方式表达,以方便对现场统计计算的应用。
MTBF。当然这种方法带来的时间滞后性是无法克
服的,但对于验证实验室的试验数据和连续生产同类产品的生产厂家还是有价值的。
对于大量投入市场的民用产品,可以通过对维修率的统计,求出MTBF的大致水平,其计算方法如下例:
例6:某厂生产的产品年销售量为6000台,一年内返修产品100台,求该批产品的MTBF。
解:对于现场使用的情况必须要有以下的调研:1)产品的月平均销售量;2)用户每天的平均使用时间;3)每天约有多少产品在开机使用。这
T总=N(月销量)×t(每天开机时间)×2160
(一年总开机天数))×K(开机率)
当然这个计算公式并不是唯一的,在对现场统计的研究中,根据不同的情况还有许多不同的计算方法都是可以参考的。
3.4从几个计算实例看MTBF的应用
例7:一台DVD产品,每天工作15h,工作了一年失效,维修后继续工作的条件不变又工作了一年失效,问这台DVD的MTBF是一年还是两年?
解:由于MTBF所指的是工作时间,因此在维修前的工作时间是:
3项数据直接影响产品统计结果的准确度。
对该产品的调查结果为:月平均销售数量N=
15h×365d=5475h
维修后由于条件不变又工作一年,所以同样为
500台;平均每天的使用时间为t=8h;每天的使
用率约为K=70%。对于当月售出的产品的工作时间为:T=销售台数×每天使用时间×平均使用天数,由于每个月的销售是逐步进入用户,因此,当月平均使用天数是15天,往后每月天数为30天,计算结果为:
第一个月售出产品的总工作时间和各月产品的工作时间如下:
5475h,从试验结果看投入的试验样品全失效,
失效数是2,因此可以判定该试验为全寿命试验,套用公式MTBF=(nt1+nt2……+nti)/n计算:
MTBF=(1×5474+1×5474)/2=5474h
答:这台DVD的MTBF是5474h。
以上的例子说明在MTBF的计算中,累计的时间是指产品的开机工作时间,停止工作的时间需要被扣除,因此每年的实际工作时间是5000多小时;另外要注意的是,试验中虽然只用了一台
T1=(500×8×15)+(500×8×11个月)
!!!!!!!!!!!!!!!!第一个月T2=(500×8×15)+(500×8×10个月)
!!!!!!!!!!!!!!!!第二个月
…………
DVD产品,但失效数却是两次。
例8:使用方要求生产方提供的DVD产品年返修率为2.5%,生产方至少要达到什么水平的
CHANPINYU
第2期冯敬东等:电子产品MTBF的意义及工程化计算方法
MTBF才行?
解1:产品的失效分布满足指数规律时,可以套用MTBF=1/λ的公式:
解得:tr=2.302×0.0458/(9%/年)=0.10543/(9%/年)=1.171年=1.171×8760h=10262h
答:使用时间为10262h时,产品有90%的把握不出故障。
在例9中我们可以看出,如果希望该批产品有
MTBF=1/(2.5%/年)=1年/0.025=40年=40×8760h=350400h
答:产品的失效分布满足指数规律时,生产方的MTBF至少要达到350400h。
解2:产品的失效分布满足标准正态分布规律时,均值μ的位置在正态分布曲线的中心点上,曲线的左右两边对称,因此,MTBF(均值μ)对应的失效数应约为50%。
90%的把握不出故障,它的使用时间约是MTBF
的十分之一,这点希望专业人员和消费者都要明确。
在上例的MTBF计算中,提到了可靠水平r(即90%不出故障的时间),这是制定产品可靠性的一个关键技术指标,它所表达的是执行任务的可靠能力。对用户而言,当然是完成任务的可靠水平越高越好。对高可靠的产品来说,可靠水平有时需要高达99%以上。这就是文章开头提到的“无故障工作时间”,简单地说就是一批产品可靠水平为
MTBF=50%/(2.5%/年)=20年=20×8760h=175220h
答:产品的失效分布服从标准正态分布规律时,生产方的MTBF至少要达到175220h。
从以上的计算可以看出,失效分布不同时所使用的计算方法也不同,计算MTBF时要注意失效分布在计算中的意义:
100%时的工作时间。
4消费者需要知道的MTBF
2003年以来,各电脑厂家的MTBF从4万小
1)产品的失效分布不同时,MTBF是有较大
差异的,因此,失效分布的形态对MTBF的计算有很大的影响;
时到12万小时,不断刷新“世界记录”,说明国内各生产单位对产品质量越来越重视,也说明产品的可靠性确实在不断进步。但由于很多人(包括专业可靠性和质量人员,以及工程技术和销售人员)对于MTBF的认识理解或解释还存在许多误区,因而难免会有用MTBF的数据误导消费者的嫌疑。
就消费者而言,对本文阐述的MTBF概念和解释可能并不能完全理解,但只需要记住以下几点:
2)对设计、制造良好的整机产品来说失效分
布多为指数分布,也就是常说的偶然失效的情形,如果不了解产品的失效分布形态,可以先直接采用指数分布的公式计算;
3)正态分布常用来表示磨损失效的情形,通
常设计、制造不良的产品在较短的时间内就会进入磨损损耗期,如果在试验中发现失效分布呈现的是正态分布,且寿命时间较短时要注意产品本身存在的问题。
例9:已知设备失效是服从指数分布规律,且年返修率9%,请求出平均无故障工作时间是多少?如果要求有90%的把握不出故障,其使用时间应如何选择?
解:产品的失效分布满足指数规律时,可用
a)通过预计方法(MIL-STD-217、GJB299B)得到的MTBF并不是产品真正的MTBF,仅
仅是对产品设计和元器件选用达到可靠性要求的期望,对消费者而言不看也罢。
b)实验室试验得出的MTBF比预计方法得出
的MTBF具有可信度,但一定要看到第三方实验室提供的试验报告(工厂自已的实验室的报告说服力不够)。如果报告出现依据xxx标准及委托方要求时,希望能够说明试验标准和委托方的要求有什么区别(委托方对标准要求的一个改动,可以相当容易地增加几万小时的MTBF)。
MTBF=1/λ的公式计算:
MTBF=1/(9%/年)≈11年=11×8760h=96360h
由于要求90%的把握不出故障(即可靠水平r
c)无论你相信哪种方案计算出的MTBF,先
将它除以10的时间才是保证你自己购买的产品90
=90%),则根据可靠寿命公式:
tr=2.302(lg1/r)/λ
YUSHIYAN
%不出问题的时间。同时你也要明白,即使你购买
23
电子产品可靠性与环境试验2008年
的产品很快出了问题,也不能以此判断这批产品的同样,可靠寿命这个概念,对不可修复产品来说,就是我们通常理解的寿终正寝的寿命;而对可修复产品来说,可靠寿命也并非指产品耗损期的寿命。
第三,不同的应用目的,MTBF的计算方法也不同。
MTBF不高。因为,对一批产品而言,随机现象和
六合偶然性是存在的,只不过刚好这个随机的“彩”被你选中。但如果你所了解的情况是有许多同型号的产品出了问题,那就要小心了。
d)实验室提供的MTBF不能模拟你正常使用
的条件,起码你不会开机运行而不按键盘吧?而计算机的MTBF试验既不会按键盘一般也不会一天4次开关机。因此,最可信的MTBF还是先去维修部看看,如果年返修率低,MTBF值肯定高。只是维修人员有时恐怕不愿意告诉你真实的情况,尤其是在返修率高的情况下更是如此。
a)在可靠性预计中,MTBF的计算主要根据
相关标准以及组成元器件的基本失效率和各种修正系数来进行的。这时得到的MTBF值只是产品的设计期望,也就是我们常说的“潜在可靠性”。并且,由于存在指数分布等理想假设、元器件基本失效率与实际值的差异、以及修正系数选取方法的不同,计算得到的MTBF值可以有很大的差异(差几个数量级)。但就同样的产品来说,对选择不同的设计方案或是选择不同的元器件进行可靠性预计比较时,还是很有意义的。
e)如果生产厂家提出的维修条款是免费保换
(包换)时间,那么当然是时间越长,表明厂家对自己产品的MTBF也就是可靠性越有信心。而如果条款是免费保修(包修),那么哪怕时间再长,也不代表产品的可靠性高。包换是让你放心使用的承诺,而保修只是让你放心掏钱的一种说法。
b)生产单位一般是通过实验室试验来对产品
进行可靠性寿命评价,并计算得到产品的MTBF数据。MTBF试验往往采用定时或定数截尾的试验方平均法,当仅有部分产品失效或未失效,可采用“寿命的点估计”双侧置信区间估计”和“单侧、“置信下限估计”3种MTBF计算方法,从而得到
5
结束语
平均无故障工作时间(MTBF)是电子产品表
征可靠性水平的一个重要参量。但长期以来,业界工程技术人员包括质量和可靠性人员,在对MTBF的理解和解释方面存在较多的误区,导致在工作中出现一些困难,或是在产品宣传方面造成消费者的误解。因此,本文对电子产品MTBF的实际意义进行深入的探讨,旨在使业界能正确理解这一表征电子产品可靠性的常用概念;并通过大量的案例,介绍了MTBF的工程计算方法,以期能为业界人士提供帮助。
首先,
平均无故障工作时间”表示的是一批“
产品无故障工作时间的平均值,而“无故障工作时间”指该批产品第一次出现故障前的工作时间。实际上,当一批电子产品在工作到平均无故障工作时间时,已经约有60%的产品会发生硬件故障。而无故障工作时间(出现首次故障的时间)则远低于
MTBF的估算值。具体应用时,可通过计算公式及
查表来得到在某个置信水平下的试验方案或是计算得到MTBF值。
c)还可通过现场失效统计的数据来计算MTBF,用这种方法得到的MTBF可以比较准确地
反映产品的真实可靠性水平。具体的计算方法也相对简单,只要能得到产品的年返修率和年销售量及年总的开机时间(估算),就可以通过简单的算术运算获得MTBF值。实际上产品的年返修率的高低与MTBF的大小也就是说可靠性水平的高低是最直接相关的。
最后,本文还从5个方面,告诉消费者应如何理解MTBF这一概念,以及如何通过MTBF来了解自己所购产品的可靠性水平以及它们之间的相互关系。
MTBF时间。
其次,在一些可靠性工程书籍中,有时也会把
MTBF/MTTF叫做平均寿命。这对不可修复的产品,
如电子元器件是完全可以理解的;但对可修复的整机电子产品来说,MTBF表征的平均寿命并不是指产品的平均终了寿命,而只是发生故障的平均时间。
参考文献:
[1]唐宪明,罗绮心.电子产品的可靠性与安全性[M].武
汉:华中科技大学出版社,2002:25-27.
[2]秦英孝.可靠性维修性保障性概论[M].北京:国防工
业出版社,2002:44-49.
CHANPINYU