前段時(shí)間,用WQS(WindchillQuality Solutions)軟件基于SR332可靠性預(yù)計(jì)給出了一臺(tái)微型彩色無紙記錄儀的MTBF預(yù)計(jì)值到客戶。隨后客戶反應(yīng)微型彩色無紙記錄儀的一個(gè)主板達(dá)不到5個(gè)9的可靠性要求。當(dāng)時(shí)就對(duì)“什么是5個(gè)9可靠性”疑惑了,客戶是不是說99.999%的可靠性呢?如果是指可靠性,通常電子產(chǎn)品如果基于指數(shù)分布R=e(-λt),λ=1/MTBF,現(xiàn)在MTBF已知,但時(shí)間t是未知的,怎么就說達(dá)不到要求的“5個(gè)9可靠性”呢?
筆者查看客戶郵件才明白:客戶提到的是Availability(可用性),并非之前筆者理解的指數(shù)分布的可靠性的概率值。問題得以解決:運(yùn)用固有可用性計(jì)算公式A=MTBF/(MTBF+MTTR)(這里A指可用性Availability);MTBF已知為2,000,000小時(shí)(這里數(shù)字為參考,與實(shí)際值在一個(gè)數(shù)量級(jí)),MTTR的取值定義為1小時(shí)(因?yàn)镸TTR指平均修復(fù)時(shí)間,這儀表按照筆者的實(shí)際經(jīng)驗(yàn),正常拆裝重組到恢復(fù)運(yùn)行要1個(gè)小時(shí),這意味著即使不修壞了的主板,直接更換性維修也至少1小時(shí),所以這里MTTR先去最小值1小時(shí))。算出來A=2000000/(2000000+1)=0.99999950000025=99.999950000025%。
這一看,6個(gè)9了......怎么客戶還說不符合呢?難道客戶的MTTR時(shí)間很長(zhǎng),考慮了實(shí)際的現(xiàn)場(chǎng)維護(hù)可能出現(xiàn)的維修延遲?例如更換板卡和協(xié)調(diào)人員維修等耽誤的時(shí)間等....利用反推法,假設(shè)剛好滿足5個(gè)9的可用性,算出MTTR=20小時(shí),意味著維修時(shí)間若超過20小時(shí),則達(dá)不到5個(gè)9的要求;因?yàn)楝F(xiàn)場(chǎng)維護(hù)時(shí)間對(duì)于不同場(chǎng)景均有不同,后來有詢問客戶他們的通常售后維護(hù)MTTR時(shí)間,并告知客戶我們目前的MTBF為預(yù)計(jì)值且指定了SR332里面的Issue 3、Method 1、Case 1的預(yù)計(jì)算法,不同預(yù)計(jì)算法得出的值都有差異??赡苡捎谏虡I(yè)或者其他原因,客戶不愿透露他們的預(yù)計(jì)方法及MTTR取值參數(shù),且也未再提我們的產(chǎn)品不能達(dá)到5個(gè)9的要求.....
注意:不建議直接將可靠性預(yù)計(jì)值直接代入計(jì)算可用性,有條件的情況下,為了更接近現(xiàn)場(chǎng),通常使用加速測(cè)試方案卡方分布單側(cè)置信得出的MTBF值進(jìn)行計(jì)算。
說來也巧,在解答了上面的疑問后看到了“可靠性幾個(gè)9什么意思,把人搞瘋了”的文章,里面提到了企業(yè)經(jīng)常宣傳的幾個(gè)9的定義級(jí)別,提到了一般電信級(jí)設(shè)備要求5個(gè)9的要求。對(duì)于里面的提及的一年允許中斷時(shí)間的計(jì)算方法,引用文章里1個(gè)9和5個(gè)9各自對(duì)應(yīng)的一年允許中斷時(shí)間如下:1個(gè)9:(1-90%)×365=36.5天;5個(gè)9:(1-99.999%)×365×24×60=5.26分鐘;
這里有人可能會(huì)有疑惑怎么直接算出上面的值?下面筆者運(yùn)用可用度公式分別驗(yàn)證了這兩個(gè)計(jì)算方法如下:
先說1個(gè)9:A=MTBF/(MTBF+MTTR);這里A=0.9,MTBF+MTTR=1年(因?yàn)槊枋隼飳懥艘荒陜?nèi)允許的中斷時(shí)間,假設(shè)時(shí)間長(zhǎng)度為1年,則無故障時(shí)間+故障維修時(shí)間總和為一年,即MTBF+MTTR=1年),代入得如下等式: 0.9=(365-MTTR)/365;繼而推導(dǎo)出MTTR=(1-0.9)×365=36.5天,吻合;
再說5個(gè)9;同樣的道理,代入得出0.99999=(365-MTTR)/365,MTTR=(1-0.99999)×365×24×60=5.256分鐘,吻合。
筆者寫這篇文章的時(shí)候在想,要提高可用性,有兩個(gè)方向:一是提高平均無故障工作時(shí)間MTBF,二是縮短平均修復(fù)時(shí)間MTTR。
不過通常這兩個(gè)方向都會(huì)增加成本,這里就涉及到了全壽命周期花費(fèi)LCC(Life Cycling Cost),如何平衡取舍,將總體成本最優(yōu)化?這應(yīng)該是可靠性的一個(gè)重要工作內(nèi)容,不過暫無LCC相關(guān)案例,歡迎大家在留言處補(bǔ)充,留待后續(xù)討論。
----------------------------------------------------------------------------------------------------------------
文章《可靠性幾個(gè)9什么意思,把人搞瘋了》原文
企業(yè)要提高產(chǎn)品的競(jìng)爭(zhēng)力,可靠性是考慮的重點(diǎn)之一;用戶購買產(chǎn)品也會(huì)選擇可靠性高的產(chǎn)品。和可靠性相關(guān)的數(shù)字中,“9”是最常見的。現(xiàn)在購買產(chǎn)品,經(jīng)常被宣傳的幾個(gè)9搞懵了,那么,產(chǎn)品宣傳的幾個(gè)9是什么含義?企業(yè)開發(fā)產(chǎn)品可靠性需要幾個(gè)9呢?
大家都清楚,產(chǎn)品的可靠性是指:產(chǎn)品在規(guī)定的條件下、在規(guī)定的時(shí)間內(nèi)完成規(guī)定的功能的能力。下面分別介紹一下機(jī)械產(chǎn)品和電子產(chǎn)品幾個(gè)9的含義,以及如何選擇和確定的。
機(jī)械產(chǎn)品
機(jī)械產(chǎn)品可靠性度量參數(shù)很多,如可靠度、MTBF、可靠壽命等,本文重點(diǎn)介紹可靠度。需要注意的是,這里的可靠度一般指機(jī)械產(chǎn)品某種關(guān)鍵故障模式不發(fā)生的概率。
對(duì)機(jī)械產(chǎn)品而言,一般考慮失效影響的重要性,將可靠度分成5級(jí),最高級(jí)別超過5個(gè)9,最低的可能小于1個(gè)9,具體分類見下表。
機(jī)械產(chǎn)品可靠度等級(jí)水平
失效影響 要求的可靠度指標(biāo) 可靠度級(jí)別
造成重大后果 0.99999-1 5
損失重大 0.999 4
一般損失 0.99 3
影響較小 0.9 2
基本無影響,可更換 —— 1
在具體產(chǎn)品設(shè)計(jì)時(shí),應(yīng)根據(jù)實(shí)際情況確定合適的等級(jí)??煽慷燃?jí)別越高需要投入的成本也越大,當(dāng)然必須把可能造成重大后果的失效模式作為可靠性設(shè)計(jì)分析重點(diǎn)。機(jī)械可靠性仿真分析與優(yōu)化軟件可幫你完成針對(duì)失效模式的可靠度、靈敏度分析,以及產(chǎn)品的可靠性優(yōu)化設(shè)計(jì)。
電子產(chǎn)品
對(duì)電子產(chǎn)品而言,產(chǎn)品宣傳經(jīng)常用可用度 n 個(gè) 9 來描述產(chǎn)品可靠性水平。n 個(gè) 9 表示在系統(tǒng)1年時(shí)間的使用過程中,系統(tǒng)可以正常使用時(shí)間與總時(shí)間(1年)之比,通過下面的計(jì)算來感受下 n 個(gè) 9 在不同級(jí)別的可靠性差異。
①4個(gè)9:(1-99.99%)*365*24=0.876小時(shí)=52.6分鐘,表示該系統(tǒng)在連續(xù)運(yùn)行1年時(shí)間里最多可能的業(yè)務(wù)中斷時(shí)間是52.6分鐘。
②5個(gè)9:(1-99.999%)*365*24*60=5.26分鐘,表示該系統(tǒng)在連續(xù)運(yùn)行1年時(shí)間里最多可能的業(yè)務(wù)中斷時(shí)間是5.26分鐘。
那么n個(gè)9里的n選多少合適呢?電子產(chǎn)品宣傳中很少有1-2個(gè)9,也沒有大于6的,為什么呢?
1個(gè)9:(1-90%)*365=36.5天;6個(gè)9:(1-99.9999%)*365*24*60*60=31秒。可以看到1個(gè)9和2個(gè)9分別表示一年時(shí)間內(nèi)業(yè)務(wù)可能中斷的時(shí)間是36.5天、3.65天,這種級(jí)別的可靠性或許還不配使用“可靠性”這個(gè)詞。而6個(gè)9則表示一年內(nèi)業(yè)務(wù)中斷時(shí)間最多是31秒,那么這個(gè)級(jí)別的可靠性并非實(shí)現(xiàn)不了,而是要做到從“5個(gè)9” 到“6個(gè)9”的可靠性提升的話,后者需要付出比前者幾倍的成本。
電子產(chǎn)品可靠度等級(jí)水平
可用度A 9的個(gè)數(shù) 年停機(jī)(min) 適用產(chǎn)品
0.999 三個(gè)9 500 電腦或服務(wù)器
0.9999 四個(gè)9 50 企業(yè)級(jí)設(shè)備
0.99999 五個(gè)9 5 一般電信級(jí)設(shè)備
0.999999 六個(gè)9 0.5 更高要求電信級(jí)設(shè)備
當(dāng)然,可靠性度量參數(shù)還很多,本文僅僅介紹了一些和用戶和企業(yè)密切相關(guān)的內(nèi)容,僅供參考。不管你是用戶還是產(chǎn)品研發(fā)者,都應(yīng)該擦亮眼睛,千萬不要被幾個(gè)9再搞暈了。
文章轉(zhuǎn)載自網(wǎng)絡(luò),作者:Andy
共有訪客發(fā)表了評(píng)論
網(wǎng)友評(píng)論