可靠性預計看似很理論很體系,但是實際項目感覺沒啥用?
電路板的可靠性預計通常是基于電子元器件的失效率進行的。常見的做法是根據每個元器件的失效率模型(如MIL-HDBK-217、Telcordia SR-332等標準),結合元器件的使用環境、應力水平和運行時間來計算整個電路板的可靠性指標,如平均故障間隔時間(MTBF)或失效率(FIT,Failures in Time)。
這種基于元器件失效率的可靠性預計主要涉及以下幾個步驟:
元器件級別的失效率計算:每個元器件都有特定的失效率模型,考慮其工作條件,如溫度、應力、電流、電壓等。這些失效率模型可能會受到以下幾個因素的影響:
環境因素:溫度、濕度等對元器件失效率的影響很大。高溫通常會顯著增加失效率。

器件極限溫度承受能力是高壓線,超過后失效率劇增,使用中不允許超過。在極限溫度以內,器件失效率與溫度仍然強相關,失效率隨著溫度升高而增加。
問題:是否存在一個安全溫度點,只要不超過這個溫度點,失效率與溫度關系就不密切?
答案:理論與實際表明,多數情況下不存在這樣的溫度點。器件的失效率始終與溫度相關,只是高于某個溫度點之后,失效率會急劇上升,出現拐點。

降額設計就是使元器件或產品工作時承受的工作應力適當低于元器件或產品規定的額定值,從而達到降低基本失效率(故障率),提高使用可靠性的目的。20世紀50年代,日本人發現,溫度降低10℃,元器件的失效率可降低一半以上。實踐證明,對元器件的某些參數適當降額使用,就可以大幅度提高元器件的可靠性。因電子產品的可靠性對其電應力和溫度應力比較敏感,故而降額設計技術和熱設計技術對電子產品則顯得尤為重要。
一款流量計的電源前期設計,未采用降額設計,其調整管僅按計算其功耗為0.8W(在常溫20℃~25℃),選用額定功率為1W的晶體管。結果在調試時和在用戶使用中發生故障頻繁。分析其原因主要是該管額定功耗1W時的環境溫度為25℃,而實際工作時該管處于的環境溫度為60℃,此管此時實際最大功耗已達1W。經可靠性工程師分析和建議,選用同參數2W的晶體管,這時降額系數S≈0.5。因而產品的故障很快得到解決。
電氣應力:電路中元器件的實際工作條件(如電流、電壓)相對于其額定值的偏離程度也會影響失效率。
使用時間:失效率通常會隨著時間增加,尤其在產品的“浴盆曲線”早期(早期失效期)和后期(損耗失效期)更加明顯。

失效率模型的應用:不同的失效率標準采用不同的模型。例如:
MIL-HDBK-217:美國軍方標準,包含了廣泛的元器件失效率模型,涵蓋多種環境和應力因素。
Telcordia SR-332:主要用于通信設備的可靠性預計,常用于工業和商用電子設備。
FIT(Failures in Time):每十億小時的故障次數,常用于現代商業標準。
系統級別可靠性預計:通過匯總電路板上所有元器件的失效率,可以計算整個電路板的失效率或MTBF。通常采用“串聯系統模型”來計算,即假設所有元器件串聯工作,如果一個元器件失效,整個系統也會失效:
其中,
MTBF的計算:根據總失效率,可以計算平均故障間隔時間(MTBF):
這個值反映了系統在統計上平均無故障工作的時間。
雖然這種方法是可靠性預計的主流手段,但它有以下局限性:
未考慮系統級故障:元器件的失效并不總是系統級故障的唯一原因。連接、焊接、熱管理等也會導致系統失效,但這些因素通常在預計中被忽略。
環境復雜性:實際運行環境可能比預計模型中的假設要復雜得多,導致實際可靠性與預計值存在顯著差距。
元器件失效模式不全:預計模型通常只涵蓋一些常見的失效模式,而許多不常見的故障模式,如系統級噪聲、電磁干擾、機械應力等,往往無法在預計中反映出來。
因此,雖然基于電子元器件失效率的預計在設計初期有助于評估系統可靠性,但仍需通過實際測試和驗證來確認電路板的可靠性。
可靠性預計(Reliability Prediction)在實際設計中的效用常常受到質疑,原因可能包括以下幾個方面:
模型假設不夠精確:大多數可靠性預計模型(如MIL-HDBK-217、Telcordia等)基于統計數據和歷史經驗,而這些數據往往是對大量組件的統計平均值,不能反映每個具體應用場景的獨特性。它假設的使用環境、應力水平等可能與實際使用情況不符,導致預計結果偏差。
不考慮實際工作條件:很多可靠性預計方法沒有充分考慮到組件在實際操作中的復雜工作條件,如溫度、濕度、電氣應力等因素。在現實中,組件通常工作在特定的環境下,遠比預計中的靜態或理想條件復雜。
難以反映實際故障模式:實際中的許多故障是復雜的系統級別問題,可能涉及多個子系統、接口或環境因素。傳統的可靠性預計主要針對單個組件進行,難以反映系統級別的問題或實際運行中的意外情況,如機械磨損、振動、電磁干擾等。
設計動態變化:在快速發展的技術環境中,設計往往在產品開發的過程中不斷修改,可靠性預計基于早期的設計進行計算,無法適應設計變更,導致預計結果在實際生產中失去參考價值。
不適用于新技術:可靠性預計模型通常基于歷史數據,但在新技術、材料或生產工藝中缺乏足夠的統計數據進行預計。例如,新的半導體技術、3D打印等領域,可能沒有成熟的可靠性模型來支撐。
過度依賴數據:可靠性預計依賴于組件的故障數據和統計模型,但實際故障常常由設計缺陷、制造問題或用戶誤操作引發。這些問題無法通過可靠性預計中的公式和數據直接推導出來。
實際設計中的設計缺陷更多:由于我們設計過程中,例如熱設計不滿足要求,結構本身的震動特性有缺陷,芯片的電應力、溫度應力不滿足要求,電源紋波過大,信號與時鐘時序不滿足全溫度范圍的要求,等等設計缺陷在設計測試階段沒有完全被暴露和解決,導致帶病出貨。往往還沒到芯片常規失效率的程度,系統本身就掛了,這是當前很多產品的主要矛盾。
在實際設計中,更有效的方法往往是可靠性測試和加速壽命試驗,通過模擬實際的工作條件或加速應力測試來評估產品在特定環境下的性能表現。這些測試可以捕捉到預計無法預測的實際使用中的問題。
因此,可靠性預計更多是作為一個參考工具,幫助設計人員初步評估系統的潛在問題,而不是取代實際測試和設計優化的手段。


評論