摘 要: 結合星載計算機的開發,從FMECA、抗輻照設計、ESD防護、結構力學設計與分析、熱設計與分析、可靠性預計等方面闡述了星載計算機設計過程中的可靠性設計與分析方法。
關鍵詞: 星載計算機;可靠性; FMECA; ESD; 抗輻照; 可靠性預計; 熱分析; 力學分析
?
作為工控計算機的一個成員,星載計算機是航天器重要系統的核心部件,特別是控制系統的控制計算機是航天器中十分重要的部件,其可靠性直接決定了控制系統乃至整個航天器的成敗。
與其他領域工業控制計算機的區別在于,星載計算機在空間飛行,承受惡劣的空間輻照環境而且不可維修,因此,要求星載計算機在規定的時間內必須具有高可靠性:出現單故障不影響任務的執行,出現雙故障情況下不應該對飛行器和航天員造成危險。而且星載計算機必須具有很高的故障檢查覆蓋率,并且能夠快速實現故障的自動檢測、隔離和恢復(FDIR)。
本文以某星載計算機的可靠性設計為背景,介紹了可靠性設計與分析技術在星載計算機設計中的應用,特別是FMECA分析技術、抗輻照設計技術和結構力學分析與設計技術、ESD防護技術。
1 星載計算機的組成與功能
星載計算機的主要功能是負責采集互聯部件的狀態和信息,根據設定的算法進行互聯部件的控制,確保特定功能的可靠實現。星載計算機屬于典型的嵌入式計算機,一般采用冗余備份設計以提高可靠性。圖1描述了一臺典型的的星載計算機的組成。該星載計算機采用雙機冷備份容錯結構,由OBCA、OBCB、FT板、PDUA、PDUB、總線背板和機箱組成,其中, PDUA中各功能板和PDUB中對應功能板完全一致,負責星載計算機內部電源的分配、切換。OBCA和OBCB是完全相同的兩個單機,每個單機包括以高可靠性處理器為核心的嵌入式計算機系統。FT模塊為星載計算機的核心單元,負責故障的檢測、單機切換、當班仲裁等容錯功能的實現。
?
星載計算機屬于關鍵項目產品,對任務成敗至關重要??煽啃怨ぷ髫灤┓桨冈O計、詳細設計、生產、試驗等各個環節。
在星載計算機的設計過程中,需要開展FMECA、抗輻照設計、ESD防護、EMC設計、結構力學、熱設計與分析以及可靠性預計等工作。在試驗階段需要完成各種環境試驗,包括應力篩選、力學振動和沖擊、熱真空和真空放電、熱循環和高低溫老煉、熱平衡試驗以及EMC試驗。只有通過上述試驗的星載計算機,才能參與飛行任務。
本文主要從FMECA、抗輻照設計、結構力學、熱設計與分析以及可靠性預計等方面介紹星載計算機的可靠性設計與分析工作。
2 FMECA
故障模式、影響及危害性分析FMECA(Failure Mode,Effects and Criticality Analysis)是在工程實踐中總結出來的,以故障模式為基礎,以故障影響或后果為中心,根據分析層次,并通過因果關系推理、歸納進行的分析活動。
?FMECA通過逐一分析星載計算機各組成部分的故障對系統整體工作的影響,可以得到產品的I、II類故障清單,單點失效清單以及可靠性關鍵項目清單,從而識別出設計中的薄弱環節和關鍵項目,并為評價星載計算機及其各組成部分設計的可靠性提供參考和依據。同時,適時地、有效地應用FMECA技術,還能夠為預防和控制故障、改進產品設計和生產工藝、降低研制風險提供有價值的信息。實施FMECA 的步驟如圖2所示。
FMECA是一個反復循環迭代的過程,其原理應作為設計人員的基本思維方式,貫穿整個設計過程。FMECA的結果應隨研制工作的進展加以更新。FMECA還特別強調“事前預防”,即盡可能在產品設計確定之前實施分析和改進,以最大限度地降低故障危害。
FMECA包括故障模式及影響分析(FMEA)和危害性分析(CA)兩部分內容。FMEA的基本分析方法包括硬件分析法和功能分析法。硬件分析法是目前星載計算機研制中實施FMEA的主要分析方法。該方法列出每個獨立的硬件產品,分析每個硬件可能的故障模式及其影響,一般是以自下而上的方式進行,分析從最低層次產品開始,逐級向上。CA是FMEA的擴展和繼續,因此,它要求在FMEA結果的基礎上進行。CA的內容是根據每一個故障模式所造成后果的嚴酷度類別及故障模式的發生可能性,對其進行綜合度量并排序。
3 抗輻射設計與分析
空間輻射是造成航天器電子設備異?;蚬收系闹匾?,國內外對航天故障的統計顯示:40%左右的故障源自太空輻射[1]??臻g輻射對星載計算機影響較大的輻射效應主要有:總劑量效應、單粒子效應和高能電子的內帶電效應。
3.1 總劑量效應防護
總劑量效應一般指“電離總劑量效應”,即空間帶帶電粒子入射到吸收體后,產生電離作用,吸收體通過原子電離而吸收入射粒子能量,從而使對電子元器件及材料產生總劑量損傷。目前在星載計算機設計過程中采取的措施包括:
(1) 電子元器件選用。在條件允許的情況下,盡量選用自身耐輻射總劑量能力高于其使用位置的輻射劑量分析值的元器件,這是提高產品抗總劑量能力的首選方法,可以從根本上提升產品的抗輻射電離總劑量能力。
(2) 總劑量局部屏蔽防護。根據輻射屏蔽防護的原理,可針對產品的輻射敏感區域或元器件,在局部采用具有一定質量面密度的屏蔽材料(如鉭等),使該敏感區域內的輻射總劑量得到一定程度衰減。
(3) 多機冷備份交替工作。研究表明,電子元器件在加電偏置與不加電偏置的狀態下,受輻射損傷的程度不同,有的元器件在加電偏置狀態更易受損傷,而有的元器件則相反。根據這種現象,在產品設計時可以采用多機冷備份,使其交替工作,每個單機工作的時間應小于其受輻射劑量而失效的時間。這樣就能保證任何一臺單機都不會工作在最易受輻射損傷的狀態,從而延長產品在空間輻射環境下的使用壽命。
(4) 系統容差設計。電子元器件遭受電離總劑量損傷時,往往最先表現為某些性能參數的漂移。而系統往往在某些元器件參數漂移達到一定程度時才發生故障。因此,在系統設計時,采用良好的容差設計,就能夠使系統在遭受較大總劑量輻射,某些元器件已經開始出現參數漂移的情況下,仍然能夠正常工作,最大程度地挖掘系統的抗總劑量輻射的潛力。
(5) 空間輻射劑量分析。在星載計算機產品設計過程中,要保證產品能夠耐受軌道空間輻射劑量,首先應對產品在壽命期內所受的輻射劑量進行分析和估算,以確定該產品抗總劑量效應設計的目標,避免設計不足和過設計。
3.2 單粒子效應防護設計
單粒子效應是單個高能質子或重離子入射到電子器件上所引發的輻射效應,根據效應機理的不同,分為單粒子翻轉(SEU)、單粒子鎖定(SEL)、單粒子燒毀(SEB)、單粒子柵擊穿(SEGR)等多種類型,其中影響星載計算機的效應主要是單粒子翻轉和單粒子鎖定。星載計算機主要從以下幾個方面進行防護設計:
(1) 電子元器件選用。選用具有抗單粒子效應能力的加固器件,可以從根本上大幅度提高航天器電子系統的單粒子效應防護能力。
(2) 存儲器單粒子翻轉防護。星載計算機存儲器的抗單粒子翻轉設計應遵循以下原則:重要程序和數據以及不再更改的程序放在ROM存儲器中;采用EDAC(Error Detected And Corrected)技術對重要數據存儲器進行SEU防護;采用三重冗余存儲及表決系統對存儲的數據進行保護。
(3) 控制器件單粒子翻轉防護:采用多級冗余和容錯系統;采用看門狗電路(WDT);軟件自診斷程序;程序卷回;程序模塊間隔離;建立健康和安全模式;地面遙控注入。
(4) 單粒子鎖定(SEL)防護設計:采用CMOS/SOS或CMOS/SOI器件,其工藝特性保證不會發生單粒子鎖定效應;電源端限流,抑制鎖定發生或減輕鎖定造成的危害;定時監視,可解決單粒子引起的微鎖定問題;多機系統單獨供電,以避免鎖定危害擴大;遙控斷電能力,通過斷電來解除鎖定。
3.3 高能電子的內帶電效應防護設計
空間高通量高能電子(主要是能量大于1 MeV的電子)穿透航天器的蒙皮、結構及設備外殼,在航天器內部的電路板、導線絕緣層等深層絕緣介質中堆積電荷,造成介質深層帶電,即所謂的內帶電效應。只需嚴格遵循一定的防護原則,內帶電效應的防護就能獲得滿意的效果。采取的措施包括:
(1) 采用足夠厚度的屏蔽,阻擋引發內帶電的高能電子,以減少內帶電效應的發生。
(2) 所有航天器結構必須接地良好,尤其絕緣性能較好的部件。
(3) 所有電路板應設置與航天器結構相連的接地路徑,以提供良好的電荷泄放路徑。
(4) 在航天器上限制使用絕緣性能良好的介質材料,尤其不要大面積使用。
(5) 介質材料須具備一定的導電性,以增加累計電荷的泄放能力,當介質材料的電阻率小于1012 Ω.cm時,可有效防止內帶電效應發生。
4 結構力學分析
從航天器發射到入軌之間的這段時間內,星載計算機要承受很大的振動和沖擊,因此,在結構設計方面對星載計算機提出了更高的要求。
為了對星載計算機的機箱結構設計進行初步的分析和評價,以產品的鑒定級試驗條件作為輸入參數,使用有限元分析軟件ANSYS對星載計算機整機級和印制板組件級進行結構靜力和動力分析,得到印制板組件的基頻、整機的基頻以及整機和印制板組件的靜動力的應力和應變響應情況,進而對結構和電路板進行了安全裕度計算和分析結果評價,根據其評價結果對設計進行優化。
有限元分析法就是將連續的結構離散化,把結構劃分成有限個單元體,將相鄰單元在單元體的節點處連接起來形成一個與原來結構構形相同的有限單元組成的網絡結構。利用單元的力學性能和質量特性參數,求得結構的剛度矩陣和質量矩陣。在給定的整體邊界條件下輸入結構載荷,用迭代計算求解結構力學方程,即可求得所需的分析數據,如結構的前m階固有頻率、節點的響應加速度、單元的應力等。針對星載計算機設備結構設計而言,用有限元法分析技術主要進行如下分析工作:
(1) 靜力分析。在飛行過載條件下,分析設備結構的應力和變形,以對產品結構進行強度校核。
(2) 模態分析。分析機箱與電路板組件的模態頻率和振型,為合理設計電路板組件和機箱的結構、尺寸和邊界的支撐連接提供依據。
(3) 動力分析。在規定的外力載荷或試驗的環境載荷條件下,分析機箱與電路板組件的各關心部位的響應情況,為合理設計機箱和電路板組件的結構、尺寸、邊界的支撐連接和調整元器件布局提供依據。圖3和圖4描述了不同工況下的力學分析云圖。
5 熱設計與分析
電子產品的熱設計是指在給定的邊界條件下,通過調節元器件散熱路徑和熱阻,或采用冷卻、加熱或恒溫控制等措施,將元器件工作時產生的廢熱傳給機箱殼體或周圍環境,保證電子產品及其元器件能夠正常工作的設計技術。
航天電子產品與普通電子產品熱設計的主要區別就在于航天電子產品絕大多數都工作在真空環境下,因此基本不存在空氣對流散熱的熱傳導路徑。根據航天電子產品的工作環境及特點,其熱設計應遵循以下基本原則:
(1) 元器件選擇。應優先選擇耐溫范圍寬的元器件、功耗低和熱阻較低的元器件。
(2) 元器件布局。元器件的布局應力求熱功耗分布均衡,避免局部區域熱功耗過于集中;熱功耗大的元器件,應與機箱殼體有良好的散熱路徑。
(3) 元器件安裝。增大元器件與印制板的接觸面積,降低接觸表面的粗糙度,增大接觸壓力,在接觸界面間填充導熱填料是減小安裝面接觸熱阻的有效途徑;為減小傳導熱阻,熱功耗大的元器件也可借助于導熱條、導熱板或導熱管散熱。
為驗證熱設計的有效性,盡早找出熱設計中的薄弱之處,一般在產品設計初期應對產品進行熱分析:根據熱設計輸入條件,利用Flotherm軟件建立印制板和電子產品整機的熱分析模型,計算電子元器件的溫度,檢查元器件的結溫(或殼溫)是否低于允許的值。必要時,對產品進行熱平衡試驗,驗證并修改整機的熱分析模型。圖5和圖6分別描述了某星載計算機整機和某單板溫度云圖。
6 可靠性預計
可靠性預計是定量地估算設備或系統設計是否滿足規定的可靠性要求的過程。預計結果可給出影響可靠性的因素,為設計決策提供產品可靠性的相對度量,作為決策依據之一。在研制階段的早期進行可靠性預計是最有用、最經濟的??煽啃灶A計是產品設計的一部分。
可靠性預計步驟流程圖如圖7所示。可靠性預計的主要目的是對系統、分系統及設備的可靠性進行預測,以確定設計是否能滿足規定的可靠性要求,是否需要對設計進行適當的修改??煽啃灶A計是從可靠性角度出發,對不同的設計方案進行比較,為設計決策提供依據;發現設計中的薄弱環節,為設計改進或生產過程控制以及可靠性試驗方案設計提供依據。可靠性預計步驟如下:
(1) 根據系統組成及功能,建立系統可靠性模型,確定任務階段應力和環境因素。
(2) 元器件清單:系統各設備、功能模塊所包含的元器件類型、數量、質量等。
(3) 元器件熱分析及應力分析:得到可靠性預計元器件應力分析法所需要的溫度、電應力等信息。
(4) 根據元器件失效率手冊收集可靠性預計用數據源:如采用美軍標MIL-HDBK-217F 收集元器件失效率預計有關的數據。
(5) 元器件失效率預計:根據相關標準規范(如美軍標MIL-HDBK-217F)進行預計,或根據實際經驗和試驗數據確定。
(6) 按可靠性模型預計系統可靠性:根據任務時間、環境因子等逐級進行預計,直至系統。
(7) 檢驗與系統要求的一致性:預計結果滿足要求,則預計結束;否則,指出可靠性薄弱環節,提出設計改進建議,待設計改進完成后再重新進行可靠性預計,直至滿足任務要求。
以某型號的雙機冷備份星載計算機為例,其可靠性預計采用“元器件應力分析預計法”,其元器件失效率計算依據是《電子設備可靠性預計手冊——美軍標MIL-HDBK -217F》,采用了Relex Reliability Software V7.6進行計算。圖8是某星載計算機的可靠性模型。按照工作壽命2年進行計算,計算結果如圖9所示,可靠度R=0.994 749,滿足星載計算機可靠性指標要求。
?
本文介紹了星載計算機設計過程中采用的可靠性設計和分析方法,通過這些方法提高了星載計算機的可靠性,確保了星載計算機在軌飛行的可靠與安全。這些方法不僅適合星載計算機的設計與分析,對其他工業領域的工業控制計算機的可靠性設計也具有借鑒意義。
參考文獻
[1] ?BEDINGFIELD K, LEACJ R, ALEXANDER M. Spacecraft ?system failures and anomalies attributed to the natural?space environment. NASA Reference Publication-1390,?August, 1996.
[2] ?航天器電子產品可靠性設計.航天科技集團五院科研質量部.
[3] ?Design guidelines for assessing and controlling spacecraft?charging effects. NASA Technical Paper, 2361.
[4] ?GJB 1649-93. 電子產品防靜電放電控制大綱,1993.
[5] ?衛星可靠性設計指南.中華人民共和國航天行業標準QJ2172A, 2005.