久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > EDA/PCB > 設計應用 > 確保多芯片組件的可靠性變得更加困難

確保多芯片組件的可靠性變得更加困難

作者: 時間:2025-11-04 來源: 收藏

將各種具有明顯不同物理特性的材料和工藝結合在一起,在制造和封裝方面帶來了重大挑戰,可能會影響零時良率和現場

在生產線末端通過電氣篩選的東西在紙面上可能看起來不錯,但一旦暴露于快速和反復的熱循環、機械應力和由于利用率較高而加速老化,這些設備仍然可能失效,尤其是在人工智能數據中心。當多個芯片集成到同一個封裝中,并通過細間距互連連接在一起時,問題尤其嚴重。設備出廠后,附著力破壞、分層、應力開裂和潛在的電氣缺陷都可能浮出水面。

因此,該行業正在從最大限度地提高測試通過率和通過標準測試轉向更廣泛的測試和檢查,以確保封裝能夠承受多年的使用條件。

“在經歷過程熱循環時保持平面性和機械完整性是使異質材料協同工作的最大挑戰之一,”Brewer Science 高級應用工程師 Amit Kumar 說。“材料熱膨脹系數的不匹配會導致不同界面處出現應力相關缺陷,并可能導致封裝內的結構缺陷。”

這種認可正在推動材料、檢測、測試、過程建模和設計集成方面的新方法。

以材料為基礎
的基礎是材料科學。粘合劑、粘合化學品、電介質和底部填充物被用來支持日益精細的特征和激進的熱循環。在異構集成中,邏輯、存儲器和專用器件組合在一個封裝中,熱膨脹系數或機械強度的不匹配通常決定組件是否能夠經受住現場使用。

早期材料評估至關重要。在產量增加之前,必須充分了解釋氣、顆粒生成和化學兼容性。粘合層必須在熱限制范圍內保持完整性,因為材料層面的微小可靠性故障會迅速擴大為系統性良率損失。

“可靠性風險不會在流程的后期出現。他們從基本的材料相互作用開始,“Brewer Science 控制工程經理 Matt Rich 說。“如果粘合劑或電介質在實際條件下不穩定,那么下游檢查和測試只是發現從一開始就內置的故障。”

沒有單一的材料參數可以保證可靠性。附著力、抗應力和熱穩定性都必須同時平衡。因此,材料工程師必須與工藝和包裝團隊更緊密地合作,打破傳統的孤島,并在選擇和鑒定階段的早期嵌入可靠性模型。

先進封裝堆棧現在結合了低介電電介質、聚合物粘合劑、金屬互連和屏蔽層。它們中的每一個都具有不同的熱、機械和化學特性。管理這些異質材料之間的相互作用不僅需要了解單個材料的性能,還需要了解它們作為一個系統在壓力下的行為。

隨著包裝的發展,材料選擇的權衡成倍增加。混合鍵合和堆疊芯片應用需要具有高耐化學性的粘合劑進行加工,并需要高效的脫模機制進行返工。材料必須平衡高模量,以防止邊緣周圍開裂,并具有足夠的柔韌性來吸收熱應力。這些相互競爭的要求傳統上被迫妥協,但正在開發新的材料系統來同時滿足這兩種需求。

可靠性的影響不僅僅是機械完整性。釋氣會污染敏感表面。不同材料之間的腐蝕會導致電氣故障。加工過程中產生的顆粒會產生隨著時間的推移而傳播的缺陷。這些問題中的每一個都需要材料層面的解決方案,但影響卻體現在系統層面。因此,可靠性驅動的良率管理必須從基本的材料相互作用開始,而不是將材料視為堆棧中的無源元件。

檢查和測試向預測
發展過去,檢查和測試的重點是檢測即時缺陷。但在先進封裝中,它們的作用正在演變為可靠性風險的預警系統。工程師仍然需要知道設備今天是否通過,但他們還必須考慮它是否能經受住多年的運行。這改變了對檢測和測試基礎設施的期望。

檢測正在轉向可靠性檢測。工具應該捕獲可能不會立即導致性能問題的缺陷,但這些缺陷是現場故障的前兆,例如在應力下傳播的空隙、裂紋或表面不均勻性。

“可靠性風險通常始于看似良性的變化,”Microtronic 應用總監 Errol Acomer 說。“在檢查過程中,熱點或閃光場可能只是顯示為不同的陰影。你會有徹底失敗的死亡,但隨后你會有通過測試的妥協死亡。這些就是我們所說的行走的傷員。如果不將本地檢查數據與更廣泛的過程和測試結果相關聯,您就無法看到實際預測現場故障的模式。

這種相關性挑戰推動了對全面數據集成的需求。測試逃逸代表了一種隱藏的可靠性稅。他們消耗制造資源,通過質量大門,并在失敗之前接觸到客戶。從那里開始,后期生產成本會因保修退貨、聲譽受損而級聯,在汽車等關鍵應用中,還包括安全風險。

數據基礎設施支持長期跟蹤
現代包裝可靠性取決于在較長時間內捕獲和維護過程數據。設備行為、過程漂移和當時看似微不足道的細微變化在數月或數年后分析現場故障時可能會變得至關重要。

“你必須將歷史記錄、完全情境化的過程和機器歷史記錄存儲七年,因為一年零三個月或更短的時間不足以獲得設備故障的長尾,”Cohu Analytics 解決方案 Tignis 的解決方案工程總監 Boyd Finlay 說。“如果你不查看這些數據,你總是會遇到意外的產量事件或意外的停機事件。”

這種長遠的眼光需要的不僅僅是簡單的數據存儲。信息必須是可訪問的,并且需要跨流程步驟、設備類型和組織邊界進行關聯。如果沒有這種連續性,根本原因分析就變成了猜測。

數據關聯對于這種轉變至關重要。如果無法跟蹤芯片或多芯片設備如何從晶圓通過封裝進入測試,現場返回的根本原因分析幾乎是不可能的。挑戰在于構建能夠在復雜供應鏈中保持這些連接的系統。

“真正的挑戰是與客戶合作,確定跟蹤批次移動和分割的實際數據的存儲位置,”YieldWerx 首席執行官 Aftkhar Aslam 說。“它存儲在 MES 系統中嗎?在 ERP 系統中?在 Excel 文件中?挑戰在于確定數據源,導入該數據,并構建邏輯來跟蹤從晶圓到封裝和測試的每個芯片。

一旦建立了家譜,機器學習模型就可以預測哪些批次最容易出現可靠性偏差的風險。預測分析可以減少重新測試、改進容量規劃并更早地標記高風險批次。重點是干預而不是檢測。

然而,在實踐中,該行業的數據孤島可能會減慢糾正措施的速度。OSAT可以將可靠性問題追溯到基板異常,但根本原因可能在于晶圓廠側的應力條件。如果無法訪問完整的譜系,制造商最終可能會追逐癥狀而不是防止故障。缺乏跨供應鏈邊界的標準化數據流仍然是準確預測長期可靠性的核心挑戰。

工藝建模使曲線左
移不能僅在封裝級別保證可靠性。它始于創建器件的工藝步驟的完整性。虛擬硅和屈服吸引器分析正在成為管理上游可靠性的重要工具。工程師可以對整個工藝流程進行建模,以了解變化如何在集成步驟中產生漣漪,而不是一次追逐一個良率故障。

“你對一個收益率進行了更改,其他因素就會增加,導致其他東西在下一次迭代中被追逐,”Lam Research Semiverse 產品董事總經理 Joseph Ervin 說。“通過一次、兩次或三次產量失敗來提高產量的系統非常具有挑戰性。真正的價值是將曲線向左移動,同時解決更多的收益率挑戰,并最終達到盡可能高的收益率。

向可靠性優先的轉變需要重新思考傳統的良率指標。傳統的良率計算側重于特定檢查點的測試通過率,例如晶圓分類、封裝測試和系統級驗證。但這些快照忽略了可靠性的動態性質。通過電氣測試的設備可能仍存在潛在缺陷,例如關鍵界面的邊際粘附、底部填充中的微空隙或在熱循環下傳播的應力集中。這些與時間相關的故障不會顯示在良率數字中,但它們直接影響客戶的可用輸出。

“正是這些多個步驟之間的相互作用為您提供了收益,”Ervin 補充道。“你不能依靠一個流程來解決所有問題,因為之前的所有步驟都會影響下一步發生的事情。在整個空間中創建模型是實現這一目標的重要部分。

通過虛擬捕獲可變性和良率批評者,工程師可以在晶圓到達封裝之前識別出影響可靠性的故障模式。這減少了代價高昂的試錯周期,并在流程的早期嵌入了可靠性裕度。

設計集成可防止系統性風險
可靠性還取決于設計選擇。多芯片系統提高了熱分布、互連密度和分區策略的風險。如果在不考慮封裝限制的情況下做出這些決定,則只有在構建昂貴的原型后才會導致可靠性風險出現。認識到這一點,設計團隊現在正在開發周期的早期納入可靠性約束。在評估封裝選項和芯片分區時,可靠性模型為這些架構選擇提供信息,防止一旦理解了物理約束,有前途的設計就被證明是不可制造或不可靠的情況。

新思科技研發執行總監Sutirtha Kabir表示:“如果你在這個架構探索階段做出了重大的判斷問題,那么你將在未來遇到問題,這將給ECO(工程變更單)和設計迭代帶來嚴峻的挑戰。“建筑師從更廣泛的選擇開始,然后他們必須縮小范圍。如果沒有適當的探索,你就有可能在一條后來被證明行不通的道路上走得太遠。

圖 1:Synopsys 的 Kabir 在 SEMICON West 上討論設計架構和可靠性。資料來源:Gregory Haley/Semiconductor Engineering

圖 1:Synopsys 的 Kabir 在 SEMICON West 上討論設計架構和可靠性。資料來源:Gregory Haley/Semiconductor Engineering

在上游嵌入封裝可靠性約束可以降低代價高昂的后期意外風險。它使設計意圖與工藝能力保持一致,并確保根據長期可靠性來衡量產量。經濟維度很重要,因為可靠性監控需要對先進的檢測系統、環境壓力測試和人工智能驅動的分析進行資本投資。對于汽車或高性能計算等應用,單次可靠性偏移的成本遠遠超過投資,采用正在加速。

SEMICON West 傳達的信息很明確——先進封裝的良率與可靠性密不可分。材料設定極限,檢查和測試提供監控,數據提供相關性,過程建模預測結果,設計集成防止系統性風險。生態系統的每一部分都有助于定義有多少晶圓輸出可以算作可靠的良率。

采用
障礙 可靠性驅動的收益管理仍然面臨許多系統性障礙。最持久的是數據所有權。先進封裝需要晶圓廠、OSAT、基板供應商和測試機構的貢獻,每個工廠都會產生對良率和可靠性至關重要的數據。然而,數據仍然分散在組織邊界上。當故障在下游浮出水面時,工程師通常缺乏對上游流程歷史記錄的可見性,而這些歷史記錄可以提供根本原因。

另一個障礙是驗證預測模型。可靠性需要遠見卓識,但大多數人工智能模型必須根據過去的結果進行訓練。在現場工作多年后才會浮出水面的潛在缺陷使驗證變得復雜。由于對預測沒有信心,制造商不愿意僅根據模型輸出來更改工藝參數或更改設計規則。

漂移和可解釋性是相互交織的問題。人工智能模型可能會預測特定批次的高分層風險,但如果沒有與物理參數的明確聯系,工程師會猶豫是否要相信這些預測。可解釋性正變得與準確性一樣重要。黑盒算法無法在誤報成本高達數百萬美元的環境中推動決策。

檢測模型面臨著一個平行的問題。在一個包幾何體上訓練的算法可能不適用于另一個包幾何體。不一致的再培訓可能會導致誤報,從而因過度報廢或過度返工而造成產量損失。

結果是,采用可靠性驅動的產量管理仍然謹慎。公司將預測分析與現有實踐并行部署,在根據建議采取行動之前需要人工批準。這種混合方法減緩了進展,但反映了半導體制造的風險計算。預測必須被證明,而不是假設。

供應鏈協作供應鏈協作
增加了另一層復雜性。材料選擇是可靠性的基礎,但它們的行為是由與工具、流程和下游環境的相互作用決定的。在孤立測試中表現良好的粘合劑在與特定的清潔化學品或粘合型材搭配使用時可能會動搖。如果沒有早期的跨供應鏈溝通,不匹配就會延遲出現,從而導致可靠性偏差和隱藏的良率損失。

一種解決方案是早期調整。如果材料供應商在上游共享應力和附著力數據,并且 OSAT 反饋實際性能,則可以在集成之前對可靠性風險進行建模。這需要新的商業模式和新技術,因為參與者必須在合作與知識產權問題之間取得平衡。

過程虛擬化提供了部分答案。通過創建捕獲沉積、蝕刻、鍵合和封裝之間相互作用的系統級模型,工程師可以在不暴露敏感配方的情況下模擬可靠性結果。共享模型可以讓合作伙伴在晶圓提交之前虛擬測試兼容性。

經濟壓力推動變革
這些材料層面和工藝層面的決策會波及整個供應鏈,不僅影響即時產量,還影響長期可靠性經濟性,而長期可靠性經濟性可能因應用而異。可靠性監控需要對高級檢測系統、環境壓力測試和人工智能驅動的分析進行資本投資。在汽車或高性能計算領域,單次可靠性偏移的成本遠遠超過投資,因此采用速度很快。在消費類或利潤率較低的領域,權衡基礎設施成本與感知風險會讓制造商猶豫不決。

信任是這一轉變的關鍵貨幣。客戶不僅期望獲得良好的產量,而且期望對設備在現場發揮作用充滿信心。可靠性成為品牌價值的一部分。

材料、檢測、數據、工藝模型和設計集成的融合指向一個可靠性和良率密不可分的未來。盡管如此,這條道路仍然是漸進的。公司正在嘗試預測分析、構建試點孿生并加強數據鏈,但廣泛采用需要時間。包裝流程的多樣性意味著沒有單一的配方可以定義可靠性驅動的良率。每家公司都必須根據自己的架構、供應商和客戶組合調整方法。

結論
在SEMICON West,重點不是可靠性是否應該提高產量,而是如何使這種轉變變得實用。材料的鑒定必須考慮到可靠性。檢查和測試必須演變成預測性監視器。數據必須在不損害知識產權的情況下跨邊界共享。模型必須變得可解釋和可信。這些轉變中的每一個都在進行中,但沒有一個是完整的。

將這些努力結合在一起的是認識到,沒有可靠性的產量是沒有意義的。通過測試但在現場失敗的包裝并不是一個好產品。這是逃脫檢測的延遲廢料。越來越多的人必須通過在現實條件下長期使用下來的實際產量來衡量。從這個意義上說,可靠性不是讓步的附屬品。它定義了可用產量。這種哲學轉變正在推動實際變革。在鑒定過程中,人們更加重視壓力測試,工藝變化和現場回報之間的相關性更加緊密,并且更愿意投資于檢查和監控能力,以便在潛在缺陷消失之前發現它們。

變化的速度因應用和細分市場而異。在監管要求和現場故障不可接受的成本的推動下,汽車和航空航天等高可靠性市場正在引領采用。消費電子產品和移動應用正在更加謹慎地發展,權衡額外測試的成本與保修風險。數據中心和人工智能應用占據中間地帶,可靠性直接影響運營成本和客戶信任。但在所有細分市場中,趨勢都是顯而易見的。可靠性考慮因素正在開發周期的早期進行,并更深入地集成到產量管理框架中。

“可靠性不是你在流程結束時檢查的方框,”Brewer's Rich 說。“這是產量的基礎。從材料選擇到設計架構再到測試環境,每一步都決定了今天的良率是否轉化為明天的可用產品。



評論


相關推薦

技術專區

關閉