內存墻瓶頸:AI計算引發記憶超級周期
在過去幾十年里,半導體行業一直以摩爾定律為驅動力,持續提升晶體管密度,提升芯片性能,降低每單位計算成本。隨著行業進入人工智能時代,縮放定律成為新的目標。通過擴大AI模型規模、訓練數據量和計算資源,開發者旨在實現模型性能的可預測提升。因此,行業關注點已從單個芯片的計算能力轉向整體系統級性能。
在此背景下,內存帶寬和數據傳輸效率的限制變得更加明顯,近年來HBM(高帶寬存儲器)的戰略重要性大幅提升。隨著AI工作負載逐漸從訓練轉向推理,CSP(云服務提供商)正在加速投資AI基礎設施和服務器部署,進一步提升了對DDR5等服務器級DRAM的需求。
因此,三大DRAM制造商繼續將先進工藝產能分配給高端服務器DRAM和HBM,限制了消費級DRAM的供應,推動了新的內存價格超級周期,并擴大了其對消費電子市場的影響。
目前基于Transformer架構的主流大型語言模型(LLM)深度學習在計算性能上高度依賴內存訪問。在訓練過程中,每個生成的代幣都會反復訪問大量數據集、權重和參數,以及推斷過程中的KV緩存。當處理器計算能力的增長遠遠超過內存帶寬和數據傳輸能力時,大量處理時間會花在等待內存數據上,而不是執行計算。當系統性能受限于數據傳輸速度時,就會出現典型的“內存墻”問題。
近年來,GPU等AI芯片的計算能力增長速度遠超內存帶寬和數據傳輸效率。根據《人工智能與內存墻》研究,AI模型兩年內計算能力提升了3×,而內存帶寬僅增加了1.6×連接帶寬增加了約1.4×。因此,大多數計算受限于內存訪問和通信效率,而非原始處理能力。
圖1。峰值硬件FLOPS及內存/互連帶寬的擴展

從理論建模的角度來看,這種結構性不平衡可以用屋頂線模型來解釋。深度學習模型主要由矩陣乘法組成,總計算工作負載以浮點運算(FLOP)衡量。
屋頂線模型提供了一個計算理論上可實現性能的框架,表達公式如下:
$$ P = min left(pi, beta times I right) $$
圖2。屋頂線模型:在計算增長下內存受限區域的擴展

模型表明系統性能受最大可實現性能(π)和最大內存帶寬(β)的限制,膝點標志著達到最大可實現性能所需的最小作強度。
隨著AI芯片計算持續增加(π上升),如果內存帶寬斜率不相應增加(β保持不變),膝蓋點將向上和向右移動,導致更多計算負載處于內存受限區域。換句話說,持續的計算增長加劇了內存對可實現性能的限制。這就是為什么在AI時代,AI巨頭的關注點已從單純增加FLOP轉向了內存軍備競賽。
HBM成為加速AI計算的解決方案
隨著大型語言模型(LLM)不斷擴展,甚至超過萬億級參數,單芯片已無法處理完整的模型計算,而是演變成由多個人工智能加速器組成的集群。集群中包含的人工智能加速器越多,每秒傳輸的數據量在每個人工智能加速器內以及跨芯片之間傳輸的量就越大。
在這種架構中,數據傳輸的挑戰在芯片間(擴展擴展)甚至跨數據中心層面(跨擴展擴展)之間延伸。這不僅造成嚴重的內存墻瓶頸,也使芯片間帶寬變得越來越關鍵。除了InfiniBand和以太網的競爭外,HBM已成為AI加速器的最佳內存選擇。
HBM通過通過硅口徑(TSV)和先進封裝技術垂直堆疊多顆DRAM芯片,并將其與GPU集成。與傳統平面DRAM相比,HBM大幅縮短了數據傳輸路徑,并具備1024位超寬接口,提供遠超傳統GDDR的內存帶寬。
預計2026年量產的HBM4將達到2TB/s的總帶寬,接口寬度翻倍至2048位,同時保持數據傳輸速率超過8.0 Gbps。這使得HBM4能夠在不提高時鐘頻率的情況下將數據吞吐量翻倍,進一步提升AI芯片在高并行性和數據密集型工作負載下的表現。
AI巨頭的規格軍備競賽引發了高產機需求激增
歷代迭代,HBM在性能、輸入輸出數量和帶寬方面不斷進步,成為AI加速器規格升級的核心支柱。近年來,英偉達、AMD和谷歌穩步將AI芯片向新一代HBM遷移,HBM堆棧數量和每顆芯片的總內存容量明顯增加,直接推動了HBM的需求。
根據TrendForce對2025年AI芯片出貨量的估算,HBM需求預計同比增長超過130%。預計2026年,HBM的使用量將持續上升,同比增長仍超過70%,主要得益于下一代平臺如B300、GB300、R100 R200和VR100 VR200的廣泛采用,同時谷歌TPU和AWS Trainium加速向HBM3e的轉型。
圖3。英偉達、AMD和谷歌AI芯片的HBM采用趨勢


AI推理興起推動DDR5需求
隨著人工智能計算逐漸從訓練轉向推理,它越來越多地應用于終端用戶場景。預計到2029年,AI推斷將成為驅動AI服務器的主要動力。
圖4。AI服務器需求預測:訓練與推理(2025F–2029F)

根據麥肯錫公司的一份報告,預計到2028年,AI推斷將超過訓練和非AI工作負載,成為數據中心最大的功耗來源。這一轉變將推動硬件架構和能源配置的全面變革。
針對這一趨勢,行業正在重新評估計算各個階段的硬件配置策略。這對超大規模數據中心運營商在長期規劃電力供應和網絡架構方面具有重大影響。其目標是在有效降低總擁有成本(TCO)的同時,優化性能與成本的平衡。這反映了推理需求正在重塑整個系統數據中心基礎設施。
DDR5配置升級及推斷需求下的價格趨勢
訓練和推斷之間存在記憶需求差異。在“訓練”階段,大數據集會被反復處理,這對內存帶寬提出了極高的要求。帶寬不足可能導致計算單元處于空閑狀態,阻礙最佳性能。因此,配備HBM的AI加速器常被用來避免內存瓶頸。
相比之下,“推理”的內存需求取決于實際計算階段,可分為兩個階段:
預填充:系統一次性處理完整的用戶輸入提示,將文本拆分為標記并執行大規模矩陣計算。這一階段計算量較大,但對內存帶寬的敏感度較低。可以使用經濟高效的DDR或GDDR內存配置。
解碼:模型反復訪問權重參數和KV緩存,逐令牌生成響應令牌。此階段計算需求下降,但內存需求顯著上升。內存訪問的延遲直接影響每次令牌生成的速度。具有高帶寬、大容量內存的內存配置,如HBM或HBF,仍然是最優選擇。
CSP正在擴展通用服務器部署,以滿足日益增長的推理需求。DDR5已成為最佳內存選擇,平衡了性能與成本。這一趨勢導致北美CSP從2025年下半年開始計劃在2026年購買服務器時部署更高的DDR5,進一步推高了DDR5的需求和價格。
根據TrendForce的分析,2025年第四季度,DDR5服務器和HBM3e的合同價格迅速趨同。HBM3e最初定價是服務器DDR5的四到五倍,但預計到2026年底,這一差距將縮小到1到2倍。
隨著標準DRAM盈利能力逐步提升,一些供應商開始將容量轉向DDR5,為HBM3e價格上漲創造更多空間。
表1。HBM 與 DDR5:技術與應用比較
| 項目 | HBM | DDR5 |
|---|---|---|
| 設計架構 | 通過TSV垂直堆疊DRAM并與GPU集成于一個封裝中 | 平面單芯片DRAM,可通過標準DIMM模塊擴展 |
| 總線寬度 | 極寬(每堆1024位) | 更窄(32位x2) |
| 帶寬 | 極高(TB/s水平) | 高(GB/s級別) |
| 總內存容量 | 降低(容量因與GPU聯合集成而固定) | 高(可通過DIMM插槽擴展) |
| 費用 | 非常高 | 相對較低 |
| 功耗 | 下層 | 高 |
| 主要應用場景 | 人工智能模型訓練與推理(解碼階段)、高性能計算(HPC) | AI模型推理(預填充階段)、通用服務器和個人電腦 |

記憶超級周期沖擊,消費電子產品首當其沖
2025年第三季度,AI和通用服務器的內存需求扭轉了市場趨勢,導致供應短缺。三大DRAM制造商優先考慮HBM和高端服務器DRAM產能,但有限的晶圓廠產能意味著2026年供應難以顯著擴展。與此同時,這壓縮了通用服務器和消費級DRAM的供應,推高了整體DRAM價格,預示著新一輪內存超級周期的到來。
TrendForce 預計 2026 年第一季度內存價格將再次大幅上漲,且存儲成本對智能手機、個人電腦及其他消費端點的物料清單影響正在迅速增長。消費電子制造商受影響最嚴重,直接影響出貨量。智能手機和筆記本品牌必須降級規格并延遲升級以控制成本,而DRAM受影響最大,因為它占總成本的很大一部分。
總體來看,高端和中端DRAM容量預計將趨向最低市場標準,從而放緩升級步伐,而所有消費電子市場的低端細分市場預計將受損最為嚴重。
消費電子利潤危機,出貨普遍疲軟
TrendForce于2025年11月首次下調了2026年智能手機、筆記本和游戲主機的全球生產預測。然而,隨著內存價格持續上漲,12月底所有終端設備的估算再次修訂,考慮供應鏈發展。
2026年智能手機產量增長最初預期為0.1%,隨后下調為2%下降,2025年12月底進一步降至3.5%。2026年1月中旬,數據再次修正為同比下降7%。TrendForce進一步分析,即使是相對盈利的iPhone機型,2026年第一季度內存在總物料清單成本中的份額也將顯著增加,迫使蘋果重新考慮新設備定價,并可能減少或取消舊款機型的計劃折扣。對于面向中低端市場的安卓品牌來說,內存是主要賣點之一,其在物料清單成本中的份額已經很高。隨著價格飆升,低端智能手機將在2026年回歸4GB內存,促使品牌調整價格或供應周期以減少損失。
筆記本電腦市場2026年的出貨量已從此前預期的1.7%下調至-2.8%,并進一步調整為-5.4%。擁有高度整合供應鏈和更靈活定價的品牌,如蘋果和聯想,在應對不斷上漲的內存價格時擁有更大的靈活性。然而,低端和消費級筆記本品牌難以轉嫁成本,且受限于處理器和作系統需求,進一步降低規格變得困難。如果記憶價格上漲在第二季度沒有緩解,TrendForce預測2026年全球筆記本電腦出貨量可能同比下降10.1%。
2026年游戲主機出貨預期已從此前預期的同比下降3.5%下調至4.4%。對于任天堂Switch 2、索尼PS5和Microsoft Xbox X等主流機型,內存成本占BOM的比例已升至23%–42%,而過去約為15%。因此,硬件毛利率被大幅壓縮。2026年,三大制造商將難以保留促銷空間或沿用以往以銷量驅動的增長策略,這可能進一步抑制出貨勢頭。如果內存市場狀況不改善,全球游戲主機滲透率預計將進入暫時停滯期。
圖5。智能手機和筆記本電腦DRAM容量規格趨勢


“打破記憶墻”軍備競賽:2026年記憶超級周期與價格飆升展望
與2016–2018年由服務器整體需求驅動、持續約九個季度的內存超級周期不同,這一周期的關鍵驅動力是克服“內存壁壘”。隨著AI芯片計算能力增長速度遠超內存帶寬,系統性能正日益受數據傳輸效率的限制,行業競爭從純計算性能轉向內存軍備競賽。
這一循環由人工智能和整體服務器需求共同推動。為解決內存瓶頸,供應產品組合變得極為復雜,涵蓋HBM、DDR5、企業級SSD及其他高端內存產品,這也影響了標準內存的可用性。
由于產能仍有限,此次內存超級周期預計將延續至2026年。市場已轉為賣方市場,制造商持續提高合同價格,管理產能擴張,并維持高價格水平。預計2026年DRAM價格將上漲超過70%,短缺和價格上漲趨勢預計將持續。


評論