AMD:扎實的路線圖帶來資金,而更好的路線圖,甚至更多的收入
犯錯形成惡性循環,但也有良性循環,比如自己從困境中爬出來,不僅不再犯錯,還通過良好的工程、努力和一點運氣追趕并超越競爭對手。
英特爾在過去十年數據中心掙扎(主要是因為代工部門的失誤)對AMD不利,就像AMD在前十年跌倒也沒影響一樣。由于多種問題,AMD十年前被徹底從bitbarns中徹底擊敗,不得不像初創公司一樣贏得CIO的信任,先是用CPU,現在則憑借GPU以及通過收購Xilinx、Pensando和ZT Systems獲得的部分網絡協議棧和系統設計。
現在,AMD首席執行官蘇淑娟及其核心高管團隊表示,AMD已準備好搭乘AI浪潮,獲得超過其份額的傳統企業計算。
這是本周在紐約為華爾街觀眾舉辦的金融分析師日的主要信息。AMD不主辦FAD活動,因此它們對于幫助大家同步預期和調整預測非常重要。第一次會議是在2009年舉行的,那年英特爾的Xeon系列非常出色,而Opteron系列則不太理想。前首席執行官羅里·里德在2012年公司淡化數據中心業務時曾舉辦過一次重要會議,但到2015年,蘇成為CEO,首席技術官馬克·佩珀馬斯特公布了AMD的“禪”架構和數據中心的救贖目標。2017、2020、2022 以及現在的 2025 年的 FAD 活動都為這一救贖之路劃定了里程碑,現在可以肯定地說,AMD 比宿敵英特爾更可靠地供應高性能 CPU 和 GPU,并且是 GPU 和 DPU 的可信替代品,從明年開始, 針對Rackscale AI系統。
我們已經思考了近五小時的FAD 2025演示,現在很高興基于AMD高層本周的說法以及我們對英偉達的期待,分享我們自己的模型。
AMD對數據中心總可覆蓋市場的外殼更新,以及公司對其CPU和GPU計算引擎相較整體TAM表現的評估——這主要是針對銷售給數據中心的硅片,而非由硅片構建的系統或添加的軟件,從而真正構建一個可運行的系統。AMD賣芯片并免費贈送軟件,所以它只計算CPU、GPU(包括其HBM內存,且轉售)、DPU、機架級系統擴展網絡,以及擴展網絡的DPU。
直到現在,蘇氏一直為數據中心AI加速器提供TAM(計量計量)和預測,供您參考,以下是過去兩年所有的預測:

我們在六月時對預測做了很多“巫術”,試圖將AI訓練硅與AI推理硅分開,然后將這些數據與AI推理和訓練系統可能帶來的收入相匹配。粗體紅色和粗體藍色斜體數字是The Next Platform為填補空白、進一步認證和量化AMD的TAM模型所做的估算。
這次在FAD 2025上,AMD只是談論數據中心整體,然后向華爾街展示其CPU和GPU業務的表現。以下是蘇氏的新數據中心TAM圖表:

“說TAM是什么總是很難,”蘇在開場白中承認?!爱斘覀冏畛蹰_始討論人工智能TAM時,我記得我們最初是3000億美元,然后更新到4000億美元,再到5000億美元,我想你們很多人都說,'Lisa,這似乎太高了。你為什么會認為這些數字會這么高?”事實證明,就人工智能加速發展而言,我們可能更接近正確而非錯誤。這實際上是通過與眾多客戶的大量討論,了解他們如何看待自己的計算需求?!?/p>
這就是AMD,在很大程度上,英偉達都在追求的TAM。(英偉達的規模稍大一些,因為它在數據中心也銷售擴展型和跨網絡擴展功能。但我們暫且不談這個。)
“毫無疑問,數據中心是最大的增長機會,AMD在這方面處于非常非常有利的位置,”蘇繼續說道。“我真正想強調的是,我們的策略一直非常非常一致。我認為在科技領域你必須這樣做,因為坦率地說,這些產品周期很長。這些是我們的戰略支柱。我們從計算技術領導力開始,這對我們所做的一切至關重要。我們非常專注于數據中心的領導力。而數據中心的領導力包括硅芯片、軟件以及與之配套的機架級解決方案?!?/p>
蘇在演講中表示,AMD的數據中心AI收入在未來三到五年內將實現超過80%的復合年增長率(CAGR),并且同期公司可能擁有超過50%的服務器CPU收入份額,超過40%的客戶端CPU收入份額。 以及超過70%的FPGA收入份額。她補充說,AMD數據中心部門在未來三到五年內將以超過60%的復合年增長率增長,核心客戶、嵌入式、定制和FPGA業務同期將實現10%的復合年增長率,推動AMD整體收入復合年增長率超過35%。最后,蘇表示,AMD預計2025年收入約為340億美元,其中約160億美元來自數據中心部門;我們預計今年它將在Instinct數據中心GPU銷售額上達到約62億美元,Epyc服務器CPU銷售額約93億美元,另外還有少量用于DPU和FPGA銷售。
在把這些都輸入神奇的電子表格之前,先聊聊復合年增長率(CAGR)。CAGR的原理是取數據集的任意兩個端點,在該數據集上畫一條直線,然后計算這條直線的斜率。它是一個非常粗糙的工具,完全忽視了任何市場中自然會出現的起伏。特別是在人工智能領域,我們認為——順便說一句,蘇也持相同觀點——未來幾年的增長將高于TAM模型后期。我們也認為2026年、2027年和2030年將是人工智能市場整體增長良好的年份。我們的模型也反映了這一點。
那么,廢話不多說,這里是AMD型號,順便說一句,我們還插入了Nvidia數據中心的日歷銷售數據。(請記住,英偉達的財政年度在1月結束,因此你需要將N、N-1和N-2財年的1月收入減去N-1財年的收入,再將N-2財年的1月收入加到N-1財年,才能得到當日歷年的預估收入。)看看:

一些觀察。從數學上講,似乎不可能讓AMD數據中心收入以60%的復合年增長率增長,同時AMD總收入增長速度遠快于35%的復合年增長率,同時又要將核心AMD業務(PC、嵌入式和FPGA)的復合年增長率保持在10%。我們的模型試圖平衡這一點,同時保持數據中心AI收入機會在預測結束時超過1000億美元。
讓我們先聊聊CPU業務,同時深入分析這張表。首先,AMD計算與企業AI總經理Dan McNamara介紹了未來基于Zen 6和Zen 6c核心的“Venice”Epyc處理器的規格,這些處理器將于2026年發布。

當我們計算“線程密度”語句并以1.33作為乘數時,Zen 6版本有172個核心,Zen 6c半緩存版本有256個核心。Zen 5版本的“Turin”Epyc 9005芯片最高為128核,Zen 5c版本則有192核心。
McNamara還介紹了另一張有趣的圖表,那就是由于由GPU驅動的生成式AI工作負載,服務器CPU市場的復興。我們早就說過,如果把AI系統排除在外,通用服務器市場正處于衰退狀態,正如你從下面的數據中看到的,情況確實如此:

只有高端AI系統服務器CPU銷售使市場從2022年到2023年保持平穩,實際上2024年通用服務器收入下降更快,但這得益于AI系統CPU銷售。(我們認為同樣的總體趨勢也反映在系統收入層面,甚至因每臺GPU銷量增加及其更高成本而被放大。)
今年,得益于需要升級和整合工作負載以提升效率的老舊機器群,從而釋放了電力、空間和預算給AI系統,通用服務器市場(及其CPU子集)再次崛起,AMD預計增長將持續到2030年。但預計AI服務器CPU市場的份額將從2025年的約82億美元增長到2030年的約300億美元,按服務器CPU標準來說這是一個巨大的激增。
關鍵是,AI工作負載需要大量串行處理,而它們需要快速且昂貴的處理器來完成。
在AMD數據中心GPU方面,MI350和MI355X GPU正在逐步升級,但所有目光都集中在明年的MI400系列上,這些系列將接入AMD與Meta Platforms合作打造的“Helios”機架,且不少關注者還在更遠的未來展望2027年,屆時新一代機架搭載MI500系列GPU。
以下是“Altair”MI450系列的基本規格,我們之所以將其代號命名,是因為AMD拒絕相信其GPU的代號:

雖然在FP4和FP8精度下,flop很重要,但更重要的是HBM4存儲器的容量和性能。我們認為這意味著,FP16訓練將獲得比GPU更高效的內存容量和帶寬,而且在FP8和FP4模式下,還將有足夠的內存帶寬,能夠更快處理上下文令牌,輸出答案令牌的速度超過了之前甚至現有的Nvidia和AMD顯卡。
據我們所知,MI400系列有三個變體,均采用臺灣電路制造股份有限公司的2納米(N2)工藝蝕刻,正如蘇斌本周指出的,是全球首批采用該工藝的芯片。MI450 旨在實現八路開放式主板設計,采用由 Microsoft 和 Meta Platform 開發、AMD 和 Intel 目前采用的 OAM 模塊(但未被 Nvidia 采用)。上圖所示的MI450X集成在Helios機架系統中,AMD則開始推出72塊GPU串聯在一起的Helios機架(類似Nvidia“Oberon”機架中的NVL72配置),但也有64塊GPU和128塊GPU的版本。MI455X是高端型號,我們認為它擁有432 GB的HBM4容量——遠超今年早些時候討論的288 GB。
Helios機架在FP8精度下可實現1.45億次浮點次,FP4精度下為2.9億次浮點次,配備31TB的HBM4總內存,MI455X的總帶寬為1.4 PB/秒。UALink over Ethernet(UALoE)擴展網絡作為Nvidia NVSwitch的替代方案,提供260 TB/秒的總帶寬,覆蓋72塊GPU(每塊3.6 TB/秒),機架擴展網絡帶寬為300 GB/秒。
以下是AMD如何比較其Oberon機架中未來Vera-Rubin計算引擎與Helios機架中Venice-Altair計算引擎的比較:

在我們看來,這看起來相當平手......
關于Altair GPU的MI430X變體知之甚少,只知道它面向正在成為國家實驗室AI中心的高性能計算中心:

我們強烈預期MI430在單位能源和成本下能擁有更高的64位浮點性能,但AMD如何實現還有待觀察。今年早些時候,我們從AMDGPU平臺副總裁、IBM Power CPU項目長期經理Brad McCredie那里得到了一些提示。在我們的對話中——Brad McCredie是AMD數據中心GPU金屬的踏板——我們建議將芯片組拆分為具有不同浮點精度的計算單元,然后根據需要添加具有FP64/FP32、FP16、FP8和FP6/FP4精度的芯片組,同時在不同的芯片組上保留向量和張量的數學單元。 太。他暗示AMD可能在策劃某些事情,但并不具體。
這就引出了最后一個重要圖表,AMD機架級GPU系統的近期未來:

除了“Verano”一代Zen 7和Zen 7c處理器外,AMD還將推出MI500系列——我們還未決定代號,因為我們給AMD機會自行決定——同時堅持使用為Helios機架打造的“Vulcano”一代DPU。
AMD對MI500系列GPU沒有太多透露,但這里有一個相對的性能路線圖:

如果按比例繪制,MI500系列的浮點數峰值峰值約為72千萬億次浮點,比MI455X高出80%,比剛開始升級的MI355X高出7.8倍。
公司確實會購買路線圖,而不是點點產品,但他們總得買點東西才能完成任何事情。你總是想等待下一代計算引擎完成更多工作,但如果你想完成工作,就不能讓買家的后悔阻礙你。AMD、英偉達等公司可以指望這一點——事實證明,這一切都會一直支持。
看看我們上面做的表格里AMD和英偉達的全部資金。










評論