陳立武:英特爾將在AI硬件上與英偉達競爭
據報道,英特爾新任 CEO 陳立武在最新提交的年報中表示,「我們無疑須開發具競爭力的機柜級系統解決方案,借此強化云端 AI 數據中心的市場地位,這將是我跟團隊的優先要務。」
據悉,陳立武瞄準的競爭產品,是英偉達目前最頂級的 GB200 NVL72 Blackwell AI 系統。一名英特爾前高層曾表示,英偉達這套系統是 AI 計算領域的「終極掠食者」(apex predator)。GB200 NVL72 在一臺服務器機柜內部連接了 72 顆 GPU,遠多于上一代的 8 顆 GPU,能在有限空間內提供前所未見的算力密度。
目前,英偉達在 AI 數據中心市場居于霸主地位,占據接近 90% 的 AI 芯片市場份額。AMD 在 2024 年也實現了超過 50 億美元的 AMD Instinct 加速器收入。相比之下,英特爾在 AI 市場的表現卻欠佳。
2024 年 10 月,英特爾公司就曾坦承旗下 Gaudi 系列 AI 加速器無法達成之前設定的 2024 年 5 億美元營收目標。今年 1 月,英特爾新一代 AI 數據中心產品「Falcon Shores」被傳難產,將轉而研發另一款 AI 數據中心解決方案「Jaguar Shores」。
無法達成預期營收的 Gaudi
Gaudi 系列 AI 加速器是英特爾推出的用于人工智能計算的產品。2024 年 4 月,英特爾宣布將推出 Gaudi 3 AI 加速器,其在芯片架構和性能提升方面的表現受到外界關注。
相較于上一個版本 Gaudi 2,Gaudi 3 制造工藝從臺積電 7nm 升級到臺積電 5nm,MME(矩陣乘法引擎) 從 2 個增加到 8 個,雖然每個 MME 內部的 TPC(張量處理核心) 從 12 個減少到 8 個,但是總數從 24 個大幅增加到了 64 個,媒體解碼器差從 8 個增至 14 個,內置 SRAM 緩存容量翻番至 96MB,帶寬翻倍至 12.8TB/s。
核心性能方面,MME BF16/FP8 都是 1835 TFlops,矢量 BF16 則是 28.8 TFlops,分別提升了 3.2 倍、1.1 倍、1.6 倍。HBM2E 高帶寬內存容量從 96GB 增加到 128GB(八顆),帶寬也順應增加來到驚人的 3.7TB/s。24 個 200Gb RDMA 網絡接口,雙向網絡互連帶寬 1.2TB/s,主機接口峰值雙向帶寬 128GB/s,系統總線升級為 PCIe 5.0 x16。
按照官方說法,Gaudi 3 對比 NVIDIA H100,LLM 大模型推理性能領先 50%、訓練時間快 40%,性價比則是對手的 2 倍。在產品推出的同時,英特爾就宣布 Supermicro 和 Dell 等主流服務器供應商已經開始支持 Gaudi 3 系統,并且與 IBM 展開全球合作,IBM 的 watsonx AI 和數據平臺中將率先支持 Gaudi 3。
英特爾對 Gaudi 3 未來發展充滿信心。同月,英特爾發布財報預計 Gaudi AI 芯片產品線將帶來 5 億美元銷售收入。但可惜結果并不樂觀,稍后在 2024 年第三季度財報電話會議上,英特爾首席執行官帕特?蓋辛格表示,盡管 Gaudi 3 加速器已于本季度推出,但因產品從 Gaudi 2 向 Gaudi 3 的過渡以及軟件易用性問題影響了采用率,整體市場接受度低于預期,無法實現 2024 年 Gaudi 收入達到 5 億美元的目標。
永遠停留在實驗室階段的 Falcon Shores
Falcon Shores 是英特爾下一代 GPU,并將整合英特爾 Gaudi 的技術。但 Falcon Shores 從設計到量產,一路都很坎坷,最后甚至被取消。
起初,Falcon Shores 設計規劃是 XPU,集成 x86 架構 CPU 與 GPU,但是這一設計面臨致命缺陷,CPU 模塊性能不足且功耗過高,無法與 AMD Instinct MI300A 等競品競爭。2023 年,英特爾被迫放棄 XPU 方案,轉向純 GPU 架構,導致開發周期延長。
Falcon Shores 與臺積電合作,運用 3nm 和 5nm 工藝生產,并結合 CoWoS 先進封裝技術,這既提升了芯片性能與集成度,又提高了生產效率與產品質量。該 GPU 預計集成 288GB 的 HBM3 內存,運行速度可達 9.8TB/s 吞吐量,還支持 FP8 和 FP16 浮點精度,能滿足 AI 及其他工作負載的不同精度計算需求。
Falcon Shores 原本計劃于 2024 年推出,但后來推遲到 2025 年。2025 年 2 月,在財報電話會議上,英特爾臨時聯合 CEO Michelle Johnston Holthaus 透露,原計劃于今年推出、旨在結合 Intel Xe 圖形能力和 Gaudi AI 性能優勢的 Falcon Shores 項目將永遠停留在實驗室階段。「我們計劃僅將 Falcon Shores 用作內部測試芯片,不會推向市場。」
全力押注機架級解決方案 Jaguar Shores
在經歷一系列挫折之后,英特爾重新評估了其戰略,認為與其推出單一芯片,不如整合 Gaudi 加速器、Xeon CPU 和網絡技術,打造 Jaguar Shores 機架級解決方案。
Jaguar Shores 由 Habana Labs 主導開發,采用 Intel 18A 工藝與背面供電技術,強調機架級優化。其放棄了 Falcon Shores 的純 GPU 路線,轉向混合架構,可能集成 Gaudi ASIC 與 Xe-HPC GPU 技術,兼顧通用性與 AI 加速。其中,Falcon Shores 部分技術(如液冷設計、CoWoS 封裝)將被移植到 Jaguar Shores。
根據規劃,英特爾將在 2025 年推出 Jaguar Shores 樣品,2026 年量產,未來 Jaguar Shores 會替代 Gaudi 3 成為英特爾 AI 數據中心主力產品,與英偉達 GB200 NVL72 展開競爭。








評論