Nvidia 正在組裝其下一個推理平臺的零件嗎?

不,我們沒有錯過英偉達在平安夜對AI加速器和系統啟動公司以及競爭對手Groq進行了“收購”這一事實。但因為我們家圣誕節當天出差,而The Next Platform在度假,我們知道必須回去弄清楚英偉達花了200億美元買到什么。
我們——尷尬地說——完全忽略了英偉達在2025年9月中旬以9億美元收購網絡融合初創公司Enfabrica的關鍵人員和關鍵知識產權授權,規模小得多。
這兩點都指向了這款GPU加速器和互聯制造商的AI推理方式——以至于幾代后英偉達最終制造的設備根本稱不上GPU。
目前英偉達推出的數據中心級GPU加速器幾乎可以這樣說,它們看起來越來越不像圖形處理單元,更像是向量和張量引擎、緩存以及織物互連的復雜聚合,用于完成生成式人工智能和其他類型機器學習,有時還包括高性能計算(HPC)中相對低精度的數學。
這筆與格羅克的交易在多個方面都很特殊。第一個原因是為什么Groq的投資者最初會賣出。正如我們在分析AI模型制造商OpenAI與AI硬件新興公司Cerebras Systems之間價值100億美元的交易時指出的(Cerebras Systems成立于2015年,正值AI機器學習真正開始獲得關注時),令人好奇的是,為什么Groq會在低延遲的同時出售, 高通量AI推斷絕對必要,Groq是少數能與Nvidia抗衡的供應商之一。Cerebras擁有CS-2晶圓級計算引擎,谷歌擁有TPU,亞馬遜網絡服務擁有Trainium(現在沒人再談論Inferentia,因為Trainium既能做AI訓練又能做推理,是唯一真正獲得關注的AI虛擬處理器,而Nvidia的GPU主導了訓練和推理,AMD則在數據中心GPU中占據了份額)。
從Groq的角度來看,現在是銷售Nvidia GPU替代品的最佳時機,盡管Nvidia GPU雖然多功能,但價格昂貴。收購協議使英偉達獲得了公司學習處理單元技術的許可,并以200億美元聘請了Groq的大部分關鍵工程人員,包括聯合創始人喬納森·羅斯和首席運營官桑尼·馬德拉。對于一家擁有五輪融資總額17.5億美元、估值69億美元的E輪融資到賬的公司來說,這是一筆巨款。羅斯曾從沙特阿拉伯那里獲得15億美元的承諾,打算在達曼建設一個龐大的GroqCloud數據中心,但據我們所知,這尚未實現。這將是剩余的Groq會追求的業務,因為它基本上是GroqCloud的服務,一堆知識產權,據我們所知,并不是未來LPU或GroqWare產品線的計劃。
收購通常既有防御也有進攻,而羅斯主導的全計劃編譯器——這讓LPU與他在谷歌創建的最初TPU截然不同——是英偉達絕不希望落入敵人手中的關鍵資產。英特爾需要購買一個基于推斷的人工智能未來,如果傳聞中它在嗅探SambaNova,那么它也在嗅探Groq和Cerebras。但英特爾沒有資金,而美國政府——現在的投資者——也在背后監視。AMD也是Groq的潛在買家,如果Groq的軟件棧確實不同,理論上AMD仍有權授權它及其認為有用的硬件。
是的,我們知道。這真是太好笑了。
沙特阿拉伯為沙漠中的GroqCloud前哨站承諾15億美元,這與實際合同,或者更好的是支票或電匯,是兩碼事。此外,15億美元的AI投入如今并不算驚天動地,因為OpenAI已承諾為AI硬件提供約30吉瓦的容量。每個吉瓦的費用,取決于你問誰和具體情況,在每吉瓦350億美元到500億美元之間。可以稱山姆·奧特曼的容量規劃為夢想,30吉瓦耗資1.5萬億美元。Groq 與 Kingdom 的承諾比 Cerebras 剛與 OpenAI 簽訂的協議小 6.7 倍,也比 OpenAI 想建的項目小了三個數量級左右。
所以,當Ross和Huang開始討論時,考慮到所有超大規模企業和云構建者都在開發自己的AI XPU,同時使用Nvidia和有時AMD的GPU,模型構建商如Anthropic也承諾使用Google TPU和AWS Tranium,2.9倍估值似乎是一個不錯的退出價。如果看到Groq低級單位進入中國,而另一項行動將是個問題,而歐洲尚未完全找到以獨特且本土化方式更全面參與基因人工智能熱潮的方法。
即使沒有英偉達可能想要剔除Groq的所有防御性理由,你也能理解為什么Ross和Groq的投資者對這筆交易持冷淡態度。因此,Groq的兩位聯合創始人之一Jonathan Ross現任英偉達首席軟件架構師,Sunny Madra則是英偉達硬件副總裁。事情就是這樣。
收購結構很簡單:在看到全球反壟斷監管機構對69億美元收購Mellanox Technologies拖延不決,并粉碎了黃氏400億美元收購Arm的夢想后,英偉達選擇留下一個外殼,以免看起來像是買下了整個Groq。美國政府肯定會做出規則變更,但我們也假設黃也得到了特朗普總統的批準。
從我們的角度看,如果Groq團隊被抽離,且剩余的Groq不會有未來LPU開發,那么英偉達就可能面臨反壟斷違規的風險,正如世界各國政府所解讀的,這些政府無論喜不愿意,都對這類并購有發言權。如果英偉達不想觸發監管機構,他們會做出一筆低于Groq當前估值的交易——遠低于此價——然后Groq的創始人和投資者會在關門并打電話給AMD時笑得前仰后合。這里有很多“膽小鬼游戲”的感覺。
還有一點:沒有規定英偉達必須使用其授權的技術。公司被收購后因要打破現狀而被擱置的情況經常發生。我們最喜歡的例子是Transitive,其QuickTransit模擬器幾乎能在Unix上運行大型機應用,或在Linux上運行Unix應用,幾乎沒有修改。QuickTransit被用于蘋果創建的“Rosetta”仿真環境,該環境用于從PowerPC遷移到X86處理器,效果奇跡般出色。IBM被QuickTransit嚴重打擊,于是在2008年底收購了Transitive。在關于在Power Systems機器上模擬其他系統的模糊說法后,Big Blue在2011年徹底關閉了它,不再談論此事。
Enfabrica acquihire 與 Groq acquihire 類似,可能預示著建筑風格的變化......或者不。這可能只是偽裝成英偉達路線圖上技術的進攻混合的防御性作。(英偉達以前沒這么做過,但今天的英偉達已經不是我們五、十年前所熟知的那個了。)
Enfabrica早在2021年6月就退出了隱秘模式,我們當時并不清楚公司計劃做什么。到2023年3月,我們可以看到它正在發展,Enfabrica的“Millenium”ACF-S硅片將擴展內存和主機I/O融合到一塊芯片,消除了網絡接口卡、PCI-Express交換機、CXL交換機以及機架式或葉式交換機。
第一個將ACF-S應用于應用的產品稱為SuperNIC,它被用來基于CXL構建擴展內存服務器,極大提升了AI推理工作負載核心KV緩存的規模和性能。這款名為Emfasys的內存神盒于2025年7月發布,重要的是,公司創始人當時告訴我們,在四個GB200 NVL72機架級服務器上增加一排Emfasys內存擴展器,可以將每枚令牌成本減半(這意味著通過這種擴展內存,GPU的吞吐量翻倍)。
我們認為英偉達有可能打造一臺更優秀的推理機,而不僅僅是基于現有GPU架構,而Groq和Enfabrica的技術將在此過程中發揮作用。但同樣有可能,這兩筆收購交易實際上是為了確保沒有其他人這樣做。而且很可能兩者同時存在。
“為什么不做這些?”正如我大兩個雙語孩子在他們半輩子前教我說的那樣。



評論