久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 編輯觀點 > 英偉達斥資200億美元“收編”谷歌TPU創始團隊

英偉達斥資200億美元“收編”谷歌TPU創始團隊

作者:陳玲麗 時間:2025-12-26 來源:電子產品世界 收藏

有關即將收購的傳聞一度引發市場震動。媒體援引消息,今年9月領投融資的投資機構Disruptive CEO Alex Davis透露,同意以200億美元現金收購AI芯片初創公司,且交易進展迅速,包括Groq除云業務外的所有資產。然而,實際上這并非是一場「收購」。與Groq均明確表示,雙方達成的是技術許可協議而非整體收購 —— 官方聲明中使用了“非排他性技術許可協議(non-exclusive licensing)”這一表述。

640.png

此次交易背后是英偉達日益增加的現金資產,截至2025年10月底,英偉達持有的現金及短期投資高達606億美元,較2023年初的133億美元翻了近5倍。值得注意的是,截至目前,這筆交易未披露具體細節,Groq投資方曝出的“200億美元”這一交易數據并未得到交易任何一方的確認。

但若200億美元的收購金額傳聞屬實的話,將超越英偉達2019年斥資近70億美元收購以色列芯片商Mellanox的交易金額,成為英偉達史上規模最大的收購案,展現出英偉達持續鞏固自身在AI芯片領域的領導地位的野心。

非典型收購

把創始人和部分員工收入麾下,這操作是不是看起來有點眼熟?據外媒此前報道,英偉達在9月份促成了一筆類似但規模較小的交易,花費超過9億美元吸收了AI硬件初創公司Enfabrica的CEO Rochan Sankar及其他員工,并獲得了該公司的技術許可。

過去兩年,亞馬遜、Meta、、微軟等科技巨頭也曾通過各種類型的許可協議,聘請頂尖人才。在硅谷,這種通過技術授權協議來吸納頂尖人才的“收購式招聘(Acqui-hire)”模式,已經成為科技巨頭挖人才和拿技術授權的重要手段,同時還能避免觸發反壟斷審查。

2024年,亞馬遜曾以4億美元挖走AI初創公司Adept核心團隊并獲得技術授權;為AI代碼生成初創公司Windsurf的非獨家許可支付24億美元,挖走CEO Varun Mohan、聯合創始人Douglas Chen以及部分研發成員,隨后又以27億美元吸納Character.AI團隊;Meta斥資近150億美元收購AI數據標注初創公司Scale AI 49%股權,Scale AI聯合創始人兼CEO Alexandr Wang加入Meta,Scale AI仍保持獨立運營。

本次交易后Groq創始人兼CEO Jonathan Ross、總裁Sunny Madra等核心團隊將加入英偉達,以幫助推進和擴大授權技術的規模;Groq強調公司仍將作為實體獨立運營,原首席財務官Simon Edwards將接任CEO,旗下云業務GroqCloud也將繼續獨立為軟件開發者提供服務。

為何選擇Groq?

Groq成立于2016年,是一家總部位于美國加利福尼亞州山景城的AI芯片生產商,由前張量處理器()首席設計師Jonathan Ross等人創立 —— 是谷歌用以部分替代英偉達GPU的專用AI芯片,也使Groq自誕生起就具備與英偉達競爭的技術基因。

成立伊始,Groq就專注于AI推理階段,致力于打造高速、低延遲、低成本的AI芯片。2024年2月,Groq推出了全球首個基于LPU(Language Processing Unit,語言處理單元)方案的大模型推理芯片,LPU專為「推理」過程,即AI模型根據新數據生成答案或預測的過程,進行了優化。Jonathan Ross曾表示,得益于嵌入式內存設計,Groq的芯片在生成速度、部署效率及能耗控制上均優于GPU。

640.jpeg

Groq表示,相對于其他云平臺廠商的大模型推理性能,基于其LPU芯片的云服務器的大模型推理性能最終實現了比其他云平臺廠商快18倍;在能耗方面,英偉達GPU需要大約10-30J才能生成響應中的tokens,而Groq LPU芯片僅需1-3J,在推理速度大幅提升10倍的同時,其能耗成本僅有英偉達GPU的十分之一,這等于是性價比提高了100倍。

而LPU之所以能夠以驚人速度做出響應,其工作原理與GPU截然不同。在團隊公開的論文中介紹,LPU采用了時序指令集計算機(Temporal Instruction Set Computer)架構,意味著它無需像使用高帶寬存儲器(HBM)的GPU那樣頻繁地從內存中加載數據,這不僅有助于避免HBM短缺的問題,還能有效降低成本。

Groq當前的芯片組采用格芯14nm工藝制造,作為一款基于全新的TSA架構的Tensor Streaming Processor (TSP) 芯片,創新芯片設計可以實現多個TSP的無縫鏈接,避免了GPU集群中常見的瓶頸問題,極大地提高了可擴展性。隨著更多LPU的加入,性能可以實現線性擴展,簡化了大規模AI模型的硬件需求,使開發者能夠更容易地擴展應用,而無需重構系統。

HBM需要臺積電的CoWoS封裝,這是一個很大的瓶頸,而且成本極其昂貴。如果能夠繞過對HBM和CoWoS的需求,芯片印制速度就會更快。如果板載集成NVLink C2C,LPU的擴展能力將遠超Groq現在能做到的。英偉達看中的,不止是Groq的芯片,而是其背后的前沿技術理念和資產 —— LPU有四大核心設計原則:軟件優先、可編程流式架構、確定性計算和網絡、片上存儲器。

軟件優先:目標是簡化軟件開發人員最大化硬件利用率的工作,并將盡可能多的控制權交到開發人員手中。遵循這一理念,Groq在完成編譯器架構設計后,才開始做芯片設計。

可編程流式架構:支持芯片內部及芯片間的流水線式流程。擁有充足的芯片間帶寬,使數據傳送帶能夠在芯片間像在芯片內部一樣流暢高效地傳輸,無需等待計算或內存資源。

640.gif

▲基于LPU的系統

對比之下,GPU采用多核“中心輻射式”架構,其低效的數據分頁機制在芯片內和芯片間的計算單元和內存單元之間來回傳輸數據,需要大量的開銷。此外,GPU還需要利用機架內部和機架之間的多層外部交換機和網絡芯片進行通信,這進一步加劇了軟件調度的復雜性。

確定性計算和網絡:LPU架構是確定性的,這意味著每個執行步驟都可以精確到最小執行周期(也稱為時鐘周期)。LPU數據傳送帶也在芯片間運行,因此連接芯片會形成更大的可編程流水線,數據流由軟件在編譯期間靜態調度,且每次程序運行時都以相同的方式執行。

片上存儲器:LPU將內存和計算功能集成在芯片上,大幅提升了數據存儲和檢索速度,同時消除了時序波動。其片上SRAM的內存帶寬高達80TB/s以上,而GPU片外HBM的帶寬約為8TB/s。僅此一項差異就使LPU的速度提升高達10倍,再加上LPU無需往返于單獨的內存芯片來檢索數據,這進一步提升了其性能。

此次交易的核心還有Groq背后的明星級團隊:Jonathan Ross是AI芯片領域的資深人物,曾師從AI先驅Yann LeCun。在谷歌期間,他曾發起了一個最初作為「20%項目」的內部創新計劃,這一項目之后演變成為廣為人知的,他親自設計并實現了第一代TPU芯片的核心架構與關鍵組件;隨后,他加入了Google X的Rapid Eval Team,為谷歌的母公司Alphabet構思、孵化并推進多個全新的Bets(即新業務方向和獨立項目)。

640-4.png

美國加利福尼亞州舊金山市2024年5月30日星期四舉行的GenAI峰會上,喬納森·羅斯(Jonathan Ross)作為Groq公司的首席執行官(CEO)出席

TPU目前是英偉達GPU的有力競爭方案,這筆交易看起來更像是英偉達對谷歌成功使用TPU進行AI訓推所做出的直接、迅速的回應。同時,Groq和其團隊的加入,除了強勢補齊推理領域的短板,英偉達還實質性地削弱了一個潛在的競爭對手。

對AI推理深度布局

目前,隨著AI應用從訓練階段邁向大規模部署,市場對推理芯片的需求正在急劇上升:據巴克萊研報,AI推理計算需求預計將占通用人工智能總計算需求的70%以上,推理計算的需求甚至可能達到訓練計算需求的4.5倍。在今年初,黃仁勛曾在一次采訪中表示“推理需求未來將增長高達十億倍”,AI市場正處于“訓練為主”向“推理為主”轉型的關鍵期,不難看出,英偉達想要Groq補強其在高能效推理領域的短板。

根據Groq此前披露的數據顯示,其已經為超過200萬開發人員和眾多全球領先的財富500強企業提供快速、經濟的計算能力,并正在擴大其全球影響力,在北美、歐洲和中東現有的數據中心的基礎上進行建設。

推理和訓練本質上,是兩種截然不同的計算負載,而GPU并不是最適合推理工作的解決方案。雖然在訓練領域,英偉達GPU幾乎壟斷,但在推理領域卻競爭激烈,亞馬遜、谷歌、正通過自研芯片尋求獨立的OpenAI和Meta Platforms以及Groq和Cerebras Systems等初創公司都在尋求突破機會。

黃仁勛在內部郵件中明確表示:“我們計劃將Groq的低延遲處理器整合到英偉達的AI工廠架構中,以服務更廣泛的AI推理和實時工作負載。”此次交易直接強化了英偉達在“推理”這一關鍵計算環節的布局,是英偉達鞏固AI算力霸權、應對產業變局的精準落子,進一步鞏固從訓練到推理的全棧優勢。當巨頭開始用資本手段吸收潛在的顛覆者,留給其他玩家的窗口期或許正在收窄。

與此同時,在AI芯片領域,初創公司的生存路徑正在改變:Cerebras Systems原計劃今年上市,但在9月宣布完成超過10億美元融資后,于10月撤回了IPO申請;英特爾已與SambaNova展開深入談判,計劃收購后者,而英特爾CEO陳立武曾是SambaNova的早期投資者。這似乎反映出在歐美市場,AI芯片作為獨立創業形態的階段性終結,初創公司被巨頭整合可能成為最優選擇。

英偉達自身也在通過投資拓寬AI生態邊界,試圖構建一個幾乎無法被挑戰的AI生態系統。今年以來,英偉達已向AI和能源基礎設施公司Crusoe、模型開發商Cohere注資,并增持了即將上市的AI云服務商CoreWeave的股份;另外,還擬向OpenAI投資高達1000億美元,并計劃向英特爾注資50億美元,英偉達的種種舉措彰顯了該公司的最新戰略,那就是通過資本擴張構建產業聯盟的深遠布局。

無論如何,這筆交易已成為2025年科技領域最具標志性的事件之一,它不僅改寫芯片收購史,更預示著AI硬件競爭已進入生態整合與戰略卡位的新周期。英偉達能否憑借此次布局繼續領跑,全球芯片產業格局又將如何演變,一切仍待時間揭曉。

估值火箭式躥升

作為AI硬件領域的明星初創企業,Groq在過去一年中經歷了估值的火箭式躥升。若媒體提到的交易規模屬實,英偉達收購就讓Groq的“身價”較三個月前完成融資后的估值增長了將近兩倍。2024年8月,以28億美元估值完成6.4億美元融資。

今年9月17日,Groq公布以約69億美元估值完成7.5億美元的最新一輪融資,據PitchBook估算,Groq累計融資已超30億美元。該輪融資由Disruptive領投,自2016年Groq成立以來投資總額超過5億美元,該投資公司過去十年曾投資Palantir、Airbnb、Spotify、Databricks、Stripe等多家成功企業。該輪融資的投資者還包括Blackroc、Neuberger Berman、德國電信資本合伙公司(Deutsche Telekom Capital Partners,DTCP)以及一家美國西海岸大型共同基金管理公司也參與了投資。此外,三星、思科、D1、Altimeter、Infinitum、美國總統特朗普之子小唐納德·特朗普任合伙人的風投1789 Capital等現有投資者也繼續跟投。

英偉達的芯片在性能上由于其專有的CUDA編程語言生態,使得客戶對其產生了極高的粘性,盡管獲得了數十億美元的風險投資,包括Groq在內的挑戰者們一直難以打破英偉達對高端AI芯片市場的嚴密控制。經過多年發展,當前被視作“顛覆者”的AI芯片創企們,紛紛迎來了如何長期生存的現實大考:上市、被收購,或者想辦法拿到能持續兌現增長的超級客戶訂單。Groq近期的經營狀況也反映了挑戰巨頭的難度:已大幅下調向投資者提供的業績預期,將其預計的2025年營收從20億美元大幅削減至5億美元,下調超過15億美元。

Groq聯合創始人Chamath Palihapitiya在社交平臺X上曬圖感慨,當年Jonathan Ross說服他挑戰巨頭,打造新型芯片。而他們當時沒有公司,只有一份投資意向書和三個人,只能盡可能多地從谷歌威斯康星分部招募TPU團隊的成員。

640-5.png

“今天,我們結束了這段近十年的篇章,Jonathan將與英偉達開啟新的篇章。”Palihapitiya寫道:“Jonathan不僅是谷歌時期TPU的締造者,更是一位技術天才,其成就堪稱史詩級。他還組建了一支強大的團隊,有Sunny Madra和Gavin Sherry這樣的人才為他提供支持。他們在英偉達也會創造輝煌。”

隨著科技大廠自主研發的底層硬件增多,整個行業都在競逐構建更強的計算基礎設施,AI推理將成為AI商用的主要算力消耗和利潤壓力來源。推理規模持續爆發式增長,幾乎所有大廠都必須關心“每token成本”。前瞻嗅覺敏銳的英偉達,長期在構建一個更完備的AI計算產品“軍火庫”,提前把可能有利于加速AI產業發展的各種技術方向納入自身的能力池。通過將新型LP


關鍵詞: 英偉達 谷歌 TPU Groq

評論


相關推薦

技術專區

關閉