大算力芯片成為自動駕駛玩家新戰線
最近這段時間,易中天的股價漲上了天。沒有坐上車的股友們開始吃不著葡萄便說葡萄酸,言之鑿鑿地表示,在不缺帕魯的帕魯大陸,沒有任何一個賽道的領頭羊能夠長期享受壟斷利潤,勤奮的中國玩家們會把這些有錢賺的賽道都卷翻天,最后落得個大家都沒有錢賺的局面。誠哉斯言,或許在未來的某一天,光模塊賽道也會像如今的光伏和新能源賽道那樣反內卷。落腳到今天的主題智能電動汽車上面,各路玩家在內卷上更是積累了豐富的經驗,在電動化的上半場打完低烈度的治安戰之后,在智能化的下半場又開啟了高強度的淘汰賽滅國戰。在智能化這條戰線中,自動駕駛始終吸引著最大的火力,消耗著最多的資源。沒有最卷,只有更卷,頭部玩家們24 年齊刷刷轉型端到端,在挖掘完傳統端到端方案的潛力之后,25 年又開辟出基于強化學習的端到端、視覺語言動作模型VLA、世界行為模型WA 三條端到端2.0 技術路線。除了在算法上精進探索,這幫硬漢還馬不停蹄地紛紛推出了自家的智能駕駛芯片。在英偉達雷神Thor、高通Ride、Mobileye EyeQ6、地平線征程6、華為晟騰之外,蔚來量產了神璣NX9031,小鵬量產了圖靈AI 芯片,理想的馬赫M100、Momenta 未知代號的芯片也相繼進入了裝車測試階段。在有那么多重磅玩家和超強實力選手的局面下,為什么蔚小理這些新勢力車企和Momenta 這類智駕方案供應商還敢于亮劍,做自己的智駕芯片呢?
1 軟硬協同是標準答案
天降猛男馬斯克說,答案就是你眼前所看到的一切,而關鍵是如何提出正確的問題。在自動駕駛領域,答案是特斯拉成為了全球的標桿,華為成為了本土的遙遙領先,正確的問題是,他們是如何實現的?這個問題的標準答案是軟硬協同。拿特斯拉來說,它已經量產了兩代用于FSD 的AI 推理芯片-AI 3 和AI 4,并完成了第三代芯片AI 5 的設計,此外,它還建立了全球(車圈)最大的數據中心,建立了深度的軟硬芯云一體能力。華為同樣不遑多讓,甚至做到了百尺竿頭、更進一步,它不僅有用于ADS 的晟騰AI 推理芯片,還有用于云端訓練的昇騰AI 訓練芯片,在硬件層面,依靠光學領域的多年深耕,華為還自研了激光雷達、毫米波雷達、激光視覺傳感器。

圖片來源:馬斯克訪談
就像蘋果在智能手機上示范的、華為和特斯拉在自動駕駛上示范的軟硬協同范式一樣,各路從事智駕算法全棧自研的玩家紛紛把大手伸向芯片領域,背后相似的邏輯在于,自動駕駛系統作為復雜度極高且軟硬一體的系統工程,軟件與硬件的深度結合對系統性能至關重要。只有軟硬件深度的協同,從算法中來,到算法中去,基于對算法趨勢與應用場景的前瞻判斷設計符合自家算法特點的芯片,針對自家特色的算法進行芯片的特定優化,提升性價比和算力的效率,才能實現極致的體驗、深度的優化與創新。

圖片來源:地平線
除了提升系統當下的體驗,站在更長遠的視角下,自動駕駛系統必將在未來幾年內不斷提升等級,從L2++ 走向L3、L4,算法玩家們進入芯片設計領域,可以以算法為矛、芯片為盾,構建起適應智駕技術快速迭代的動態體系,在這條長長的賽道上通過芯片架構的進化保障技術路線的主導權。如果將自家的算法綁定在英偉達等供應商的通用芯片的架構下,車企的算法突破就會受限于這類芯片的通用設計,選擇自研,車企就可以根據自家算法的特點進行硬件層面的深度定制,擺脫通用芯片的生態鎖定,將技術差異化的主動權牢牢地抓在自己的手里。

圖片來源:元戎啟行
2 應對AI芯片的成本壓力
除了基于芯片和算法的深度軟硬協同優化實現極致性能,自研智駕芯片的第二條理由在于控制成本。有些人企圖拿明朝的劍斬清朝的貪官,從目前大多數車企使用的英偉達Thor-U單片價格在1000 美金左右的事實出發,認為將來用于自動駕駛車輛車端推理的AI 芯片的成本最多也就是千把美金,咬咬牙還是可以承受的。這種看法真的有些刻舟求劍了。
伴隨著L2++ 級輔助駕駛向L3/L4 自動駕駛的進階,智能駕駛系統對芯片算力的需求水漲船高,以至于用于高等級自動駕駛系統的智駕芯片的成本壓力也越來越大了。還是拿事實說話吧,目前,在邁向端到端2.0 方案的過程中,有部分企業選擇了泛化性能極強、場景理解能力極好的VLA 技術路線,這種方案可以非常取巧地借用AI 巨頭訓練出來的多模態大語言模型,利用大語言模型的理解能力和推理能力應對復雜的駕駛場景,但是,欲戴皇冠,必承其重,選擇使用上知天文下知地理、能吟詩作賦的大語言模型,也勢必要承受其帶來的算力壓力和成本。

圖片來源:小米
根據公開消息,在國內探索VLA 路線的代表企業里,除了有自家圖靈AI 芯片的小鵬,理想、元戎啟行和小米均采用了英偉達的Thor-U,單顆價格高達1000美金。關鍵不在于這1000 美金,問題在于1000 美金只是下限。這顆芯片算力只有700TOPS,理想汽車用盡了手段,才不過將4B 參數的MindVLA 推理頻率做到了10 Hz,而4B 參數的VLA、10 Hz 的推理頻率顯然無法滿足L3 級自動駕駛的要求,更不用提L4 了。如果大家試用過DeepSeek R1 的7B、14B、32B、70B 模型和671B 滿血版模型,就會對參數規模和模型能力的關系有非常明顯的體感,7B 模型給人的感覺就是學前班幼兒園,到了32B 才能體會出其能力背后的思維鏈。
目前,MindVLA 的參數規模雖然相較于其之前的端到端方案有了大幅度的提升,但這種參數級別的VLA 依然不足以兌現足夠精確的駕駛環境理解能力。只有部署百億參數VLA,方能兌現高等級自動駕駛服務。而且,很多場景對實時性有著極高的要求,緊急場景甚至要求毫秒級反應,10 Hz 的頻率絕對達不到L3 的要求。也就是說,真能兌現高級自動駕駛服務的VLA 方案或許需要幾千TOPS 的算力,據有關媒體披露的數據,算力在2000TOPS 左右的英偉達AGX Thor 的價格高達3466美元!
等自動駕駛系統真的發展到了L3 和L4 階段,如果還依靠英偉達、高通這些外部供應商提供的芯片,名為甲方實則為乙方的車企們基本上不可能通過議價消化車端AI 芯片的成本壓力。自研芯片不僅可以“拿研發換毛利”,打掉英偉達、高通這些芯片巨頭動輒百分之八九十的超高毛利,還可以通過對特定算法和傳感器方案的深度定制,實現算法的極致高效,進一步降低芯片的成本。

圖片來源:理想汽車
3 寫在最后
芯片本身是一個資本密集型、技術密集型的高門檻行業,是一條需要堅持長期主義的賽道。沒有三代產品的摸索,基本上不可能將產品打磨得比較完善。所以,蔚小理在宣傳自己的第一代芯片時,動不動比肩英偉達,這樣的話聽聽就算了。不過,這些新勢力車企紛紛下場造芯片,一方面證實了他們在自動駕駛算法上的領先地位,另一方面也昭示著,一些逐漸“真正自研”出自家自動駕駛算法的傳統車企做智駕芯片的時間也不遠了。
(本文來源于《EEPW》202510)







評論