久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

博客專欄

EEPW首頁 > 博客 > 攻堅(jiān)AI推理賽道 高通挑戰(zhàn)英偉達(dá)

攻堅(jiān)AI推理賽道 高通挑戰(zhàn)英偉達(dá)

發(fā)布人:ht1973 時(shí)間:2025-10-30 來源:工程師 發(fā)布文章

高通在今年7月的第三季度財(cái)報(bào)業(yè)績會(huì)上釋放出進(jìn)軍數(shù)據(jù)中心市場的明確信號(hào),如今這一規(guī)劃已迅速變?yōu)楝F(xiàn)實(shí)。

當(dāng)?shù)貢r(shí)間10月27日,高通宣布推出面向數(shù)據(jù)中心的下一代AI推理優(yōu)化解決方案:基于Qualcomm AI200和AI250芯片的加速卡及機(jī)架級(jí)解決方案。

根據(jù)規(guī)劃,AI200和AI250預(yù)計(jì)將分別于2026年和2027年實(shí)現(xiàn)商用。高通計(jì)劃制定一個(gè)數(shù)據(jù)中心路線圖,每年更新一次,專注提升AI推理方面的性能、能效和總擁有成本(TCO)。

受此消息影響,當(dāng)日高通公司股價(jià)一直猛拉到20%漲幅,最終以11.09%漲幅收盤。

這其實(shí)不是高通第一次嘗試挖掘數(shù)據(jù)中心市場機(jī)會(huì),在2017年,其曾嘗試推出基于Arm架構(gòu)的數(shù)據(jù)中心CPU產(chǎn)品,但遭遇折戟。

如今看來,相比于上一次,高通通過收并購、合作等方式持續(xù)強(qiáng)化軟硬件方面的能力,已經(jīng)在數(shù)據(jù)中心領(lǐng)域有不同于前一次的能力儲(chǔ)備。

當(dāng)然目前在數(shù)據(jù)中心市場,新進(jìn)入者面臨的核心挑戰(zhàn)之一是應(yīng)用生態(tài),高通同步公布了這批產(chǎn)品的第一位客戶,為其對(duì)數(shù)據(jù)中心市場的再度進(jìn)攻迎來良好開局。至于其未來能否取得進(jìn)一步突破,則有賴于從持續(xù)完善其軟硬件能力、首批落地方案的落地驗(yàn)證等方面共同推進(jìn)。

再?zèng)_刺

根據(jù)介紹,此次推出的Qualcomm AI200是一款專用機(jī)架級(jí)AI推理解決方案,旨在為大語言模型(LLM)和多模態(tài)模型(LMM)推理及其他AI工作負(fù)載提供低總擁有成本(TCO)和優(yōu)化的性能。每張加速卡支持768 GB LPDDR內(nèi)存。

Qualcomm AI250解決方案將首發(fā)基于近存計(jì)算(Near-Memory Computing)的內(nèi)存架構(gòu),實(shí)現(xiàn)超過10倍的有效內(nèi)存帶寬和更低功耗,讓AI推理工作負(fù)載效率和性能更好提升。這不僅支持解耦式AI推理,還能高效利用硬件資源,同時(shí)滿足客戶對(duì)性能和成本的要求。

據(jù)悉,兩種機(jī)架解決方案均采用直接液冷散熱以提高散熱效率,支持PCIe進(jìn)行縱向擴(kuò)展、以太網(wǎng)進(jìn)行橫向擴(kuò)展,并具備機(jī)密計(jì)算,以確保AI工作負(fù)載的安全性,整機(jī)架級(jí)功耗為160千瓦。

需要指出的是,不同于目前主流AI加速芯片多采用HBM(高帶寬內(nèi)存)的內(nèi)存配置方案,高通推出的方案采用LPDDR內(nèi)存,相比之下成本更低,這也與高通強(qiáng)調(diào)的更低TCO邏輯一致。

其實(shí)在今年7月舉行的第三季度財(cái)報(bào)業(yè)績會(huì)上,高通公司總裁兼首席執(zhí)行官Cristiano Amon已經(jīng)預(yù)告即將面向數(shù)據(jù)中心市場推出新產(chǎn)品。

彼時(shí)他指出,面向數(shù)據(jù)中心市場的擴(kuò)張,是高通新的增長機(jī)遇,基于其歷史上在CPU和NPU領(lǐng)域的沉淀,這是高通多元化戰(zhàn)略的合理延伸。

Amon分析,隨著AI推理規(guī)模的擴(kuò)大,云服務(wù)提供商正在構(gòu)建專用的推理集群,其同時(shí)注重性能和效率,特別是每美元的tokens數(shù)和每瓦特的tokens數(shù);再加上市場從商用CPU向定制的Arm兼容CPU轉(zhuǎn)變,以及云計(jì)算等需求,為高通創(chuàng)造了切入點(diǎn)。

“我們正在打造基于NPU芯片的AI推理加速卡,并利用我們的Oryon CPU、適用于通用和AI領(lǐng)先節(jié)點(diǎn)計(jì)算解決方案的定制SoC。”他指出,此外,高通正在推進(jìn)收購Alphawave IP Group plc公司一事,后者在數(shù)據(jù)中心、AI等高速有線連接方面具備優(yōu)勢(shì)。

根據(jù)7月份透露,高通處在數(shù)據(jù)中心市場開拓的早期階段,正與多位潛在客戶接觸,與一家領(lǐng)先的超大規(guī)模企業(yè)進(jìn)行深入洽談。如果洽談成功,預(yù)計(jì)將在2028財(cái)年開始產(chǎn)生收入。

在本次發(fā)布兩款A(yù)I芯片和相關(guān)解決方案時(shí),高通同時(shí)官宣,與HUMAIN(沙特阿拉伯一家國家級(jí)AI公司)開展合作,在沙特阿拉伯部署先進(jìn)的人工智能基礎(chǔ)設(shè)施。該計(jì)劃旨在為全球提供AI推理服務(wù),并打造全球首個(gè)全面優(yōu)化的邊緣到云端混合人工智能。

這也是兩家公司在5月簽署合作備忘錄后的正式官宣。根據(jù)計(jì)劃,HUMAIN計(jì)劃自2026年起,部署200兆瓦的Qualcomm AI200和AI250機(jī)架式解決方案。

目前,在高通公司官網(wǎng)的“數(shù)據(jù)中心產(chǎn)品/服務(wù)”欄目中,已經(jīng)有包括Qualcomm Cloud AI 100 Ultra、Qualcomm AI 200、Qualcomm AI 250和高通人工智能推理套件、服務(wù)器CPU五大產(chǎn)品矩陣。

這不是高通首次進(jìn)軍數(shù)據(jù)中心市場,此前高通一度有過試水,但并未取得顯著成效。截至目前,數(shù)據(jù)中心業(yè)務(wù)對(duì)于高通公司來說還未在財(cái)報(bào)層面體現(xiàn)出明顯增量。

第三季度財(cái)報(bào)顯示,高通的QCT(芯片業(yè)務(wù))部門中,手機(jī)為主的硬件(Handsets)業(yè)務(wù)(63.28億美元)占其總收入比重的70.37%,此外貢獻(xiàn)收入的業(yè)務(wù)包括IoT和汽車。但是從增速看,考慮到手機(jī)業(yè)務(wù)體量較大,其收入同比增速為7%,低于QCT板塊整體11%的同比增速值;更是遠(yuǎn)低于IoT實(shí)現(xiàn)同比24%增長、汽車業(yè)務(wù)同比21%的增速表現(xiàn)。

在全球手機(jī)大盤沒有顯著增量的條件下,尋找并發(fā)力更可觀的新市場就成為一個(gè)必答題。

逐漸加碼

2017年8月,高通曾推出Centriq 2400,采用10nm FinFET工藝打造,是面向數(shù)據(jù)中心市場、基于Arm架構(gòu)的服務(wù)器處理器。彼時(shí)高通方面稱,Centriq 2400在能效和成本上比英特爾的至強(qiáng)Platinum 8180更優(yōu)越。但很快就有市場消息顯示,高通的這款產(chǎn)品并沒有得到買賬。

DIGITIMES分析師陳辰妃向21世紀(jì)經(jīng)濟(jì)報(bào)道記者指出,高通曾短暫挑戰(zhàn)服務(wù)器領(lǐng)域,推出Centriq 2400處理器,但當(dāng)時(shí)服務(wù)器市場仍以英特爾(Intel) x86處理器為主,加上Arm架構(gòu)在服務(wù)器市場生態(tài)尚未成熟,高通最終選擇解散Falkor開發(fā)團(tuán)隊(duì)。

再看這一次,高通在正式進(jìn)軍數(shù)據(jù)中心市場之前,已經(jīng)有多番布局。

2021年3月,高通宣布以14億美元完成對(duì)Nuvia公司的收購,后者就是專注于數(shù)據(jù)中心CPU的公司。

此外,如前所述,高通還在推進(jìn)對(duì)Alphawave公司的收購。在業(yè)績會(huì)上,Amon也提到,Alphawave的高速有線連接和計(jì)算技術(shù),對(duì)下一代定制的高通Oryon CPU以及高通Hexagon NPU處理器形成了補(bǔ)充。“人工智能推理的增長推動(dòng)了對(duì)高通高性能、節(jié)能計(jì)算解決方案的需求,此次收購為我們拓展數(shù)據(jù)中心業(yè)務(wù)提供了關(guān)鍵資產(chǎn)。”

IPnest CEO Eric Esteve則告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,Alphawave公司在高端接口IP領(lǐng)域處于領(lǐng)先地位,由于SerDes(串行器/解串器)對(duì)于構(gòu)建基于以太網(wǎng)、PCIe、CXL或UCIe等協(xié)議構(gòu)建頂級(jí)的互連能力至關(guān)重要,其可以滿足構(gòu)建高性能計(jì)算應(yīng)用(如AI系統(tǒng))的需求。

綜合來看,相比幾年前,高通此次再度進(jìn)攻數(shù)據(jù)中心市場,在內(nèi)生的數(shù)據(jù)中心所需能力方面進(jìn)行了明顯補(bǔ)全,且其采取了與市面上差異化(采用不同的內(nèi)存規(guī)格選擇)的發(fā)展路線。

而外部市場來看,目前業(yè)界公認(rèn),AI推理市場空間將高于AI訓(xùn)練市場,且在AI推理市場,已經(jīng)有眾多AI芯片玩家參與,包括云服務(wù)廠商自研ASIC定制芯片、新興AI芯片公司等,都試圖以不同于英偉達(dá)GPU芯片的差異化打法,挖掘增量空間。

當(dāng)然,高通依然與英偉達(dá)存在密切合作。今年5月,英偉達(dá)面向定制化AI芯片市場發(fā)布NVIDIA NVLink Fusion,合作伙伴名單中,高通赫然在列。

可見,雖然此番推出AI推理芯片和解決方案,透露出高通在AI推理方面試圖與英偉達(dá)競爭的野心,但其也在通過多條腿走路的方式,持續(xù)擴(kuò)展生態(tài)能力。

這也是當(dāng)前業(yè)界最為關(guān)注的地方,即AI芯片的落地,關(guān)鍵要素之一就是軟件和生態(tài)能力,英偉達(dá)之所以傲視群雄,就是因?yàn)槠湟呀?jīng)花費(fèi)接近20年時(shí)間搭建CUDA工具鏈,這是AI芯片后來者難以企及的積累。

不過好在,AI推理市場可以接納定制化的細(xì)分需求,這也是后來者仍有發(fā)展空間的原因所在。

而高通還要面臨的考驗(yàn)在于,其基于NPU架構(gòu)打造的AI芯片和方案,落地到數(shù)據(jù)中心場景中的性能表現(xiàn)到底如何。因此其與HUMAIN公司打造的樣板就至關(guān)重要。

Amon也在業(yè)績會(huì)上提到,希望能借力與重要客戶的合作,產(chǎn)生光環(huán)效應(yīng),驗(yàn)證產(chǎn)品和平臺(tái),并為未來帶來新機(jī)遇。

隨著高通在未來兩年推進(jìn)這兩款數(shù)據(jù)中心產(chǎn)品落地,顯然將為AI芯片市場帶來新的火花,其在實(shí)現(xiàn)能力加持后能走多遠(yuǎn),仍有待市場的持續(xù)檢驗(yàn)。


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。


關(guān)鍵詞: 半導(dǎo)體

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉