聯(lián)發(fā)科基于谷歌TPU v7的工作,旨在提升天璣9600的效率
谷歌即將發(fā)布的Ironwood TPU v7現(xiàn)在已經(jīng)成為首個(gè)可行的專用集成電路(ASIC),能夠挑戰(zhàn)英偉達(dá)的Blackwell GPU處理器.這一重大事件,理所當(dāng)然地引起了對谷歌TPU設(shè)計(jì)流程及其合作伙伴的廣泛關(guān)注,其中就包括中國臺灣的聯(lián)發(fā)科,后者將其經(jīng)驗(yàn)轉(zhuǎn)化為定制芯片的實(shí)際效率提升,這將惠及即將推出的天璣9600 SoC。

谷歌的Ironwood TPU v7及聯(lián)發(fā)科在其中的角色
在談到聯(lián)發(fā)科的天璣9600之前,先來談?wù)剣@谷歌Ironwood TPU v7的各種爭議到底是怎么回事。這里是迄今為止我們對新TPU架構(gòu)的了解:
雙芯片組設(shè)計(jì),每個(gè)芯片組包含:
向量處理單元(VPU)處理通用的元素級作,這些作對AI模型至關(guān)重要,如激活函數(shù)(如ReLU)和歸一化。
矩陣乘法單元(MXU)處理矩陣乘法運(yùn)算。
1次張量核采用收縮陣列架構(gòu),實(shí)現(xiàn)高效的矩陣乘法運(yùn)算——這些運(yùn)算構(gòu)成了人工智能工作負(fù)載的骨干,包括神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推斷——通過大幅減少HBM所需的內(nèi)存讀寫次數(shù)。
2次稀疏核,這些工具能夠高效處理需要不規(guī)則、依賴數(shù)據(jù)的內(nèi)存訪問的用例,包括處理稱為嵌入的超大型數(shù)學(xué)結(jié)構(gòu)時(shí)——這些結(jié)構(gòu)用于將大型類別特征值(如基于單詞的詞匯表)轉(zhuǎn)換為更小、更密集的向量表示,是許多人工智能作中的關(guān)鍵步驟。
96 GB 高帶寬內(nèi)存(HBM)。
這兩個(gè)芯片組通過芯片對芯片(D2D)互連連接,其速度是1D芯片間互連(ICI)鏈路的6倍。
單個(gè)TPU機(jī)架包含64顆芯片通過ICI連接,每顆芯片提供1.2 TB/s的雙向ICI帶寬。這種基本的64芯片配置稱為立方體(Cube).
多個(gè)立方體通過光電路交換機(jī)(OCS)網(wǎng)絡(luò)連接,形成Superpod,由9,216個(gè)芯片和144個(gè)立方體組成.

至于谷歌新TPU的性能表現(xiàn),只需查看上述性能數(shù)據(jù)即可。正如我們最近在一篇專門的文章中提到的,TPU v7 Ironwood 在推理任務(wù)中與 NVIDIA GPU 競爭激烈,隨著行業(yè)逐漸遠(yuǎn)離大型基礎(chǔ)AI模型,新的推理模型正逐漸受到重視。事實(shí)上,即將推出的TPU已經(jīng)在性能接近同等水平的同時(shí),總擁有成本(TCO)更低搭載了NVIDIA最新的顯卡。
聯(lián)發(fā)科在谷歌TPU v7 Ironwood中的角色
聯(lián)發(fā)科在設(shè)計(jì)谷歌TPU v7 Ironwood中發(fā)揮了重要作用,現(xiàn)在也有望將這些經(jīng)驗(yàn)提煉出來,使其即將推出的天璣9600芯片更加高效。根據(jù)2025年3月陸續(xù)發(fā)布的報(bào)道,谷歌委托聯(lián)發(fā)科設(shè)計(jì)Ironwood的輸入/輸出(I/O)模塊,以促進(jìn)處理器與外設(shè)之間的通信.這與谷歌近年來與博通密切合作設(shè)計(jì)整個(gè)下一代TPU的戰(zhàn)略有所不同。根據(jù)瑞銀最近的估計(jì),聯(lián)發(fā)科有望通過與谷歌合作開發(fā)下一代TPU獲得40億美元收益.
聯(lián)發(fā)科在谷歌TPU v7 Ironwood上的工作如何提升了更高效天璣9600芯片的前景
請注意,ASIC和基于移動(dòng)的應(yīng)用處理器(AP),如天璣9600,本質(zhì)上是不同的。這意味著聯(lián)發(fā)科無法將其所有經(jīng)驗(yàn)轉(zhuǎn)化為天璣9600的可用格式。盡管如此,公司仍可以通過以下方式進(jìn)行多項(xiàng)迭代改進(jìn):
為天璣9600芯片設(shè)計(jì)更高效的功率門控策略,使AP在未使用時(shí)更積極地關(guān)閉特定的I/O模塊。
提升了天璣9600的電壓調(diào)節(jié),使AP能夠最大限度地消耗量子電壓,從而提升芯片的功耗指標(biāo)。
調(diào)整現(xiàn)有的時(shí)鐘門控策略,以提升下一代芯片的電池續(xù)航,爭取更激進(jìn)的功耗預(yù)算。
當(dāng)然,據(jù)報(bào)道,聯(lián)發(fā)科也在研發(fā)自家的人工智能芯片,其TPU經(jīng)驗(yàn)在這方面將更具參考價(jià)值。盡管如此,其移動(dòng)接入點(diǎn)也可以通過實(shí)施上述調(diào)整受益。這當(dāng)然非常重要,因?yàn)槁?lián)發(fā)科已經(jīng)在其移動(dòng)接入點(diǎn)架構(gòu)中取消了效率核心.




評論