久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 手機(jī)與無線通信 > 業(yè)界動(dòng)態(tài) > 聯(lián)發(fā)科基于谷歌TPU v7的工作,旨在提升天璣9600的效率

聯(lián)發(fā)科基于谷歌TPU v7的工作,旨在提升天璣9600的效率

作者: 時(shí)間:2025-12-02 來源: 收藏

即將發(fā)布的Ironwood 現(xiàn)在已經(jīng)成為首個(gè)可行的專用集成電路(ASIC),能夠挑戰(zhàn)英偉達(dá)的Blackwell GPU處理器.這一重大事件,理所當(dāng)然地引起了對TPU設(shè)計(jì)流程及其合作伙伴的廣泛關(guān)注,其中就包括中國臺灣的,后者將其經(jīng)驗(yàn)轉(zhuǎn)化為定制芯片的實(shí)際效率提升,這將惠及即將推出的 SoC。

A computer chip featuring the 'GOOGLE TPU v7 IRONWOOD' alongside a 'MediaTek DIMENSITY 9600.'

的Ironwood 在其中的角色

在談到之前,先來談?wù)剣@谷歌Ironwood 的各種爭議到底是怎么回事。這里是迄今為止我們對新TPU架構(gòu)的了解:

  1. 雙芯片組設(shè)計(jì),每個(gè)芯片組包含:

    • 向量處理單元(VPU)處理通用的元素級作,這些作對AI模型至關(guān)重要,如激活函數(shù)(如ReLU)和歸一化。

    • 矩陣乘法單元(MXU)處理矩陣乘法運(yùn)算。

    • 1次張量核采用收縮陣列架構(gòu),實(shí)現(xiàn)高效的矩陣乘法運(yùn)算——這些運(yùn)算構(gòu)成了人工智能工作負(fù)載的骨干,包括神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推斷——通過大幅減少HBM所需的內(nèi)存讀寫次數(shù)。

    • 2次稀疏核,這些工具能夠高效處理需要不規(guī)則、依賴數(shù)據(jù)的內(nèi)存訪問的用例,包括處理稱為嵌入的超大型數(shù)學(xué)結(jié)構(gòu)時(shí)——這些結(jié)構(gòu)用于將大型類別特征值(如基于單詞的詞匯表)轉(zhuǎn)換為更小、更密集的向量表示,是許多人工智能作中的關(guān)鍵步驟。

    • 96 GB 高帶寬內(nèi)存(HBM)。

  2. 這兩個(gè)芯片組通過芯片對芯片(D2D)互連連接,其速度是1D芯片間互連(ICI)鏈路的6倍。

  3. 單個(gè)TPU機(jī)架包含64顆芯片通過ICI連接,每顆芯片提供1.2 TB/s的雙向ICI帶寬。這種基本的64芯片配置稱為立方體(Cube).

  4. 多個(gè)立方體通過光電路交換機(jī)(OCS)網(wǎng)絡(luò)連接,形成Superpod,由9,216個(gè)芯片和144個(gè)立方體組成.

A table displays specifications and values including 'Peak compute per chip' at ~4,614 TFLOPS, 'HBM capacity per chip' at 192 GB HBM3e, 'Memory bandwidth per chip' at ~7.2 TB/s, 'Maximum pod size' of 9,216 chips, and 'Performance Improvement' of

至于谷歌新TPU的性能表現(xiàn),只需查看上述性能數(shù)據(jù)即可。正如我們最近在一篇專門的文章中提到的,TPU v7 Ironwood 在推理任務(wù)中與 NVIDIA GPU 競爭激烈,隨著行業(yè)逐漸遠(yuǎn)離大型基礎(chǔ)AI模型,新的推理模型正逐漸受到重視。事實(shí)上,即將推出的TPU已經(jīng)在性能接近同等水平的同時(shí),總擁有成本(TCO)更低搭載了NVIDIA最新的顯卡。

聯(lián)發(fā)科在谷歌TPU v7 Ironwood中的角色

聯(lián)發(fā)科在設(shè)計(jì)谷歌TPU v7 Ironwood中發(fā)揮了重要作用,現(xiàn)在也有望將這些經(jīng)驗(yàn)提煉出來,使其即將推出的芯片更加高效。根據(jù)2025年3月陸續(xù)發(fā)布的報(bào)道,谷歌委托聯(lián)發(fā)科設(shè)計(jì)Ironwood的輸入/輸出(I/O)模塊,以促進(jìn)處理器與外設(shè)之間的通信.這與谷歌近年來與博通密切合作設(shè)計(jì)整個(gè)下一代TPU的戰(zhàn)略有所不同。根據(jù)瑞銀最近的估計(jì),聯(lián)發(fā)科有望通過與谷歌合作開發(fā)下一代TPU獲得40億美元收益.

聯(lián)發(fā)科在谷歌TPU v7 Ironwood上的工作如何提升了更高效天璣9600芯片的前景

請注意,ASIC和基于移動(dòng)的應(yīng)用處理器(AP),如天璣9600,本質(zhì)上是不同的。這意味著聯(lián)發(fā)科無法將其所有經(jīng)驗(yàn)轉(zhuǎn)化為天璣9600的可用格式。盡管如此,公司仍可以通過以下方式進(jìn)行多項(xiàng)迭代改進(jìn):

  1. 為天璣9600芯片設(shè)計(jì)更高效的功率門控策略,使AP在未使用時(shí)更積極地關(guān)閉特定的I/O模塊。

  2. 提升了天璣9600的電壓調(diào)節(jié),使AP能夠最大限度地消耗量子電壓,從而提升芯片的功耗指標(biāo)。

  3. 調(diào)整現(xiàn)有的時(shí)鐘門控策略,以提升下一代芯片的電池續(xù)航,爭取更激進(jìn)的功耗預(yù)算。

當(dāng)然,據(jù)報(bào)道,聯(lián)發(fā)科也在研發(fā)自家的人工智能芯片,其TPU經(jīng)驗(yàn)在這方面將更具參考價(jià)值。盡管如此,其移動(dòng)接入點(diǎn)也可以通過實(shí)施上述調(diào)整受益。這當(dāng)然非常重要,因?yàn)槁?lián)發(fā)科已經(jīng)在其移動(dòng)接入點(diǎn)架構(gòu)中取消了效率核心.


評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉