聯(lián)發(fā)科基于谷歌TPU v7的工作，旨在提升天璣9600的效率

作者：時(shí)間：2025-12-02 來源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

谷歌即將發(fā)布的Ironwood TPU v7現(xiàn)在已經(jīng)成為首個(gè)可行的專用集成電路（ASIC），能夠挑戰(zhàn)英偉達(dá)的Blackwell GPU處理器.這一重大事件，理所當(dāng)然地引起了對谷歌TPU設(shè)計(jì)流程及其合作伙伴的廣泛關(guān)注，其中就包括中國臺灣的聯(lián)發(fā)科，后者將其經(jīng)驗(yàn)轉(zhuǎn)化為定制芯片的實(shí)際效率提升，這將惠及即將推出的天璣9600 SoC。

A computer chip featuring the 'GOOGLE TPU v7 IRONWOOD' alongside a 'MediaTek DIMENSITY 9600.'

谷歌的Ironwood TPU v7及聯(lián)發(fā)科在其中的角色

在談到聯(lián)發(fā)科的天璣9600之前，先來談?wù)剣@谷歌Ironwood TPU v7的各種爭議到底是怎么回事。這里是迄今為止我們對新TPU架構(gòu)的了解:

雙芯片組設(shè)計(jì)，每個(gè)芯片組包含：

向量處理單元（VPU）處理通用的元素級作，這些作對AI模型至關(guān)重要，如激活函數(shù)（如ReLU）和歸一化。
矩陣乘法單元（MXU）處理矩陣乘法運(yùn)算。

1次張量核采用收縮陣列架構(gòu)，實(shí)現(xiàn)高效的矩陣乘法運(yùn)算——這些運(yùn)算構(gòu)成了人工智能工作負(fù)載的骨干，包括神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推斷——通過大幅減少HBM所需的內(nèi)存讀寫次數(shù)。
2次稀疏核，這些工具能夠高效處理需要不規(guī)則、依賴數(shù)據(jù)的內(nèi)存訪問的用例，包括處理稱為嵌入的超大型數(shù)學(xué)結(jié)構(gòu)時(shí)——這些結(jié)構(gòu)用于將大型類別特征值（如基于單詞的詞匯表）轉(zhuǎn)換為更小、更密集的向量表示，是許多人工智能作中的關(guān)鍵步驟。
96 GB 高帶寬內(nèi)存（HBM）。

這兩個(gè)芯片組通過芯片對芯片（D2D）互連連接，其速度是1D芯片間互連（ICI）鏈路的6倍。
單個(gè)TPU機(jī)架包含64顆芯片通過ICI連接，每顆芯片提供1.2 TB/s的雙向ICI帶寬。這種基本的64芯片配置稱為立方體（Cube）.
多個(gè)立方體通過光電路交換機(jī)（OCS）網(wǎng)絡(luò)連接，形成Superpod，由9,216個(gè)芯片和144個(gè)立方體組成.

A table displays specifications and values including 'Peak compute per chip' at ~4,614 TFLOPS, 'HBM capacity per chip' at 192 GB HBM3e, 'Memory bandwidth per chip' at ~7.2 TB/s, 'Maximum pod size' of 9,216 chips, and 'Performance Improvement' of

至于谷歌新TPU的性能表現(xiàn)，只需查看上述性能數(shù)據(jù)即可。正如我們最近在一篇專門的文章中提到的，TPU v7 Ironwood 在推理任務(wù)中與 NVIDIA GPU 競爭激烈，隨著行業(yè)逐漸遠(yuǎn)離大型基礎(chǔ)AI模型，新的推理模型正逐漸受到重視。事實(shí)上，即將推出的TPU已經(jīng)在性能接近同等水平的同時(shí)，總擁有成本（TCO）更低搭載了NVIDIA最新的顯卡。

聯(lián)發(fā)科在谷歌TPU v7 Ironwood中的角色

聯(lián)發(fā)科在設(shè)計(jì)谷歌TPU v7 Ironwood中發(fā)揮了重要作用，現(xiàn)在也有望將這些經(jīng)驗(yàn)提煉出來，使其即將推出的天璣9600芯片更加高效。根據(jù)2025年3月陸續(xù)發(fā)布的報(bào)道，谷歌委托聯(lián)發(fā)科設(shè)計(jì)Ironwood的輸入/輸出（I/O）模塊，以促進(jìn)處理器與外設(shè)之間的通信.這與谷歌近年來與博通密切合作設(shè)計(jì)整個(gè)下一代TPU的戰(zhàn)略有所不同。根據(jù)瑞銀最近的估計(jì)，聯(lián)發(fā)科有望通過與谷歌合作開發(fā)下一代TPU獲得40億美元收益.

聯(lián)發(fā)科在谷歌TPU v7 Ironwood上的工作如何提升了更高效天璣9600芯片的前景

請注意，ASIC和基于移動(dòng)的應(yīng)用處理器（AP），如天璣9600，本質(zhì)上是不同的。這意味著聯(lián)發(fā)科無法將其所有經(jīng)驗(yàn)轉(zhuǎn)化為天璣9600的可用格式。盡管如此，公司仍可以通過以下方式進(jìn)行多項(xiàng)迭代改進(jìn)：

為天璣9600芯片設(shè)計(jì)更高效的功率門控策略，使AP在未使用時(shí)更積極地關(guān)閉特定的I/O模塊。
提升了天璣9600的電壓調(diào)節(jié)，使AP能夠最大限度地消耗量子電壓，從而提升芯片的功耗指標(biāo)。
調(diào)整現(xiàn)有的時(shí)鐘門控策略，以提升下一代芯片的電池續(xù)航，爭取更激進(jìn)的功耗預(yù)算。

當(dāng)然，據(jù)報(bào)道，聯(lián)發(fā)科也在研發(fā)自家的人工智能芯片，其TPU經(jīng)驗(yàn)在這方面將更具參考價(jià)值。盡管如此，其移動(dòng)接入點(diǎn)也可以通過實(shí)施上述調(diào)整受益。這當(dāng)然非常重要，因?yàn)槁?lián)發(fā)科已經(jīng)在其移動(dòng)接入點(diǎn)架構(gòu)中取消了效率核心.

久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

聯(lián)發(fā)科基于谷歌TPU v7的工作，旨在提升天璣9600的效率

谷歌的Ironwood TPU v7及聯(lián)發(fā)科在其中的角色

聯(lián)發(fā)科在谷歌TPU v7 Ironwood上的工作如何提升了更高效天璣9600芯片的前景

評論

相關(guān)推薦

技術(shù)專區(qū)