Nvidia將數(shù)據(jù)中心統(tǒng)一為千兆規(guī)模的AI工廠
隨著人工智能需求的激增,單個數(shù)據(jù)中心正在達到單個設(shè)施內(nèi)的功率和容量極限。為了擴展,數(shù)據(jù)中心必須擴展到任何一棟建筑之外,而任何一棟建筑都受到現(xiàn)成的以太網(wǎng)網(wǎng)絡(luò)基礎(chǔ)設(shè)施的限制,具有高延遲和抖動以及不可預(yù)測的性能。
Spectrum-XGS 以太網(wǎng)添加到 NVIDIA Spectrum-X 以太網(wǎng)平臺中,該平臺通過引入跨擴展基礎(chǔ)設(shè)施消除了這些界限。它是 AI 計算的第三大支柱,超越縱向擴展和橫向擴展,旨在擴展 Spectrum-X 以太網(wǎng)的極致性能和規(guī)模,以互連多個分布式數(shù)據(jù)中心,形成能夠?qū)崿F(xiàn)千兆級智能的 AI 超級工廠。
“人工智能工業(yè)革命已經(jīng)到來,大規(guī)模人工智能工廠是必不可少的基礎(chǔ)設(shè)施,”首席執(zhí)行官黃仁勛說,“借助 NVIDIA Spectrum-XGS 以太網(wǎng),我們增加了縱向擴展和橫向擴展功能,將跨城市、國家和大陸的數(shù)據(jù)中心連接成巨大的千兆級人工智能超級工廠。
Spectrum-XGS 以太網(wǎng)集成到 Spectrum-X 平臺中,其算法可使網(wǎng)絡(luò)適應(yīng)數(shù)據(jù)中心設(shè)施之間的距離。
憑借先進的自動調(diào)整距離擁塞控制、精確的延遲管理和端到端遙測,Spectrum-XGS 以太網(wǎng)將 NVIDIA 集體通信庫的性能提高了近一倍,加速了多 GPU 和多節(jié)點通信,從而在地理分布的 AI 集群中提供可預(yù)測的性能。因此,多個數(shù)據(jù)中心可以作為單個 AI 超級工廠運行,并針對長距離連接進行了全面優(yōu)化。
采用新基礎(chǔ)設(shè)施的超大規(guī)模先驅(qū)包括 CoreWeave,它將成為首批將其數(shù)據(jù)中心與 Spectrum-XGS 以太網(wǎng)連接的公司之一。
Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺為多租戶、超大規(guī)模 AI 工廠(包括世界上最大的 AI 超級計算機)提供比現(xiàn)成以太網(wǎng)高 1.6 倍的帶寬密度。
它包括 NVIDIA Spectrum-X 交換機和 NVIDIA ConnectX-8 SuperNIC,為構(gòu)建人工智能未來的企業(yè)提供可擴展性、低延遲和性能。
該公告是在 NVIDIA 發(fā)布多項網(wǎng)絡(luò)創(chuàng)新公告之后發(fā)布的,包括 NVIDIA Spectrum-X 和 NVIDIA Quantum-X 硅光子網(wǎng)絡(luò)交換機,它們使 AI 工廠能夠跨站點連接數(shù)百萬個 GPU,同時降低能耗和運營成本








評論