久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 智能計算 > 新品快遞 > 思科加入定制AI芯片戰局 G300提供帶寬翻倍實現AI縱向與橫向擴展

思科加入定制AI芯片戰局 G300提供帶寬翻倍實現AI縱向與橫向擴展

作者: 時間:2026-02-11 來源: 收藏

在現代人工智能數據中心(如今其實已稱得上是數據生態體系,因為在一些極端場景下,人工智能的處理需求早已突破單個數據中心,甚至是一個區域內多個數據中心的承載邊界)中,網絡存在兩大瓶頸。其一為數據中心互聯架構,它通過路由器骨干網將多個數據中心整合為一個統一的計算綜合體;其二是后端網絡,它能在數十個(未來甚至可達數百、數千個)圖形處理器(GPU)或異構處理器(XPU)之間構建統一的內存域,這也是實現專家混合模型訓練與推理的最優粒度。

當谷歌、微軟和Meta相繼推出自己的AI數據中心芯片產品撼動英偉達在服務器領域的領導地位之際,曾經的網絡第一巨頭終于在AI數據中心定制芯片方面擲出殺手锏。

的定制芯片并不高調,但以穩準狠解決實際痛點著稱。去年秋季,憑借旗下 “黑金字塔” P200 路由器芯片解決了數據中心互聯的難題。該芯片隸屬于思科持續升級擴容的 Silicon One 芯片產品線,不僅被思科用于自研的交換機和路由器,也被超大規模數據中心運營商和云服務商集成至其定制化設備中。

1770790720221115.png

本周,在阿姆斯特丹舉辦的思科技術峰會上,思科推出 專用集成電路(ASIC),大幅提升了交換機側的帶寬性能。這款芯片的總帶寬達 102.4 太比特 / 秒,旨在與博通、英偉達展開競爭,助力行業向 1.6 太比特 / 秒端口速率邁進,實現后端網絡中 GPU 與 XPU 的高速互聯;同時,通過高基數交換機提供 800 吉比特 / 秒的前端網絡端口,實現網絡扁平化,大幅降低網絡建設成本。思科為這款全新的 AI 網絡芯片和交換機搭配了 Nexus One 管理平臺,該平臺可打造統一的網絡架構,同時原生集成思博倫(Splunk)分析工具,并實現人工智能作業的可觀測性。Silicon One 及其所驅動的思科交換機,未來或將與英偉達的邁絡思 InfiniBand、Spectrum-X 以太網光子交換系統,以及博通的 XPU、Tomahawk 交換機等產品展開市場競爭。

 1770790736980463.png

 目前我們尚未知曉 芯片的研發代號,但可以確定的是,其基礎帶寬和速率較 2023 年 6 月推出的 G200 交換機專用集成電路實現了翻倍。G200 芯片的推出初衷便是在人工智能和高性能計算集群的橫向擴展網絡中,與無限帶寬(InfiniBand)技術展開競爭。2025 年 5 月起,G200 開始憑借更高的可擴展性和性價比,逐漸在市場站穩腳跟,但毋庸置疑的是,英偉達仍在無限帶寬橫向擴展網絡市場占據大量份額,并憑借用于后端縱向擴展網絡、實現 GPU 內存互聯的 NVSwitch 互聯技術賺得盆滿缽滿。

G200 及全新推出的 G300 專用集成電路,均為優化精簡版以太網技術量身打造,既具備無限帶寬技術的核心優勢 —— 高帶寬、低延遲、自適應路由和擁塞控制,又保留了以太網相較無限帶寬的獨有長處 —— 高安全性、微分段能力,且擁有多家廠商參與的市場競爭格局。而無限帶寬技術的供應商單一,這一點已成為部分企業選擇的顧慮。

思科此次發布的產品矩陣涵蓋芯片、光模塊、系統、軟件及運營模式全維度:Silicon One G300 芯片、先進的硬件系統組合、高性能光模塊、升級后的軟件功能,以及 Nexus One 管理平臺。其中 Nexus One 平臺支持 AI 作業可觀測性、思博倫原生集成、AgenticOps 智能運維能力,還能實現本地與云部署的統一運營;硬件端則搭配 1.6 太比特八通道小型可插拔光模塊(OSFP)和 800 吉比特線性可插拔光模塊(LPO),落地于思科 N9000 和 8000 系列交換機。

此次與 G300 芯片一同發布的,還有全新的 Nexus 9000 和思科 8000 系列硬件系統、適配的新型可插拔光模塊,以及網絡操作系統和控制平面的升級版本。這些升級讓基于 G300 交換機的大規??v向擴展網絡,或是為人工智能系統供能的高性能前端網絡的管理變得更為便捷。

思科目前尚未公布 G300 專用集成電路的詳細技術參數,因此我們無法展示該芯片的模塊框圖及 G300 交換機的電路原理圖。但我們從思科 Silicon One 產品線研發負責人、高級副總裁兼思科院士拉凱什?喬普拉(Rakesh Chopra)處,獲取了該芯片的核心帶寬速率數據與關鍵設計思路。

1770790765209393.png

G300 芯片的核心亮點在于智能聚合網絡技術,可打造高效的人工智能基礎設施,擁有行業領先的數據包緩沖區、聚合負載均衡代理和先進的遙測引擎,能使網絡利用率提升 33%、作業完成時間縮短 28%,這一切均由思科 Silicon One 芯片提供算力支撐。

與 G200 相同,G300 配備 512 個串行解串器(SerDes)電路模塊以實現端口功能,所有模塊均圍繞數據包處理引擎搭建。兩款芯片的每個串行解串器都配有獨立的以太網媒體訪問控制(MAC)地址,實現端口與媒體訪問控制地址的一一映射。(多數交換機專用集成電路的每個串行解串器僅配備半數媒體訪問控制地址,若通過聚合串行解串器實現指定帶寬的端口,該設計足矣;但如果想要打造高基數交換機,配備更多低帶寬端口,這種設計便會面臨媒體訪問控制地址不足的問題。)

和去年秋季發布的 P200 芯片一樣,G300 采用 “無蓋式” 芯片設計,即移除芯片封裝蓋,使風冷散熱器和液冷散熱塊可直接貼合芯片安裝,大幅提升散熱效率。

思科 2022 年 10 月推出的 G100 交換機專用集成電路基于臺積電 7 納米制程打造,2023 年夏季推出的 G200 則采用臺積電 5 納米制程。G300 的靜態隨機存取存儲器(SRAM)緩存緩沖區達 252 兆字節,據我們估算,至少是 G200 緩存緩沖區的兩倍,同時仍配備同等數量的高速串行解串器。由此推測,思科為 G300 選用了臺積電的混合制程方案。G300 為多芯片設計,我們大膽推測,其數據包處理引擎模塊及靜態隨機存取存儲器緩沖區采用 3 納米制程,而外圍的串行解串器芯粒則采用臺積電在 5 納米基礎上優化的成熟 4 納米制程。因為信號電路的制程微縮難度遠高于計算電路,且 3 納米技術的使用成本也高于 4 納米。

 1770790779450682.png

喬普拉表示,G300 的 252 兆字節緩沖區是面向全部 512 個串行解串器的單一、統一共享緩沖區,并非像其他部分設計那樣,按串行解串器組進行分段設計。這一設計不僅讓緩沖區容量更大,更實現了所有串行解串器的內存共享,大幅提升操作效率,尤其在網絡擁塞時,能有效避免以太網數據包丟失,保障數據傳輸的完整性。

這款大容量緩沖區與片上硬件負載均衡代理相配合,可實時監控交換機內部的數據流,繪制流量分布圖,精準識別擁塞和傳輸故障節點,并據此優化網絡中所有 G300 芯片的流量分配。該負載均衡的核心為算法驅動,嚴格來說并非人工智能技術。此外,與所有 Silicon One 系列芯片一致,G300 全面支持 P4 網絡編程語言的可編程性,可根據市場需求快速開發并部署新功能。

G300 搭載的串行解串器由思科自主設計,編碼前速率達 224 吉比特 / 秒,編碼后為 200 吉比特 / 秒。(我們推測,該串行解串器的原生信號時鐘速率為 112 吉比特 / 秒,通過四電平脈沖幅度調制(PAM4)技術實現速率翻倍至 224 吉比特 / 秒,該調制技術可使每個信號承載兩位數據。)值得一提的是,這是思科首款 200 吉比特 / 秒速率的串行解串器。

基于 G300 芯片,可靈活打造不同規格的交換機:512 個 200 吉比特 / 秒端口、256 個 400 吉比特 / 秒端口、128 個 800 吉比特 / 秒端口,甚至 64 個速率高達 1.6 太比特 / 秒的端口,后者的性能至今仍堪稱驚艷。

此外,G300 可直接驅動單端口 800 吉比特 / 秒的線性可插拔光模塊,思科也推出了適配 G300 交換機的線性可插拔光模塊產品;同時,思科還自研了 1.6 太比特 / 秒的八通道小型可插拔光模塊,供選擇 G300 搭建 1.6 太比特 / 秒端口網絡的客戶使用。這些光模塊均基于思科自研芯片打造,非第三方外購產品(英偉達和博通也同樣實現了這類組件的自研自產)。有趣的是,思科也為有多樣化選擇需求、希望通過第二供應商分散供應鏈風險的客戶,推出了基于第三方數字信號處理器(DSP)的可插拔光模塊。

 1770790795506260.png

采用線性可插拔光模塊能實現大幅節能,進而將更多電力分配給計算引擎。喬普拉表示,線性可插拔光模塊的功耗可降低約 50%,人工智能集群中的整個交換基礎設施功耗可降低約 30%,這一節能效果意義重大。

2026 年下半年,新一代 GPU 和 XPU 即將面世,部分客戶為滿足其更高的帶寬需求,愿意承擔額外功耗以部署 1.6 太比特 / 秒端口;而另一部分客戶對 800 吉比特 / 秒的帶寬已足夠使用,因此低功耗的線性可插拔光模塊成為其更優選擇。

喬普拉稱,在標準化帶寬條件下,相較于 G200 及市場上的多數競品,G300 能使網絡利用率提升 33%,作業完成時間縮短 28%。

 1770790811436880.png

喬普拉自豪地表示:“此次發布的產品中,我們不僅擁有核心硬件技術,光模塊的測試和認證體系更是獨樹一幟。我們的測試架構遠比行業內其他廠商全面,原因在于人工智能工作負載具有同步性,光模塊的單次故障與前端網絡故障不同,它會直接導致人工智能作業重啟,工作人員不得不回到檢查點重新開始?!?/p>

思科將 G300 芯片集成至多款設備中:風冷設備方面,搭載于運行思科自研 NX-OS 操作系統的 Nexus N9364-SG3 交換機,以及運行開源 SONiC 網絡操作系統的思科 8133 交換機。這兩款風冷交換機均為 3 機架單位(3RU)規格,配備 64 個 1.6 太比特 / 秒的八通道小型可插拔光模塊端口,且搭載冗余可插拔電源。

若客戶需要更緊湊的設備,同時兼顧液冷和開放式機架部署,思科則推出了兩款產品:運行 NX-OS 操作系統的 Nexus N9363-SG2 交換機,以及運行 SONiC 操作系統的思科 8132 交換機。該款設備寬度為 21 英寸,符合開放計算項目(OCP)的 Orv3N 規范,采用 20 機架單位(20U)設計,配備 64 個 1.6 太比特 / 秒八通道小型可插拔光模塊端口,搭載冗余集成電源,擁有先進的泄漏檢測功能,適配超大規模數據中心、新型云服務商、電信運營商、主權云及企業客戶的需求。

這一技術升級帶來的核心價值在于:在縱向擴展網絡中實現 GPU 間的互聯,或在橫向擴展網絡中實現服務器節點及其 GPU 間的互通,若要達到 102.4 太比特 / 秒的總互聯帶寬,此前需要 6 臺互聯的 G200 設備,而現在僅需 1 臺 G300 設備即可實現。

對比原有系統與全新系統,G300 方案的效率提升 6 倍,所需設備數量大幅減少,且功耗效率提升 70%。原有系統為 6 臺 51.2 太比特 / 秒的風冷 G200 交換機,配備 64 個 800 吉比特 / 秒八通道小型可插拔光模塊端口;全新系統則為 1 臺 102.4 太比特 / 秒的液冷 G300 交換機,配備 64 個 1.6 太比特 / 秒八通道小型可插拔光模塊端口。

這也意味著,即便 G300 的單價是 G200 的三四倍,但其綜合性價比仍極具優勢。目前我們尚未知曉 G300 的實際定價,但在人工智能時代來臨前,行業的常規規律是:新一代專用集成電路的單價約為上一代的 1.5 倍,而單芯片帶寬可實現翻倍。

對于推動生成式人工智能革命的企業而言,其算力采購規模均以吉瓦為單位,因此 G300 帶來的 70% 的功耗效率提升,具有舉足輕重的意義。

1770790835146132.png

思科的 Silicon One 統一架構還在持續快速拓展:2025 年開放計算項目峰會上,思科推出了 N9364 和思科 8223 設備,其中思科 8223 為 51.2 太比特 / 秒的固定架構設備,配備 64 個 800 吉比特 / 秒八通道小型可插拔光模塊和四通道雙密度可插拔光模塊(QSFP-DD)端口,適配超大規模數據中心和新型云服務商的橫向擴展需求;2026 年歐洲、中東和非洲區思科技術峰會上,思科又推出 N9836 和思科 88-LC2 設備,前者為 51.2 太比特 / 秒固定架構設備,配備 64 個 800 吉比特 / 秒八通道小型可插拔光模塊和四通道雙密度可插拔光模塊端口,后者為 28.8 太比特 / 秒的模塊化線卡,配備 36 個 800 吉比特 / 秒八通道小型可插拔光模塊端口,適配超大規模數據中心、新型云服務商、電信運營商、企業客戶的需求,可應用于橫向擴展、數據中心互聯、通用骨干網、核心與對等路由等場景,同時支持 SONiC、NX-OS、應用中心基礎設施(ACI)、IOS-XR 等多種操作系統。

除 G300 芯片及其配套的交換機、光模塊外,思科本周還豐富了 P200 芯片的產品陣容。去年秋季,思科首次推出搭載 P200 芯片的 51.2 太比特 / 秒路由器,配備 64 個 800 吉比特 / 秒端口,用于數據中心互聯鏈路;如今,思科將 P200 芯片集成至商用級 Nexus 設備,以及 Nexus 系列和白盒模塊化交換機的線卡中。


評論


相關推薦

技術專區

關閉