首款2nm SRAM,為AI數據中心帶來什么?
SRAM 已經非常成熟,現在被認為是一種商業「管道」類型的內存,但 Marvell Technology 的最新定制 SRAM 正在展示這種現有內存如何在 AI 數據中心發揮作用。
顯著降低功耗和芯片面積
Marvell 聲稱其定制 SRAM 是業界首款 2nm 定制 SRAM。它旨在提升加速基礎設施中內存層的性能,提供高達 6Gbit 的高速內存,從而提升定制 XPU(處理器、加速器、GPU)和設備的性能。此外,在相同密度下,它還能顯著降低內存功耗和芯片面積。
該公司的 SRAM 比類似密度的標準片上 SRAM 功耗低 66%,運行頻率高達 3.75GHz,這是 AI 集群和數據中心管理其能源足跡和有效冷卻組件的關鍵指標。
Marvell 首席內存架構師 Darren Anand 表示:「Marvell 一直專注于優化 SRAM,以適應 AI/機器學習應用。這與我們目前的封裝和定制高帶寬內存 (HBM) 工作具有顯著的協同效應,從而為 XPU 上的計算釋放了更多的芯片面積。」
「SRAM 有創新的機會」
Anand 表示:「Marvell 的 SRAM 不是不斷訪問 HBM,而是將部分工作負載保留在芯片上,并支持 AI 工作負載所需的高帶寬和寬 IO,從而有可能提高整體設備性能。」

在最先進的節點上,SRAM 可以與邏輯芯片集成在同一塊芯片上。來源:Marvell Technology
他表示:「SRAM 是唯一在個位數工藝節點上可用的存儲器,因此也是唯一能夠支持近內存計算架構的高性能存儲器。在這些前沿節點上,DRAM 無法在同一塊硅片上使用。同樣,NAND 閃存、磁阻 RAM (MRAM)、電阻式 RAM (ReRAM) 和相變 RAM (PCM) 等新興存儲器也無法在這些前沿節點上使用。」
Anand 解釋說:「在尖端節點上,SRAM 可以與邏輯芯片集成在同一芯片上,從而支持可立即供 XPU 上的處理器和邏輯引擎使用的內存層次結構。」 在這方面,它不同于連接內存和邏輯芯片的典型馮·諾依曼架構。近內存計算架構將數據放置在更靠近需要的位置,從而降低了移動數據所需的功耗并增加了帶寬。
他補充道:「典型的 XPU 至少有 30% 的硅片面積專用于 SRAM,有些設計甚至超過芯片面積的 50% 到 60%。我們正在嘗試優化這一點,因為這會對芯片的芯片尺寸和成本產生重大影響。」
「在業界,SRAM 正變得像一個基本的 IP『管道』,這意味著很多地方都需要它,但卻缺乏技術創新。實際上,在 SRAM 架構中可以實現許多新技術,以優化功耗、帶寬和許多其他指標。我們并不認為 SRAM 僅僅是一個管道,而是一個創新的機會,」Anand 說道。
Anand 認為,SRAM 面臨的最大挑戰是面積微縮。雖然邏輯單元和存儲器都經歷了多代的微縮,但 SRAM 單元似乎開始遇到瓶頸,導致過去幾代先進節點的微縮停滯不前。「邏輯單元繼續微縮,但存儲器位單元卻沒有,」Anand 指出。
Objective Analysis 首席分析師 Jim Handy 表示:「Marvell 的方法實現了節能降耗和速度提升,同時也承認了 SRAM 芯片并非隨著工藝制程線性擴展的事實。他們只是根據這些工藝制程尺寸對 SRAM 進行了輕微的調整。」
Handy 表示:「SRAM 廣泛用于高性能處理器芯片的緩存。如果芯片無需訪問外部存儲器,其速度甚至可以更快。事實上,芯片上的所有核心每個周期都能執行一條指令,速度非常快。」
雖然 SRAM 和 DRAM 都是隨機存取存儲器的形式,但是它們的結構上有所不同。DRAM 代表動態隨機存取存儲器。這種存儲器在結構上與 SRAM 有所不同,因為它使用電容器而不是反相器和晶體管進行存儲。因此,這種存儲器需要刷新并因此發生變化,因此被定義為「動態」的。不像 SRAM,其存儲器存儲在芯片上,DRAM 存儲在與芯片外部的主板上,因此訪問時間更長。這導致 SRAM 是一種比 DRAM 更快的存儲器。
每種內存在設備中存儲的位置也不同。DRAM 通常用作主要的存儲器,因此通常存儲在主板上,但是由于 SRAM 是 CPU 中常用的存儲器,因此最可能在處理器上找到。
最后,這兩種內存在成本方面也有所不同。由于 SRAM 需要更多的功率來運行,因此與 DRAM 相比,它也是一種更昂貴的內存選擇。這是 SRAM 不總是主存儲系統的理想選擇的另一個原因。









評論