Solidigm成立AI中央實驗室,配備高性能、大密度存儲測試集群
企業數據存儲領域領導者 Solidigm正式揭幕其 AI 中央實驗室。該實驗室配備了專為多種AI工作負載量身打造的高性能、高密度的存儲測試集群。
這座先進的 AI 中央實驗室坐落于美國蘭喬科爾多瓦的 FarmGPU 設施內,緊鄰 Solidigm 總部。在這里,Solidigm 能夠利用NVIDIA B200 和 H200 圖形處理器,運行并研究真實的 AI 工作負載。這不僅為我們理解前沿存儲技術如何最大限度地提升集群效率,提供了獨到的見解,更讓 Solidigm 在 AI 生態系統中的重要合作伙伴,有機會在先進的硬件平臺上充分開展實驗。
Solidigm AI生態系統與合作伙伴關系高級總監Avi Shetty強調:“Solidigm AI 中央實驗室將當前強大的 GPU 與領先的存儲基礎設施融合,為客戶和開發者社區開啟了前所未有的測試與聯合創新篇章。Solidigm 希望這些能力可以惠及更多用戶,同時證明了存儲與 GPU 緊密集成的重要性與價值。”
該實驗室在建設之初便秉持通用參考架構理念,客戶可以在一個與全球大型數據中心保持一致標準的環境中,利用 Solidigm SSD測試其解決方案。此外,實驗室還將大力推動存儲研究,超越傳統的組件級測試范疇,更深層次地理解服務器、機架乃至集群層面的真實應用場景。
Shetty 進一步指出:“如今,僅僅進行存儲測試已遠遠不夠。在AI 中央實驗室,我們能夠運行真實場景的AI 工作負載,并借助尖端遙測技術來優化系統性能和效率,以便更深刻地理解新興工作負載對存儲的實際需求。”

AI中央實驗室配備了最新的高性能計算硬件,包括:
● 高性能存儲測試集群:采用超高速Solidigm? D7-PS1010 SSD,在MLPerf存儲(AI模型訓練)測試中達到了創紀錄的每節點116 GB/s吞吐量,可靈活擴展至多個節點。
● 高密度存儲測試集群:配備了192塊Solidigm D5-P5336 SSD,每塊容量高達122TB,僅占用16U機架空間即可帶來23.6PB的總存儲容量。
● 其他配置:實驗室還配備NVIDIA B200和H200 GPU、800 Gbps以太網絡以及領先供應商的存儲服務器。Solidigm也在不斷擴展和探索新技術。
實驗室可供測試的工作負載包括:
● AI特定及新興工作負載,例如真實場景下的GPU密集型的AI模型訓練和推理,以及KV緩存卸載和VectorDB調優等創新方法。
● 實驗室能夠對不同配置進行功耗基準測試,從而開發出能夠高效利用能源的架構。
● 實驗室可深入研究如何快速向價格高昂的GPU加速器傳輸數據,使其盡可能保持高負載狀態,最大限度釋放其算力。
● AI 中央實驗室所產生的數據,有助于將SSD的硬件規格,轉化為系統層級、與行業應用緊密相關的 AI 效率指標,例如每美元可處理的token和每瓦特可處理的token。
目前,該實驗室已與多家機構建立了合作。其中之一是,Solidigm 與 Metrum AI 的專家們攜手攻關,成功開發出一種創新技術,能夠將 AI 數據從內存卸載至SSD,從而在使用 RAG(檢索增強生成)進行推理時,將DRAM的使用量降低高達 57%。
與 FarmGPU 的合作也讓 Solidigm 得以持續助力其優化 AI 基礎設施性能和效率。



評論