英偉達將量子與人工智能集成為高性能計算中心

英偉達今年大部分時間都在推出新產品和合作伙伴關系,旨在確保其在仍是人工智能市場的狂野西部中保持領先地位,同時確立其在新興量子計算領域的地位,聯合創始人兼首席執行官黃仁森認為英偉達將成為關鍵的基礎設施提供商和加速器。
最近,英偉達在十月底于華盛頓特區舉辦的GTC大會上,發布了公司一貫的大量公告,黃和英偉達高管發布了新產品,如NVQLink——一種開放的高速互聯系統,將量子處理器與超級計算機中的GPU連接起來,打造公司所稱的“加速量子超級計算機”;BlueField-4,一款數字處理單元(DPU),結合了64核“Grace”處理器和ConnectX-9,創造了800 Gb/sec 平臺,支持超級級人工智能工廠,以及開放的人工智能模型和數據。
在本周于圣路易斯舉行的SC25超級計算大會上,英偉達的重點將是展示圍繞這些技術形成的合作伙伴關系和客戶成果,展示其在行業中的影響力以及其技術似乎無處不在的特性。例如,公司宣布過去一年全球推出了80多套由Nvidia驅動的新科學系統,累計實現了4500億億次人工智能(即機器最低精度)的性能。

在與記者的簡報會上,英偉達高性能計算與人工智能基礎設施高級總監Dion Harris談到了公司2016年推出的DGX-1,這是一款高度集成的硬件和軟件系統,用于人工智能和加速工作負載,這在以GPU聞名的廠商中是首次實現這一舉措。

哈里斯說:“我們開發DGX1是因為我們知道僅僅在芯片層面創新不足以滿足即將到來的人工智能浪潮的需求。”“僅僅在系統架構層面創新是不夠的。我們需要在浮點作、計算、內存、系統架構等領域創新,同時也要在可擴展的網絡、可擴展的網絡,當然還有軟件方面進行創新。英偉達的平臺加速計算涵蓋CPU、GPU、內存、可擴展網絡、可擴展網絡、機架級架構以及軟件。我們優化了從芯片到系統、網絡、軟件到應用的整個技術棧,并且持續優化軟件,實現產品生命周期內多個X因素的性能提升。”
在上個月的GTC活動上,黃炳哲介紹了NVQLink,并補充說,將量子系統與經典超級計算機連接,將通過利用超級計算機中的GPU解決量子系統糾錯這一棘手問題。加入 Nvidia 的量子經典計算平臺 CUDA-Q,將使用戶超越糾錯,協調量子設備和人工智能超級計算機來運行量子 GPU 計算。

NVQLink 在 FP4 精度下提供 40 petaflops 的 AI 性能,GPU 與 QPU 吞吐量為 400 Gb/sec,延遲不到 4 微秒。
當時,該供應商指出,美國有九個國家實驗室和研究中心——包括洛斯阿拉莫斯國家實驗室、橡樹嶺國家實驗室、麻省理工學院、勞倫斯伯克利國家實驗室和費米國家加速器實驗室——正在采用NVQLink。在SC25大會上,英偉達宣布,來自亞洲和歐洲的十多個超級計算中心和國家研究機構也正在擁抱該技術,將量子與經典系統整合起來。
在亞洲,包括日本量子人工智能技術全球研究開發中心、韓國科學信息研究院以及臺灣國家高性能計算中心。歐洲和中東的中心包括德國的Jülich超級計算中心、波蘭的波茲南超級計算與網絡中心,以及阿聯酋的技術創新研究所。
量子經典的未來
哈里斯說:“未來,每臺超級計算機都將依賴量子處理器來擴展其可計算的問題,而每個量子處理器都將依賴超級計算機來正常運行。”“原因是電腦不是單獨工作的。它們依賴強大的經典處理器來管理、穩定和解釋量子作。GPU充當大腦,協調量子硬件,執行量子處理器無法完成的繁重計算。”
他補充說,量子處理器與GPU超級計算機之間的集成極為艱巨。“執行量子糾錯等任務需要量子GPU互聯,其延遲和吞吐量均達到數百吉比特每秒。”
哈里斯還指出,除了超級計算和研究中心外,其他量子公司也在采用NVQLink。他提到了Quantinuum,該公司正在將互聯納入未來量子系統的路線圖,并用其新款Helios芯片演示實時糾錯。

他說:“這項演示采用了極低延遲的算法,實現了由NVQLink和CUDA-Q實現的可擴展量子糾錯碼。”“這些進步為Quantinuum提供了可擴展的GPU超級計算訪問權,其量子處理器的總往返時間為67微秒,完全符合其系統擴展所需的限制。”
英偉達還宣布,日本研究中心理研將其技術應用于兩臺新超級計算機,一臺運行人工智能科學工作負載,另一臺專為量子計算設計。第一個系統將包含1600塊Nvidia Blackwell GPU,采用GB200 NVL4平臺,這是一種液冷系統,面向高性能計算和人工智能應用,集成兩顆Grace CPU和四顆Blackwell GPU,集成在單節點上。超級計算機將在生命科學、材料科學、氣候與天氣預報以及制造業等領域開展研究工作。

該量子計算系統將包括540個Blackwell,并采用GB200 NVL4平臺,所有平臺均與英偉達的Quantum-x800 InfiniBand網絡互聯。它將用于量子算法、混合仿真和量子-經典計算方法的研究。
SC25的發布發布距離理研在東京FugakuNEXT國際倡議發布儀式上表示計劃與富士通和英偉達合作,共同設計繼Fugaku之后的下一代超級計算機FugakuNEXT僅兩個月。
在另一項合作中,Arm宣布基于其Neoverse設計的CPU將通過Nvidia的NVLink Fusion與AI芯片集成,該Fusion是其NVLink高速結構的擴展,允許合作伙伴通過將自有CPU、ASIC及其他組件與Nvidia GPU集成,構建定制和半定制的AI基礎設施。
這對谷歌、亞馬遜和Microsoft等正在打造基于Arm的云服務芯片的超大規模企業來說是個好消息,現在他們還能將其與Nvidia GPU集成。
此外,英偉達宣布,德克薩斯先進計算中心(TACC)、亞馬遜云服務的Lambda無服務器計算服務以及AI云計算公司CoreWeave將整合其于四月推出的Quantum-X Photonics InfiniBand COP網絡交換機,以節省能源消耗和運營成本。
與此同時,HPC存儲廠商DDN、VAST Data和WEKA正在采用BlueField-4 DPU應用于多種工作,從下一代AI工廠到通過智能數據流動改進AI流水線,再到WEKA推出的NeuralMesh AI軟件定義存儲產品。









評論