Tachyum推出2nm Prodigy,其AI機架性能比Nvidia Rubin Ultra 高 21 倍
Tachyum? 今天公布了其 2nm Prodigy? 通用處理器的詳細信息和規格,該處理器將使 AI 模型的參數比任何現有解決方案的參數大許多數量級,而成本僅為其一小部分。
Prodigy Ultimate 提供的 AI 機架性能比 Nvidia Rubin Ultra NVL576 高出 21.3 倍。Prodigy Premium 提供的 AI 機架性能比 Vera Rubin 25.8 高出 144 倍。2nm Prodigy 是有史以來第一個推理超過 1,000 PFLOP 的芯片,其技術細節將在一周內發布。Nvidia Rubin 提供 50 個 PFLOP。
全球人工智能競爭持續加速,中美領跑。當前的人工智能模型展示了巨大的計算規模——例如,ChatGPT 4 具有大約 1.8 萬億個參數,而人腦則包含估計 150 萬億個突觸。BaGauLu 等新興系統達到 174 萬億個參數,但最終的突破有望來自基于人類集體知識訓練的模型,超過 10 億萬億 (1020) 個參數。傳統的大規模人工智能解決方案可能耗資超過 8 萬億美元,需要超過 276 吉瓦的電力。相比之下,Tachyum 解決方案預計將以 780 億美元的估計成本和僅 1 吉瓦的電力需求實現可比的功能,使其可供多家公司和國家使用。
除了開源所有軟件外,Tachyum 還使用標準組件提供其內存技術,允許內存或處理器公司許可的基于 DIMM 的內存帶寬增加 10 倍,包括采用 JEDEC 以實現高采用率和低成本。2023 年,Tachyum 宣布推出可許可的 Tachyum AI (TAI) 數據類型,其 Tachyum 處理單元 (TPU) 核心可供許可。Tachyum 正在開放指令集架構 (ISA)。
Tachyum 不斷升級其 Prodigy 設計,以滿足服務器、AI 和 HPC 市場不斷變化的需求,整數性能高達 5 倍,AI 性能提高 16 倍,DRAM 帶寬提高 8 倍,芯片到芯片和 I/O 帶寬提高 4 倍,支持 16 個插槽,可擴展性提高 4 倍,能效提高 2 倍,每核成本更低。
Prodigy芯片升級為2nm,大幅降低功耗。盡管 2nm 晶圓價格昂貴,但減小小芯片尺寸可以提高成本。Prodigy 封裝中的每個小芯片都集成了 256 個高性能定制 64 位內核。功耗降低至關重要,因為多個小芯片占據一個封裝。在最近 2.2 億美元投資的支持下,2nm Prodigy 正在準備流片。
多個 Prodigy SKU 涵蓋廣泛的性能和應用,包括大 AI、百億億次級超計算、HPC、數字貨幣、云/超大規模、大數據分析和數據庫。Prodigy Ultimate集成了1,024個高性能內核、24個DDR5 17.6GT/s內存控制器和128個PCIE 7.0通道。Prodigy Premium 配備 16 個 DRAM 通道和 512 至 128 個內核,可擴展到 16 個插槽系統。入門級 Prodigy 配備 8 或 4 個 DRAM 控制器和 128 至 32 個內核。
刺IGY 功能、可擴展性和價格細分確保快速市場滲透。Tachyum 提供開箱即用的原生系統軟件、作系統、編譯器、庫、許多應用程序和 AI 基礎設施框架。它還允許運行未經修改的 Intel/AMD x86 二進制文件,并將它們與本機應用程序混合使用。這確保了 Tachyum 系統從第一天起就可以由客戶運行。
Tachyum創始人兼首席執行官Radoslav Danilak博士表示
:“經過漫長的等待,現在已經獲得了流片資金,世界上第一臺通用處理器可以投入生產,旨在克服當今數據中心的固有局限性。“Prodigy 針對的獨特市場是人工智能、服務器和高性能計算市場,需要快速高效的芯片。Tachyum 的 Prodigy Premium 和 Ultimate 將以比市場上任何其他解決方案更低的成本以卓越的性能增強工作負載。
Prodigy 通用處理器提供高出幾個數量級的 AI 性能,性能是最佳 x86 處理器的 3 倍,HPC 性能是最快 GPGPU 的 6 倍。Prodigy 消除了對昂貴的專用 AI 硬件的需求并顯著提高了服務器利用率,顯著降低了數據中心的資本支出和運營支出,同時提供了前所未有的性能、功耗和經濟性。










評論