久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 智能計算 > 業界動態 > 英偉達和OpenAI推出開源推理模型

英偉達和OpenAI推出開源推理模型

作者: 時間:2025-08-07 來源: 收藏

和 Nvidia 開發的兩種新的開放權重 AI 推理模型——gpt-oss-120b 和 gpt-oss-20b——可供用戶使用。

任何人都可以使用這些模型來開發生成、推理和物理人工智能、醫療保健和制造領域的應用程序。

的開放權重文本推理大型語言模型 (LLM) 是在 Nvidia H100 GPU 上訓練的,在運行 Nvidia CUDA 平臺的數億個 GPU 上運行推理效果最好。

這些模型現在可作為 Nvidia NIM 微服務提供,可在任何 GPU 加速基礎設施上部署,具有靈活性、數據隱私和企業級安全性。

通過對 Nvidia Blackwell 平臺的軟件優化,這些模型在 Nvidia GB200 NVL72 系統上提供最佳推理,實現每秒 150 萬個令牌。

Nvidia Blackwell包括 NVFP4 4 位精度等創新,可實現高精度推理,同時降低功耗和內存需求。這使得實時部署萬億參數的 LLM 成為可能。

Nvidia CUDA 允許用戶在任何地方部署和運行 AI 模型,從 Nvidia DGX 云平臺到 Nvidia GeForce RTX 和 Nvidia RTX PRO 驅動的 PC 和工作站。

迄今為止,Nvidia CUDA 的下載量已超過 4.5 億次,從今天開始,龐大的 CUDA 開發人員社區可以訪問這些最新模型,這些模型經過優化,可以在他們已經使用的 Nvidia 技術堆棧上運行。

和 Nvidia 與頂級開放框架提供商合作,除了 Nvidia Tensor-RT LLM 和其他庫外,還為 FlashInfer、Hugging Face、llama.cpp、Ollama 和 vLLM 提供模型優化,因此開發人員可以使用他們選擇的框架進行構建,以展示他們對開源軟件的承諾。



評論


相關推薦

技術專區

關閉