GPU公司曦望(Sunrise)完成超 10 億元融資,估值破百億
中國 AI 推理 GPU 賽道再迎重磅融資。據鳳凰網消息,國內 AI 推理 GPU 企業曦望(Sunrise) 完成新一輪超10 億元人民幣融資,估值突破100 億元,成為中國純推理 GPU 領域首家獨角獸企業。
這是 2026 年 AI 需求向推理側轉移背景下,國內 GPU 行業最大單筆融資之一。曦望源自 AI 巨頭商湯科技分拆,至今已完成7 輪融資,累計融資額約40 億元。
本輪資金將主要用于:
下一代啟望 S3(Qiwang S3) 推理 GPU 的量產與交付
全棧軟件生態建設
后續 S4、S5 芯片的持續研發迭代
啟望 S3:主打推理效率,采用 LPDDR6 架構
曦望于 2026 年 1 月正式發布旗艦推理 GPU 啟望 S3,是國內首款采用 LPDDR6 顯存、同時兼容 LPDDR5X的推理 GPU。
與高端訓練 GPU 普遍采用 HBM 路線不同,該芯片專為智能體(Agent)推理場景量身設計,從 AI Core 架構到存儲 I/O 系統進行全棧重構。
架構思路源于推理負載截然不同的存儲需求:在主流高并發、長上下文云場景中,KV 緩存可占總內存的 80% 以上。
S3 基于 LPDDR6 的設計:
提供充足推理帶寬
提升存儲容量
功耗降低50%
完美匹配推理場景大容量、低成本、低功耗的核心訴求。
算力層面
S3 解決了通用 GPU 算力利用率偏低的痛點:
推理性能較上一代 S2 提升 5 倍
目標將Token 成本降低 90%
在大模型推理中,GEMM(通用矩陣乘法)與 Attention 操作占算力超 90%,S3 將核心算子利用率推至:
GEMM:約99%
Flash Attention:約98%
大幅提升整體效率。
企業定位:All-in 推理,已實現數萬片量產
曦望董事長徐冰表示,2026 年 AI 推理需求預計將達到訓練需求的4–5 倍,過去半年推理算力租賃價格上漲近40%。
公司已完成三代推理 GPU研發,實現數萬片規模量產。
作為國內首家純推理 GPU 獨角獸,曦望的崛起標志著中國 AI 芯片從 “訓推一體” 向專業化推理芯片的關鍵轉向。







評論