攪動100億美金的ChatGPT,竟然這么依賴TA?
這幾天,「微軟砸下百億美金注資OpenAI」的消息瘋狂刷屏。
作為一家沒有商業(yè)模式的公司,OpenAI怎么就能估值百億美金?投資人這么好忽悠嗎?其實,拉出OpenAI背后的ChatGPT,大家就多少能明白一點了。這個語言模型「頂流」,最近可謂是無人不知,無人不曉。而近水樓臺先得月的微軟,已經(jīng)悄咪咪地在互聯(lián)網(wǎng)巨頭混戰(zhàn)中,先下了一城。前腳剛表示ChatGPT即將整合進自家搜索引擎必應,后腳就放出ChatGPT計劃加入Office「辦公全家桶」這個重磅炸彈。AIGC革命,又到了拼算力的環(huán)節(jié)
2022年,是AIGC的革命元年。
DALL·E 2的誕生讓「文生圖」火了整整一年,緊跟其后的Stable Diffussion、Midjourney更是啟發(fā)了無數(shù)人的藝術靈感,甚至讓不少畫手感到了「失業(yè)危機」。到了年末,ChatGPT更是在全民中掀起AIGC的風暴。雖然是壓軸出場,但「強化學習」(RLHF)賦予它的魔力,成功地掀起了一場全民的狂歡。剛剛我們提到的這些應用,雖然看起來花里胡哨,但在背后提供支撐的依然是大家熟知的大模型們。
眾所周知,對于大模型來說,不管是前期的訓練還是后期的推理,都離不開巨量的「算力」。舉個例子,「當紅炸子雞」ChatGPT和DALL·E 2基于的GPT-3,以及國產(chǎn)自研的源1.0、悟道和文心等等,不僅在參數(shù)量上達到了千億級別,而且數(shù)據(jù)集規(guī)模也高達TB級別。想要搞定這些「龐然大物」的訓練,就至少需要投入超過1000PetaFlop/s-day(PD)的計算資源。
也難怪OpenAI在大煉GPT-3之前,會讓微軟花10億美元給自己獨家定制了一臺當時全世界排名前五的超級計算機。但是問題在于,并不是每個需要到大量AI算力的企業(yè)或高校,都能財大氣粗地斥巨資搞一個自己的「人工智能高性能計算中心」。那么,如果我們換一個思路,讓算力變得更加「普適普惠」,是不是也能實現(xiàn)相同或更好的效果呢?于是,在2020年12月的時候,國家信息中心和浪潮信息聯(lián)合發(fā)布了《智能計算中心規(guī)劃建設指南》。其中,便提到了一個全新的概念——智能計算中心(簡稱,智算中心)。
智算中心是什么?
為了能更好地解決人工智能領域的問題,智算中心的發(fā)展就需要基于最新的AI論和先進的AI計算架構,并以AI芯片、AI服務器、AI集群為算力的載體。首先,當前主流的AI加速計算,主要是采用CPU系統(tǒng)搭載GPU、FPGA、ASIC等異構AI加速芯片。由于GPU芯片中原本為圖形計算設計的大量算術邏輯單元(ALU),可為以張量計算為主的深度學習計算提供很好的加速效果,因此廣受學術界和工業(yè)界的歡迎。
隨著越來越深入的應用,GPU芯片本身也根據(jù)AI的計算特點,進行了針對性的創(chuàng)新設計,如張量計算單元、TF32/BF16數(shù)值精度、Transformer引擎(Transformer Engine)等。而更加「專一」的AI計算加速芯片,主要脫胎于GPU芯片。


所以,為何還要興建智算中心?
智算中心是數(shù)字經(jīng)濟時代促進產(chǎn)業(yè)轉型升級、優(yōu)化產(chǎn)業(yè)結構、提升城市競爭力的關鍵基礎設施,并為快速增長的人工智能算力需求提供了必不可少的支撐。具體來說可以分為四個方面:推進AI產(chǎn)業(yè)化、賦能產(chǎn)業(yè)AI化、助力治理智能化、促進產(chǎn)業(yè)集群化。- AI產(chǎn)業(yè)化
在訓練算力消耗上,自動駕駛感所采用的知模型要遠大于一般的計算機視覺感知模型。比如,特斯拉的L2級FSD自動駕駛融合感知模型,訓練過程使用了百萬量級的道路采集視頻,算力投入約為500PD。而且,隨著自動駕駛級別從L2提升到L4,對算力的需求將進一步提高。對此,智算中心提供的普惠算力,可以極大降低自動駕駛所需算力的成本。- 產(chǎn)業(yè)AI化
截至目前,AlphaFold 2已經(jīng)可以預測出2億多個蛋白質結構,幾乎覆蓋了整個「蛋白質宇宙」。通過AlphaFold 2,單個蛋白結構的預測時間縮短到了分鐘級,準確率也達到了92.4%。AlphaFold 2的開發(fā),就是以巨量算力為支撐的。僅在訓練數(shù)據(jù)準備階段,AlphaFold 2就消耗了約2億核時的CPU算力,訓練過程中更是消耗了約300PD的AI算力。而非常契合AI for Science算力需求的智算中心,將成為支撐高校和科研院所高質量科研的重要基礎設施。- 治理智能化
- 產(chǎn)業(yè)集群化


然而,問題也隨之而來
不可忽視的是,在如火如荼的建設過程中,這些智算中心也暴露出了很多問題和挑戰(zhàn)。
首先,我國對智能算力的需求與日俱增。《2022-2023中國人工智能計算力發(fā)展評估報告》數(shù)據(jù)顯示,2021年我國智能算力規(guī)模達155.2 EFLOPS(FP16),預計到2026年,我國的智能算力規(guī)模將達到1,271.4 EFLOPS。在未來80%的場景都將基于AI,它們所占據(jù)的大部分算力資源,都是由智算中心承載。
最后,現(xiàn)階段存在的概念認知尚不清晰、建設標準尚不統(tǒng)一、應用場景尚不豐富、運營模式尚不成熟等問題,也直接影響著智算中心的發(fā)展。怎么解決?
對此,《指南》給出的解決思路是:1. 普適普惠;2. 開放兼容。
先來說什么叫「普適普惠」。普適普惠是指,發(fā)揮公共基礎設施的社會價值,既要滿足用戶對通用算力的需求,又要滿足不同用戶不同場景對多元化算力的需求。具體來說,智算中心要朝著標準化、低成本、低門檻方向發(fā)展,使智能計算可以像水電一樣,成為社會基本公共服務,滿足不同用戶不同場景對算力多元化的需求。其次,就是要「開放兼容」。具體來說,就是要開源開放、培育生態(tài)。以開放硬件和開源軟件為主,融合多元算力,實現(xiàn)算力的聚合、調度、釋放,讓智算中心「用起來、用的好」。同時,要加強對智算中心關鍵軟硬件產(chǎn)品的研發(fā)支持和大規(guī)模應用推廣。
展望未來
現(xiàn)在,以AIGC、元宇宙、智慧科研 (AI for Science)為代表的新興場景,正在走進我們的日常生活,給我們的未來帶來無限的可能。
與之相應的,智算中心建設布局浪潮正在全國快速掀起。智能算力的普適普惠,對于大多數(shù)企業(yè)來說,尤其是中小企業(yè),創(chuàng)新的門檻大大地降低了。相信在不久的將來,我們會很快見證「以數(shù)據(jù)輸入,讓智能輸出」,智能計算會如水電一般,真正惠及每一個人。 來源:新智元*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。

