久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

博客專欄

EEPW首頁 > 博客 > OpenAI發(fā)布多模態(tài)模型GPT-4:已經(jīng)能在SAT考試中擊敗90%人類!

OpenAI發(fā)布多模態(tài)模型GPT-4:已經(jīng)能在SAT考試中擊敗90%人類!

發(fā)布人:芯智訊 時間:2023-03-19 來源:工程師 發(fā)布文章

北京時間3月15日凌晨,ChatGPT開發(fā)商OpenAI 發(fā)布了發(fā)布了全新的多模態(tài)預訓練大模型 GPT-4,可以更可靠、更具創(chuàng)造力、能處理更細節(jié)的指令,根據(jù)圖片和文字提示都能生成相應內(nèi)容。

具體來說來說,GPT-4 相比上一代的模型,實現(xiàn)了飛躍式提升:支持圖像和文本輸入,擁有強大的識圖能力;大幅提升了文字輸入限制,在ChatGPT模式下,GPT-4可以處理超過2.5萬字的文本,可以處理一些更加細節(jié)的指令;回答準確性也得到了顯著提高。

圖片

OpenAI表示,它使用的是微軟(MSFT.US)Azure訓練模型,微軟此前已經(jīng)向其投資了數(shù)十億美元。OpenAI沒有公布具體模型大小的細節(jié),也沒有公布用來訓練模型的硬件,理由是“競爭情況”。

根據(jù)此前資料顯示,發(fā)布于 2020 年的 GPT-3 有 1750 億個參數(shù),而GPT-4 的參數(shù)據(jù)猜測可能將達到約 100 萬億個參數(shù)。這也使得GPT-4 在能力、范圍和潛力方面相比GPT-3,將擁有一個質(zhì)的飛躍。

OpenAI 指出,相較前一代的GPT-3.5, GPT-4在許多專業(yè)測試中表現(xiàn)出超過絕大多數(shù)人類的水平。在包括美國律師資格考試Uniform Bar Exam、法學院入學考試LSAT、“美國高考”SAT數(shù)學部分和證據(jù)性閱讀與寫作部分的考試,在這些測試中,它的得分均高于88%的應試者。在美國法學院畢業(yè)生參加的律師資格考試中,舊模型得分在應試者中排名后10%,而新模型得分在應試者中排名約前10%,即擊敗了約90%的人類。

圖片

OpenAI 總裁Greg Brockman 稱,GPT-4 可拍攝一張簡單網(wǎng)站的手繪模型照片,并以此為基礎創(chuàng)建真正的網(wǎng)站。根據(jù)實際演示,GPT-4 還能計算稅收。

OpenAI表示,雖然兩個版本在日常對話中看起來很相似,但當任務復雜到一定程度時,差異就表現(xiàn)出來了,GPT-4模型將更可靠、更有創(chuàng)造力,能夠處理更微妙的指令。不僅能夠產(chǎn)生更少的錯誤答案,更少地偏離話題,更少地談論禁忌話題,甚至在許多標準化測試中比人類表現(xiàn)得更好。“在我們的內(nèi)部評估中,它產(chǎn)生正確回應的可能性比GPT-3.5高40%。”

不過,OpenAI也警告稱,GPT-4還不完美,在許多情況下,它的能力不如人類。它仍然存在“幻覺”或自己編造的主要問題,而且在事實問題上并不可靠。它仍然傾向于在錯誤的時候堅持自己是正確的。

OpenAI CEO Sam Altman 在Twitter 上表示GPT-4 是最有能力和符合人類價值觀和意圖的模型,盡管它仍具有缺陷。GPT-4 回應無法生成內(nèi)容請求的可能性比前一代低82%,在部分真實性測試中得分高40%。

據(jù)微軟表示,他們與 OpenAI 共同開發(fā)的 Bing Chat 目前正在基于 GPT-4運行。

在GPT-4 發(fā)布后,OpenAI 也直接升級了 ChatGPT。文字輸入功能將供給ChatGPT Plus 訂閱者(可以在 chat.openai.com 上獲得),但圖像輸入功能仍是預覽版本。如果要訪問 GPT-4 API(它使用與 gpt-3.5-turbo 相同的 ChatCompletions API),用戶可以注冊等待。OpenAI 會邀請部分開發(fā)者體驗。

至于價格方面,定價為每 1k 個 prompt token 0.03 美元,每 1k 個 completion token 0.06 美元。默認速率限制為每分鐘 40k 個 token 和每分鐘 200 個請求。GPT-4 的上下文長度為 8,192 個 token。OpenAI 還提供了 32,768 個 token 上下文(約 50 頁文本)版本的有限訪問,該版本也將隨著時間自動更新(當前版本 gpt-4-32k-0314,也支持到 6 月 14 日)。定價為每 1K prompt token 0.06 美元和每 1k completion token 0.12 美元。

值得一提的是,谷歌于當?shù)貢r間周二宣布推出協(xié)作軟件“魔杖”(magic wand),幾乎可以起草任何文件。


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。



關鍵詞: AI

相關推薦

技術專區(qū)

關閉