一周AI大事:砍價30%!OpenAI 聯手谷歌“背刺”英偉達?
舊王還沒來得及切蛋糕,新王們就已經提著刀殺到了門口。
ChatGPT剛滿三周歲生日,卻沒能等來安穩的慶生。谷歌Gemini 3強勢反超,逼得奧特曼喊話“準備過冬”;Anthropic 不講武德,反手甩出 Claude Opus 4.5,重奪“代碼之神”的稱號。就連“賣鏟子”的英偉達也不安穩,谷歌 TPUv7的出現讓 OpenAI 都有了砍價的底氣。
從模型互搏到芯片暗戰,這一周的信息量大到需要吸氧。別急,我們幫你把這些“瓜”都切好了。
1. Gemini 3反超GPT-5,谷歌市值逼近4萬億美元
在ChatGPT發布三周年之際,這家估值5000億美元的獨角獸正面臨自創立以來最大的危機。據英國《金融時報》報道,隨著谷歌Gemini 3的強勢發布,業內普遍認為該模型在訓練工藝上實現了對OpenAI GPT-5的跨越式反超,OpenAI曾經“遙遙領先”的護城河正在被填平。Hugging Face聯合創始人直言“世界已經變了”,OpenAI CEO薩姆·奧特曼(Sam Altman)也罕見地向員工預警,要準備好迎接“艱難時刻”。相比之下,谷歌憑借全棧技術整合不僅將Gemini App月活推高至6.5億,更推動母公司市值逼近4萬億美元大關。就連Salesforce CEO馬克·貝尼奧夫(Marc Benioff)在試用Gemini 3后也驚呼“回不去了”,這場AI王座爭奪戰已正式進入白熱化的新階段。

2. 打破英偉達壟斷:谷歌TPUv7“大殺四方”,OpenAI借勢砍價30%
軟件層的激戰也離不開硬件格局的重塑,谷歌TPU正撕開英偉達的鐵幕。隨著Gemini 3和Claude 4.5 Opus兩大SOTA模型均在TPU上完成訓練,谷歌開始激進地向Anthropic等外部客戶出售其最新的TPUv7 Ironwood算力,訂單規模甚至突破1GW。半導體行業知名研究資訊公司SemiAnalysis最新發布的TPUv7與英偉達競爭分析引發業界廣泛關注。
其中爆料稱,TPU極致的性價比(TCO)已成為巨頭博弈的籌碼:OpenAI甚至尚未正式部署TPU,僅憑引入這一競爭選項,就成功在與英偉達的談判中將其算力機隊的整體成本壓低了約30%。谷歌正用行動證明,打破CUDA護城河的最佳方式,就是讓客戶真正體驗到“買TPU越多,省下的GPU資本開支就越多”。

二、本周重磅:Claude Opus 4.5重奪“代碼之神”
本周最受矚目的焦點,莫過于Anthropic發布的Claude Opus 4.5。在大模型王座被GPT-5.1和Gemini 3 Pro輪流坐莊數周后,Claude終于亮出了它的底牌,誓要奪回“全球最強AI模型”的桂冠。

· 代碼能力屠榜: 在SWE-bench Verified基準測試中,Opus 4.5拿下了80.9%的驚人成績,一舉超越GPT-5.1(77.9%)和Gemini 3 Pro(76.2%)。
· 智能體能力SOTA: 在Terminal-bench 2.0、OSWorld(計算機操作)等復雜智能體基準測試中,Opus 4.5均達到State-of-the-Art(SOTA)水平。
· 實測體驗: 知名開發者Gene Dai評價道:“Opus 4.5有一種果斷的氣質——它會先動手把事情做完,再告訴你它做了什么。它甚至能通過單次提示解決巨大Bug。”
價格與市場: 目前定價為輸入5美元/百萬token,輸出25美元/百萬token。雖然比上一代Opus便宜了三分之二,但相比Gemini 3 Pro依然昂貴。
Opus 4.5上線后,各行人士紛紛下場試用,并發表自己的切身感受。
網紅博主@peakcooper周末發布Opus 4.5完整評測,稱其為編程史上最佳發布,邏輯無誤、代碼優雅、自主調試、嚴格執行指令,長上下文表現完美;效率提升25%到35%,媲美2025 Sonnet 3.5。

沃頓商學院研究AI的教授伊桑·莫利克(Ethan Mollick)周末也發布了AI詩作挑戰的結果,稱從ChatGPT-3.5到Claude Opus 4.5,AI詩作挑戰從失敗到精妙,展示出創造力的不斷躍升。

隨著Claude的更新,全球三大頂尖AI模型在過去兩周內全部完成了迭代。如果你還在糾結用哪個寫代碼,知名博主麥凱·里格利(McKay Wrigley)此前已經開發出一套工作流,你可以借此一次性對比三巨頭的表現。

三、視覺革命:Flux.2與騰訊混元
本周視覺生成領域同樣熱鬧非凡,從圖像到視頻,從閉源到開源,開發者們有了更多選擇。
· Flux.2:Black Forest Labs推出備受期待的FLUX.2套件(包含Pro, Flex, Dev三個版本),致力于解決“角色一致性”痛點。

· 殺手級功能: 支持“多參考圖生成”。用戶最多可上傳10張參考圖,這意味著生成的AI角色可以保持高度一致的畫風或面部特征,完美適配漫畫或設計需求。
· 技術細節: 采用Mistral-3 24B視覺語言模型(VLM)作為核心,支持原生400萬像素輸出。
· 性價比: 質量對標Nano Banana Pro,但成本僅為后者的三分之一。
· 騰訊混元:騰訊發布的HunyuanVideo 1.5堪稱消費級顯卡的福音。
· 配置親民: 僅8.3B參數,配合Diffusion Transformer架構,讓普通消費級GPU也能跑得起來。
· 能力強悍: 支持生成720p(可上采樣至1080p)、時長10秒的視頻,且物理規律和動作連貫性表現優異。權重已在Hugging Face開源。
· 阿里Z-Image Turbo:阿里通義實驗室推出文生圖模型Z-Image Turbo。天下武功,唯快不破,這款6B參數的文生圖模型,主打極致速度。在H800上生成圖片僅需亞秒級,且能輕松塞進16GB顯存的顯卡中,同時保持了照片級的逼真度。
四、硬核科研與新模型
· INTELLECT-3 (106B MoE): Prime Intellect發布的新開源模型,雖然總參數大,但激活參數僅12B。它在數學和代碼上表現極其出色(AIME 2024/2025準確率約90%),是目前同尺寸下的最強模型。
· Fara-7B: 微軟新推出一款基于Qwen 2.5微調的端側智能體模型。它能在本地設備上預測鼠標和鍵盤操作(如訂票、網頁瀏覽),WebVoyager得分73.5%,主打隱私保護。
· DeepSeek Math V2: DeepSeek(深度求索)新推出的開源大模型,專供數學推理。其核心突破在于引入自我驗證機制,在多項國際數學競賽中達到金牌水平,并成為首個開源的奧數金牌級模型。
· NVIDIA Nemotron-Elastic-12B: 英偉達探索了“彈性推理”架構。通過嵌套模型提取,這一個模型可以無損變身為6B或9B的小版本,無需重新訓練,極大提升了部署靈活性。
· HunyuanOCR(1B參數): 騰訊發布HunyuanOCR(1B參數),在文檔解析和視頻字幕提取上超越Qwen3-VL-72B等大模型。
五、行業快訊:你方唱罷我登場
除了上述重磅發布,本周還有這些值得關注的動態:
——硬件:
· 阿里發布Quark AI眼鏡,搭載通義大模型,售價1899元人民幣,對標Meta Ray-Ban。
——應用:
· Character.AI上線“Stories”功能,用戶可與喜歡的AI角色共同創作互動式冒險故事。
· LTX Studio推出“Retake”功能,允許用戶精準修改視頻中的特定鏡頭或臺詞,而無需重新生成全片。
· 谷歌在美推出Agent通話功能,AI可代替用戶直接給商家打電話核實價格或庫存。
——市場:
· Anthropic發布報告預測,AI的廣泛應用將在未來十年內使美國勞動生產率增速翻倍。
· 由于需求過大,谷歌和OpenAI已被迫對Sora及Nano Banana Pro等高算力模型進行限流。
· 國家發展和改革委有關負責人提示,人形機器人投資過熱,需警惕行業泡沫。
· Suno與華納音樂集團達成合作,將利用正版授權音樂庫開發AI音樂工具。
六、番外篇:ChatGPT三周年歷史時刻
最后,我們要把目光投向三年前。
本周是ChatGPT發布三周年紀念。回望2022年11月,一個簡單的聊天框開啟了人類歷史上最波瀾壯闊的技術革命。

三年間,我們見證了它從一個只會聊天的Chatbot,進化為擁有記憶、能看圖、能寫代碼、能推理(o1/o3系列)乃至如今GPT-5.1的全能助手。正如本文所述,雖然如今AI圈早已群雄逐鹿,但ChatGPT依然是那個推倒第一塊多米諾骨牌的傳奇。
歷史的車輪滾滾向前,我們正處在最好的時代。












評論