事實證明,人工智能實際上能制造出稱職的掃雷克隆——四個AI編碼代理的測試顯示OpenAI的Codex是最好的,而谷歌的Gemini CLI是最差的

當世界因企業追逐幾乎無盡資源的人工智能而燃燒時,我們應該看看這場騷動給我們帶來了什么。最近,Ars Technica的團隊對四款最受歡迎的AI編碼代理進行了測試,提出了一個看似簡單的請求:為網絡打造Minesweeper。克隆版必須加入音效、移動觸摸屏支持,以及“有趣”的玩法變化。
對于不了解的人來說,《掃雷者》依賴邏輯,邏輯決定了游戲玩法,同時結合了合理的用戶界面和用戶體驗元素,構成了一個不錯的挑戰。制作一個掃雷艦克隆并不難,但其底層機制至少需要一定程度的人類智慧——畢竟,目標是通用人工智能,不是嗎?
測試內容包括(付費版本)Anthropic的Claude Code、谷歌的Gemini CLI、Mistral Vibe以及基于GPT-5的OpenAI代碼。所有這些任務都被賦予了相同的指令,AI在第一次運行中生成的分數將被用來統計。除了開始之外,沒有人工干預或第二次機會。


表現最好的是Codex,不僅畫面表現不錯,還是唯一真正包含“和弦”技術的AI——如果你把旗幟擺放得當,就能顯示周圍所有地塊。和弦是資深玩家的最愛,因此如果沒有和弦,任何《掃雷者》的克隆版都會顯得不夠精致。
Codex版本的所有按鈕都正常工作,包括聲音切換,提供時代準確的嗶嗶聲和嗶嗶聲,以及面向移動端和桌面端的屏幕說明。至于玩法變化,角落里有一個“幸運掃蕩”按鈕,當你獲得該格子時,偶爾會顯示一個安全格子。
Codex的編碼體驗也很流暢,命令行界面有漂亮的動畫和本地權限管理,盡管代理寫代碼時確實花了不少時間。Ars Technica稱這款作品最接近在最小人為干預下即可發布的項目,給出了令人印象深刻的9分(滿分10分)。
克勞德代碼 - 7/10


亞軍是Anthropic的Claude,其代碼開發時間只有Codex的一半,且呈現出更具美感的產品。事實上,它是所有版本中最精致的,擁有定制的炸彈圖形,頂部還附有無設備限制的微笑表情。音效也很悅耳,切換開關在移動端和桌面端都能正常使用。
不過,當沒有和弦支撐時,體驗就崩潰了——據樓主說,這是“不可接受的”。游戲中有一個“能力模式”,作為游戲的轉折,給你一些需要特工真正發揮創造力的簡單強化道具。在手機上,還有一個“旗幟模式”按鈕,是長按標記地塊的一個不錯替代。
在我們看來,這款克隆版手感最好,試用時也是最好的。Claude Code 的 Opus 4.5 型號在不到 5 分鐘內構建了掃雷機克隆,并擁有最簡潔的編碼界面。總體來說,表現非常扎實,得分7/10,如果有和弦功能會更高。
Mistral Vibe - 4/10


第三名是Mistral的Vibe,他們推出了同名產品,也就是說,這些產品與某種被vibe編碼的商品同義。游戲運行和畫面都還算不錯,但缺少了至關重要的和弦功能,也沒有音效。底部還有一個“自定義”按鈕,但沒用。Vibe也沒有加入任何有趣的玩法變化,所以這些都扣了不少分。
頂部的微笑表情全黑,這讓測試者感到不適,選擇“專家”模式則將網格擴展到方形背景之外,但這只是視覺故障。你可以在桌面端右鍵點擊標記,但在手機端你必須按住,這可能會尷尬地彈出設備的右鍵菜單(我們這里沒有)。
編碼界面扎實且易用,但速度不算快——不過,最后一個名次距離太遠,門檻并不高。盡管缺乏大牌那樣龐大的資源,Ars Technica的編輯們對其表現印象深刻。最后,Mistral Vibe得了4分(滿分10分),這似乎比他們描述的應得還低。


最后一位是谷歌的Gemini CLI,這對一些人來說可能令人驚訝,因為谷歌如今經常在基準測試中名列前茅,同時聯合創始人謝爾蓋·布林回歸加州巨頭領導前沿人工智能,這也帶來了普遍的回歸故事。雙子座的掃雷克隆機根本無法起作用。它有按鈕,但沒有可說的地塊,所以沒有游戲可玩,甚至沒有得分。
從視覺效果來看,它與Claude Code的最終成果驚人地相似;就像有人在編碼過程中突然阻止了特工一樣。Gemini 也耗時最長,每次代碼運行需一小時,且代理不斷請求外部依賴。即使稍微修改了規則,給它第二次機會,并給了它一個硬性使用HTML5的指令,也無法產生可用的結果。
Ars Technica指出,Gemini CLI無法使用最新的Gemini 3編碼模型,而是依賴一組Gemini 2.5系統。也許付費購買更高層級的谷歌AI會更有利,使這次測試被視為“不完整”,但仍然相當令人失望。
所以,這就是我們允許內存價格翻四倍、暫時毀掉電腦的原因。Codex獲勝,Mistral Vibe和Claude Code緊隨其后,而Google甚至沒有嘗試,但代價卻是什么。如果你還沒全力支持人工智能,可以肯定這個實驗不會讓你相信什么。











評論