事實證明，人工智能實際上能制造出稱職的掃雷克隆——四個AI編碼代理的測試顯示OpenAI的Codex是最好的，而谷歌的Gemini CLI是最差的

作者：時間：2025-12-23 來源：

當世界因企業追逐幾乎無盡資源的人工智能而燃燒時，我們應該看看這場騷動給我們帶來了什么。最近，Ars Technica的團隊對四款最受歡迎的AI編碼代理進行了測試，提出了一個看似簡單的請求：為網絡打造Minesweeper。克隆版必須加入音效、移動觸摸屏支持，以及“有趣”的玩法變化。

對于不了解的人來說，《掃雷者》依賴邏輯，邏輯決定了游戲玩法，同時結合了合理的用戶界面和用戶體驗元素，構成了一個不錯的挑戰。制作一個掃雷艦克隆并不難，但其底層機制至少需要一定程度的人類智慧——畢竟，目標是通用人工智能，不是嗎？

測試內容包括（付費版本）Anthropic的Claude Code、谷歌的Gemini CLI、Mistral Vibe以及基于GPT-5的OpenAI代碼。所有這些任務都被賦予了相同的指令，AI在第一次運行中生成的分數將被用來統計。除了開始之外，沒有人工干預或第二次機會。

表現最好的是Codex，不僅畫面表現不錯，還是唯一真正包含“和弦”技術的AI——如果你把旗幟擺放得當，就能顯示周圍所有地塊。和弦是資深玩家的最愛，因此如果沒有和弦，任何《掃雷者》的克隆版都會顯得不夠精致。

Codex版本的所有按鈕都正常工作，包括聲音切換，提供時代準確的嗶嗶聲和嗶嗶聲，以及面向移動端和桌面端的屏幕說明。至于玩法變化，角落里有一個“幸運掃蕩”按鈕，當你獲得該格子時，偶爾會顯示一個安全格子。

Codex的編碼體驗也很流暢，命令行界面有漂亮的動畫和本地權限管理，盡管代理寫代碼時確實花了不少時間。Ars Technica稱這款作品最接近在最小人為干預下即可發布的項目，給出了令人印象深刻的9分（滿分10分）。

克勞德代碼 - 7/10

亞軍是Anthropic的Claude，其代碼開發時間只有Codex的一半，且呈現出更具美感的產品。事實上，它是所有版本中最精致的，擁有定制的炸彈圖形，頂部還附有無設備限制的微笑表情。音效也很悅耳，切換開關在移動端和桌面端都能正常使用。

不過，當沒有和弦支撐時，體驗就崩潰了——據樓主說，這是“不可接受的”。游戲中有一個“能力模式”，作為游戲的轉折，給你一些需要特工真正發揮創造力的簡單強化道具。在手機上，還有一個“旗幟模式”按鈕，是長按標記地塊的一個不錯替代。

在我們看來，這款克隆版手感最好，試用時也是最好的。Claude Code 的 Opus 4.5 型號在不到 5 分鐘內構建了掃雷機克隆，并擁有最簡潔的編碼界面。總體來說，表現非常扎實，得分7/10，如果有和弦功能會更高。

Mistral Vibe - 4/10

第三名是Mistral的Vibe，他們推出了同名產品，也就是說，這些產品與某種被vibe編碼的商品同義。游戲運行和畫面都還算不錯，但缺少了至關重要的和弦功能，也沒有音效。底部還有一個“自定義”按鈕，但沒用。Vibe也沒有加入任何有趣的玩法變化，所以這些都扣了不少分。

頂部的微笑表情全黑，這讓測試者感到不適，選擇“專家”模式則將網格擴展到方形背景之外，但這只是視覺故障。你可以在桌面端右鍵點擊標記，但在手機端你必須按住，這可能會尷尬地彈出設備的右鍵菜單（我們這里沒有）。

編碼界面扎實且易用，但速度不算快——不過，最后一個名次距離太遠，門檻并不高。盡管缺乏大牌那樣龐大的資源，Ars Technica的編輯們對其表現印象深刻。最后，Mistral Vibe得了4分（滿分10分），這似乎比他們描述的應得還低。

最后一位是谷歌的Gemini CLI，這對一些人來說可能令人驚訝，因為谷歌如今經常在基準測試中名列前茅，同時聯合創始人謝爾蓋·布林回歸加州巨頭領導前沿人工智能，這也帶來了普遍的回歸故事。雙子座的掃雷克隆機根本無法起作用。它有按鈕，但沒有可說的地塊，所以沒有游戲可玩，甚至沒有得分。

從視覺效果來看，它與Claude Code的最終成果驚人地相似;就像有人在編碼過程中突然阻止了特工一樣。Gemini 也耗時最長，每次代碼運行需一小時，且代理不斷請求外部依賴。即使稍微修改了規則，給它第二次機會，并給了它一個硬性使用HTML5的指令，也無法產生可用的結果。

Ars Technica指出，Gemini CLI無法使用最新的Gemini 3編碼模型，而是依賴一組Gemini 2.5系統。也許付費購買更高層級的谷歌AI會更有利，使這次測試被視為“不完整”，但仍然相當令人失望。

所以，這就是我們允許內存價格翻四倍、暫時毀掉電腦的原因。Codex獲勝，Mistral Vibe和Claude Code緊隨其后，而Google甚至沒有嘗試，但代價卻是什么。如果你還沒全力支持人工智能，可以肯定這個實驗不會讓你相信什么。

久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠