這個AI能在石頭剪刀布上打敗你
石頭剪刀布往往是一場心理博弈,考驗著玩家的心理預判、反向預判、二次反向預判能力,同時也帶有一定的運氣成分。但如果一臺計算機能充分讀懂玩家,做到每局必勝呢?日本北海道大學與以磁帶技術聞名的 TDK Corp. 組成的聯合團隊,就設計出了這樣一款芯片。

TDK公司的模擬蓄積計算芯片能夠快速高效地預測時間序列的下一步。
需要說明的是,這款芯片并不能讀取人類的思維。它通過安裝在玩家拇指上的加速度傳感器來捕捉手部動作,進而學習并區分出代表石頭、剪刀、布的不同動作模式。令人驚嘆的是,一旦完成針對特定玩家手勢的訓練,該芯片就能在玩家喊出 “出招” 的瞬間完成運算,預測出對方的出手動作,從而實現實時擊敗對手。
支撐這項技術突破的核心方法是儲備池計算,這是一種借助復雜動態系統從時間序列數據中提取有效特征的機器學習算法。儲備池計算的概念最早可追溯至 20 世紀 90 年代。隨著人工智能技術的興起,憑借低功耗、快速訓練與推理的技術優勢,儲備池計算重新受到業界的廣泛關注。
參與該設備研發的 TDK 部門負責人兼高級經理 Tomoyuki Sasaki 表示:“研究團隊將降低功耗作為核心目標之一,第二個目標則是解決時延問題。對于邊緣人工智能而言,時延是一個亟待攻克的難題。”
為最大程度降低系統能耗與時延,該團隊研發出一套基于互補金屬氧化物半導體(CMOS)工藝的模擬儲備池計算電路硬件方案。團隊已于 10 月在日本千葉縣舉辦的先進技術綜合展上展示了相關技術原型,并將于本周在圣地亞哥舉辦的重啟計算國際會議上正式發表相關論文。
什么是儲備池計算?
要理解儲備池計算,最佳方式是將其與支撐當前多數人工智能技術的傳統神經網絡架構進行對比。
傳統神經網絡由人工神經元構成,這些神經元按層排列。每一層都可看作一列神經元,列中的每個神經元都會通過帶權重的人工突觸與下一列的所有神經元相連。數據從第一列輸入,逐層向右傳播,直至抵達最后一列。
在訓練階段,最后一層的輸出結果會與標準答案進行比對,系統會利用比對產生的誤差信息,通過反向傳播過程逐層逆向調整所有突觸的權重。
這種架構有兩個顯著特征:第一,數據僅沿單一方向 —— 正向傳播,不存在循環回路;第二,訓練過程中,任意兩個神經元之間的連接權重都會被調整。事實證明,該架構具備出色的有效性與靈活性,但同時也存在較高的成本消耗 —— 調整動輒數十億的權重參數,需要耗費大量的時間與算力。
儲備池計算同樣由人工神經元和突觸構成,但二者的排列方式存在本質區別。首先,儲備池計算沒有 “層” 的概念,神經元以復雜的網狀結構相互連接,且包含大量循環回路。這種結構賦予了網絡一定的記憶能力,特定的輸入信號可以在回路中持續傳遞。
其次,儲備池內部的神經元連接權重是固定不變的。數據輸入儲備池后,會在其復雜結構中完成傳播,隨后通過一組最終突觸連接至輸出層。整個訓練過程中,只有這最后一組突觸的權重會被調整。這種設計極大簡化了訓練流程,并且完全無需反向傳播機制參與。
既然儲備池的結構固定,訓練過程僅針對儲備池到目標輸出的最后一層 “轉換層”,這類網絡卻依然能實現高效運算,這似乎有些不可思議。但實際上,在特定任務處理場景中,儲備池計算的表現極為亮眼。
未參與該研究的加州大學圣塔芭芭拉分校計算機科學助理教授 Sanjukta Krishnagopal 表示:“儲備池計算絕非機器學習工具庫中適用于所有場景的最優模型。但在預測天氣這類具有混沌特性的事物隨時間演變的規律時,它就是最適合的工具。這正是儲備池計算的優勢所在。”
她進一步解釋道,原因在于儲備池本身就帶有一定的混沌屬性。“儲備池的運行狀態通常處于所謂的‘混沌邊緣’,這意味著它僅需一個規模極小的神經網絡,就能輕松表征出海量的可能狀態。”
物理儲備池計算機
由于儲備池內部的人工突觸權重固定,且無需進行反向傳播,這為儲備池的硬件實現方式提供了極大的靈活性。在構建物理儲備池時,研究人員采用過多種介質,包括光、微機電系統(MEMS),而我個人最青睞的是一個頗為有趣的方案 —— 直接用水桶組成的裝置。
不過,北海道大學與 TDK 的聯合團隊希望研發出一款兼容 CMOS 工藝、可應用于邊緣設備的芯片。為實現人工神經元的硬件化,團隊設計了一種模擬電路節點。每個節點由三個部分組成:非線性電阻、基于金屬氧化物半導體(MOS)電容的存儲元件,以及緩沖放大器。該團隊研發的芯片包含四個計算核心,每個核心由 121 個此類節點構成。
要讓這些節點以儲備池所需的復雜循環模式相互連接,是一項極具挑戰性的工作。為降低系統復雜度,團隊采用了一種名為 “簡單循環儲備池” 的設計方案,即所有節點串聯成一個大的環形回路。已有研究表明,即便這種相對簡單的結構,也能對多種復雜的動態系統進行精準建模。
基于該設計方案研發的芯片,每個計算核心的功耗僅為 20 微瓦,整機總功耗為 80 微瓦。研究團隊稱,這一功耗水平顯著低于其他基于 CMOS 工藝的物理儲備池計算芯片。
預測未來趨勢
除了在石頭剪刀布游戲中擊敗人類,這款儲備池計算芯片還能在多個領域實現時間序列的下一步預測。Tomoyuki Sasaki 表示:“只要事物的當前狀態會受到歷史數據的影響,這款芯片就能對其發展趨勢做出預測。”
團隊通過多項任務驗證了芯片的性能,其中包括預測經典混沌系統邏輯斯蒂映射的變化規律。同時,他們還將這款芯片應用于現實世界中典型的混沌現象預測場景 —— 天氣預報。測試結果顯示,芯片在兩項任務中的預測精準度均達到了令人驚嘆的水平。
不過,預測精度并非這款芯片的核心賣點。其真正的優勢在于極低的功耗與時延,這為新應用場景的拓展創造了可能,例如在可穿戴設備及其他邊緣設備上實現實時學習功能。
Tomoyuki Sasaki 指出:“我認為,這款芯片的預測精度與現有技術基本持平。但在功耗與運算速度方面,它的表現大約是現有人工智能技術的 10 倍。這就是二者之間的巨大差距。”









評論