熱力學計算大幅減少了AI-圖像能耗
DALL-E、Midjourney、Stable Diffusion 等生成式 AI 工具可生成高度逼真的圖像,但其能耗極高。如今兩項最新研究發現,熱力學計算技術有望將圖像生成的能耗降至現有水平的百億分之一。
多數 AI 圖像生成工具的核心是一種名為擴散模型的機器學習算法。開發者會向模型輸入大量圖像樣本,并逐步為這些圖像添加噪聲,直至其畫面效果如同調諧失常的模擬電視機所顯示的靜電噪點;隨后訓練神經網絡逆轉這一噪聲添加過程,使擴散模型能根據輸入的提示詞生成全新的圖像。
然而,無論是為圖像添加噪聲,還是從靜電噪點中還原生成圖像,這類 AI 數字計算過程均能耗巨大。美國 Lawrence Berkeley National Laboratory 的科研人員 Stephen Whitelam 表示,如今一項融合熱力學計算的新技術,有望以遠低于當前數字硬件的能耗完成圖像生成工作。
借力自然噪聲實現低能耗計算
熱力學計算技術利用物理電路對噪聲(如環境中隨機熱漲落產生的噪聲)的響應特性,完成低能耗計算。例如,美國紐約初創企業 Normal Computing 研發的一款原型芯片,由 8 個諧振器通過專用耦合器相互連接構成;開發者可通過耦合器搭建定制化計算模塊,適配所需解決的特定問題,隨后激發諧振器,使其向諧振器 - 耦合器網絡引入噪聲并完成計算;當系統達到平衡狀態后,開發者便可從諧振器的全新組態中讀取計算結果。
Whitelam 與同事在 1 月 10 日發表于《Nature Communications》的論文中證實,研發出熱力學版本的神經網絡具備可行性,這為基于熱力學計算的圖像生成技術奠定了基礎。
Whitelam 提出的全新技術方案,會先向熱力學計算機輸入一組圖像樣本,隨后讓計算機內部組件發生自然的隨機相互作用,使存儲的圖像樣本逐漸退化,直至組件間的耦合關系自然達到平衡狀態;接下來,計算在既定耦合狀態下,熱力學計算機逆轉上述圖像退化過程的概率,并對耦合參數進行調整,將這一概率最大化。
Whitelam 在 1 月 20 日發表于《Physical Review Letters》的研究中,通過傳統計算機完成了相關仿真實驗,結果表明,經上述流程訓練后的熱力學計算機,可通過參數設定生成手寫數字圖像,且這一過程無需依賴高能耗的數字神經網絡,也無需借助偽隨機數生成器制造噪聲。
Whitelam 表示:“這項研究表明,我們有望研發出專用硬件,以遠低于當前水平的能耗完成特定類型的機器學習任務,本研究中的圖像生成便是典型案例。”
Whitelam 同時提醒,與數字神經網絡相比,當前的熱力學計算機仍處于初級發展階段。他指出:“我們目前尚未掌握研發出圖像生成能力媲美 DALL-E 的熱力學計算機的方法,要實現這一目標,還需攻克相關硬件的研發難題。”
盡管經計算,熱力學計算機在能效方面相較傳統計算機具備巨大優勢,但 Whitelam 坦言:“要研發出能充分發揮這一能效優勢的熱力學計算機,仍面臨諸多挑戰。短期內,相關設計的能效表現大概率會介于理想狀態與當前數字硬件的能耗水平之間。”







評論