久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > EDA/PCB > 設計應用 > 以芯片設計提升計算效率:每次查詢的最低能耗

以芯片設計提升計算效率:每次查詢的最低能耗

作者: 時間:2026-02-13 來源: 收藏

人工智能芯片消耗的能源中,有多少真正用在了有效計算上?這一問題影響著從軟件、系統架構到的各個層面。

核心要點

  1. 加快芯片散熱只是治標之策,無法解決其背后的深層問題。

  2. 行業長期面臨的挑戰,是如何降低人工智能芯片的每查詢能耗。

  3. 數據移動、設計裕量預留、軟件效率低下,將成為未來能耗優化的核心突破點。

熱量問題正嚴重困擾人工智能芯片,制約著芯片的算力發揮。解決這一問題的思路有兩種:要么加快散熱速度,要么減少熱量產生。兩種方法實施起來均非易事,但長期解決方案的核心必然是后者。

芯片內部的每一次運算都會消耗能源、產生熱量,而這些熱量必須被及時排出。芯片的運算能力,受制于其散熱能力和散熱速度。目前行業已推出諸多降低能耗的技術方案,雖有成效,但成本高昂,且部分方案本身還會產生額外的能源消耗。

但這只是問題的冰山一角。能源的總供給量并非完全彈性,能源產能的增長速度,早已跟不上人工智能芯片與日俱增的能耗需求。這也引出了一個關鍵問題:芯片的所有運算都是有效運算嗎?這些運算是否以完成? 人類大腦的功耗僅約 20 瓦,這足以說明芯片能耗仍有巨大的優化空間,只是所有技術升級都必須兼顧經濟可行性。

人們常說,順著資金流向就能看清問題本質,這一點在芯片功耗問題上尤為適用 —— 如今,功耗早已不再只是技術上的不便,更是影響企業成本的核心因素。新思科技產品營銷總監馬克?斯溫寧表示:“盡管功耗的重要性日益凸顯,但在領域,它始終處于次要地位??晒闹苯雨P系到企業的最終利潤,而且芯片的冷卻成本高得驚人:運行電路時,你要為消耗的電力付費;為芯片散熱時,又要為制冷設備的電力消耗再次付費。如今,功耗已成為系統成本的重要組成部分。”

這也是迄今為止,行業更傾向于通過小幅提升散熱能力來解決問題的原因。弗勞恩霍夫應用集成信息學研究所自適應系統工程部門設計方法學主管羅蘭?揚克表示:“功耗固然重要,了解算法的能耗水平也很有必要,但它并非的首要考量標準。在系統層面,功耗的權重會更高,可設計師往往無法掌握算法或元器件的完整功耗信息。能耗優化的可能性有很多,其中大部分甚至從未被納入研究范圍,開展架構層面的研究更是難上加難?!?/p>

目前,各大系統廠商已著手解決這一問題,但出于競爭考量,相關研發工作均處于保密狀態。是德科技電子設計自動化部門產品管理與解決方案工程總監蘇海爾?賽義夫表示:“這類研發工作尚處于前沿階段,率先布局的廠商認為自己掌握了技術優勢。所有研發都在企業內部秘密進行,各家設計公司都不清楚競爭對手的進展。他們將這份技術優勢視為‘護城河’,現階段不愿對外公開。只有當行業發展成熟,所有人的技術方案趨于同質化、研發投入無法獲得回報時,他們才會認為繼續保密已無意義,轉而將相關工作交由電子設計自動化企業承接。屆時,全行業都能從中受益,企業也能省去不少研發精力和麻煩。但目前來看,行業還未發展到這一階段。”

通信環節的能耗考量

過去幾十年,半導體行業一直通過集成化實現技術升級:將越來越多的功能集成到單一單片裸片中,而這也基本決定了標準應用場景下的計算問題規模。但人工智能的出現打破了這一格局,由大量處理器組成的計算陣列,開始跨機架、甚至跨數據中心部署,成為行業主流。

斯溫寧表示:“芯片間的通信環節消耗了大量電力。異構拆解的一大弊端,就是系統各模塊間的通信成本會大幅增加。而單片芯片的一大優勢,就是能實現低功耗、高帶寬的內部通信。數據中心本身就是異構拆解的一種形式,多個處理器分布在不同機架中,彼此相距數米,其通信功耗已引起行業關注。目前行業正通過光通信降低這部分功耗,數據中心的背板通信正逐步向光通信轉型?!?/p>

行業正對通信環節的各個維度展開研究??请娮釉菏堪瓦_里納特?科曼杜爾表示:“看看行業近期在高性能通信協議上的研發投入就會發現,皮焦 / 比特這類能耗指標已成為研發核心。未來,行業還希望將能耗降至飛焦 / 比特級別。在人工智能驅動的應用場景中,這一目標更是成為了研發的重中之重?!?/p>

計算架構的性能需求正變得越來越高,傳統通信技術已難以跟上其發展步伐。點二科技產品營銷與業務發展副總裁戴維?郭表示:“長期以來,銅纜都是通信傳輸的核心載體,但從速率擴展的角度來看,我們如今正面臨集膚效應的困擾,這一效應會影響電子在傳輸介質中的流動效率。銅纜的性能存在上限,已無法滿足未來數據中心的工作負載需求。而光通信雖能解決速率問題,卻面臨成本、功耗和可靠性的挑戰。數據中心行業有一句老話:能用銅纜,就不用光通信;非用不可時,才考慮光通信。”

行業對從銅纜向光通信的轉型始終持謹慎態度。斯溫寧表示:“光通信的技術復雜度呈階躍式提升,不僅涉及全新的物理原理,還要求工程師掌握一套截然不同的工具使用技巧,光電器件與半導體的集成也存在諸多難題。盡管相關技術已取得長足進步,且光通信的每比特傳輸能耗遠低于銅纜,常被行業津津樂道,但這一低能耗數值的背后,是光通信的高帶寬特性,而非其本身的低功耗優勢?!?/p>

點二科技正探索一種折中的解決方案。戴維?郭介紹道:“我們研發了 eTube 技術,該技術通過射頻信號在塑料波導中傳輸數據。我們用塑料材料替代傳統銅纜作為傳輸介質,并自主設計波導結構,再通過射頻發射器和接收器,實現信號在波導中的傳輸,所使用的天線與貼片天線十分相似?!?/p>

片上通信的能耗同樣不容忽視。阿爾泰里斯戰略營銷副總裁紀堯姆?布瓦耶表示:“對于現代多核、多裸片的片上系統而言,移動數據(權重、激活值、元數據)所消耗的能源,遠高于處理這些數據的計算環節。這一現狀讓片上網絡從單純的集成架構,轉變為功耗優化的核心抓手。如果設計團隊能根據工作負載的流量模式設計片上網絡,就能大幅減少數據移動、實現通信本地化、緩解網絡擁塞,進而降低芯片的動態功耗。在功耗日益成為制約因素的當下,控制數據的流向和傳輸效率,已與優化計算環節同等重要。”

設計環節的能耗優化

盡管許多人工智能工作負載具備一定的通用性,但推理場景的設計往往可以針對性優化,直接滿足實際需求。??怂古宓吕紫茖W家沙拉德?喬萊表示:“我們必須設計出能充分利用網絡架構本身特性的硬件架構。邊緣設備的性能基本受限于帶寬:訓練場景可采用多高帶寬存儲器,而邊緣設備往往只有一顆低功耗雙倍數據率存儲器,部分低成本邊緣設備甚至連 64 通道的存儲器都沒有,僅配備通道數更少的版本。這意味著,帶寬管理已成為邊緣推理場景算力調度的核心環節?!?/p>

如今,芯片的大部分功耗浪費并非來自算術運算本身,而是源于運算周邊的各類環節。布瓦耶表示:“不必要的數據移動、匹配度低下的存儲層級、無用的推測執行、毛刺功耗,以及為應對極少出現的最壞情況而預留的設計裕量,這些都是功耗浪費的典型例子。因此,真正有效的能耗優化,必須從提升電子生產力入手 —— 即在整個技術棧中,實現每焦耳能耗的有效運算量最大化,這涵蓋了從系統調度、工作負載規劃,到架構和微架構效率優化的各個層面。在功耗日益受限的時代,控制數據流向和傳輸效率,與優化計算環節同等重要。”

實現環節的能耗損耗

盡管芯片架構層面存在巨大的能耗優化空間,但在實際實現環節,仍存在大量難以避免的功耗浪費。普羅蒂安泰克解決方案工程副總裁諾姆?布魯薩爾表示:“固定電壓裕量的初衷是保障芯片工作的安全性,但久而久之,它已成為每顆芯片都必須承擔的‘能耗稅’。電壓裕量的設計假設所有最壞情況會同時發生,但實際情況是,這種極端場景幾乎從未出現。可芯片卻因此被迫始終在偏高的電壓下運行,結果顯而易見 —— 芯片消耗了大量不必要的能源。這些未被利用的設計裕量,最終造成了數以十億瓦計的能源浪費,且隨著工藝節點的迭代,這一隱性成本還在不斷增加?!?/p>

設計裕量的預留,也源于行業對工藝的不確定性。戴維?郭表示:“工藝設計套件由代工廠的工藝決定,但它能精準描述晶體管級的性能嗎?我們發現答案是否定的,流片后往往會出現諸多意外。模擬和射頻設計的難度之所以極高,就是因為設計師一直在突破代工廠工藝的定義邊界?!?/p>

人工智能芯片的設計,無疑在不斷挑戰工藝的極限??坡艩柋硎荆骸皩τ诟冗M的工藝設計套件,頭部代工廠會根據流片經驗,針對高量產的設計需求進行優化。如果設計師首次采用 0.5 版本的工藝設計套件進行設計,那么最終量產時所使用的工藝設計套件,很可能會有很大差異。對于這些先進工藝節點,設計師必須適應工藝設計套件的持續迭代。而對于成熟工藝節點,流片結果與工藝設計套件的契合度極高,設計師可根據預期的流片結果進行設計優化,當然,代工廠在制定工藝設計套件時,也會加入一定的保守考量?!?/p>

部分技術方案可應對這種工藝的不確定性。布魯薩爾表示:“動態電壓頻率調節、自適應電壓調節這類傳統方案,無法從根本上解決問題。它們依賴有限的監測數據和間接估算,因此仍需預留較大的設計裕量。這些方案雖能較好地反映特定工作負載帶來的芯片壓力,但屬于間接指標。如果無法直接掌握芯片實際路徑的延遲數據,就無法在保證安全的前提下縮減設計裕量,畢竟,無法監測的指標就無從優化?!?/p>

布魯薩爾認為,要徹底摒棄設計裕量,必須依靠實時硅片反饋系統。他解釋道:“我們通過在芯片中集成多款小體積知識產權核,實現了這一目標。這些知識產權核能在芯片的工作模式下,持續監測數百萬條實際邏輯路徑的時序失效裕量。時序裕量本身就是芯片性能健康度的終極指標,對其進行直接監測,能讓系統不受具體性能衰減因素的影響 —— 無論衰減是由工作負載、溫度、芯片老化還是電壓跌落引起。我們能針對每個功耗狀態、每個功耗狀態下運行的各類功能負載,甚至每個負載的運行全程,進行實時監測?!?/p>

毛刺功耗是另一類無實際效用的功耗浪費。斯溫寧表示:“這一問題長期被行業忽視,卻占據了芯片總功耗的不小比例。毛刺功耗的分析難度極大,因為它與信號的精準時序密切相關,直到最近,行業才推出能對其進行分析和優化的工具。”

人工智能在制造部分能耗問題的同時,也為解決這些問題提供了新的思路。芯智體首席執行官威廉?王表示:“利用人工智能優化芯片的功耗、性能、面積指標,是一項極具挑戰性的工作。這不僅需要平衡功耗與面積的取舍,還要避免出現‘獎勵黑客’問題,但這項技術的應用前景也十分廣闊。在功耗敏感型設計中,人類工程師只能同時考量有限的幾個因素,而人工智能能在更廣闊的設計語境中進行推理,在技術棧的早期階段就提出設計建議,為芯片帶來實實在在的效率提升。”

軟件環節的能耗短板

即便設計師在硬件層面竭盡所能優化功耗,若軟件層面向硬件下達了大量無效運算指令,所有硬件優化都會付諸東流。賽義夫表示:“半導體行業肩負著控制功耗、設定功耗上限、達成功耗目標的責任,但軟件行業也必須重視這一問題。在系統設計中,軟件是‘指揮者’,而硬件只是執行軟件指令的‘引擎’。目前,軟件行業對功耗這一痛點的重視程度,還遠遠不夠。”

軟硬件協同設計已是大勢所趨。蘭布斯院士、杰出發明家史蒂文?吳表示:“提升功耗效率是一項復雜的系統工程,需要軟硬件協同發力。要實現應用性能和功耗效率的最大化,硬件必須提供合適的加速功能,而軟件也必須被設計為能充分利用這些功能。這意味著,行業需要重新設計算法、重構軟件,還需要應用開發者更深入地了解系統硬件的架構特性,比如緩存大小、動態隨機存取存儲器和存儲層級等。數據移動仍是功耗消耗的主要環節,應用開發者需要權衡:存儲和讀取中間結果,與直接重新計算這些結果,哪種方式更節省功耗。”

多年來,芯片廠商一直呼吁提升軟件的開發效率。弗勞恩霍夫應用集成信息學研究所自適應系統工程部門高效電子學主管安迪?海尼希表示:“20 年前,大部分軟件都是通過底層編程語言編寫的,雖耗時費力,但軟件的功耗效率極高。而隨著編程抽象層級的不斷提升,軟件的功耗效率也在不斷下降。如今的軟件設計方式,效率并不高,造成了大量的功耗浪費。盡管抽象化讓編程變得更簡單,但也讓軟件的能耗效率大打折扣?!?/p>

硬件層面的優化,很難彌補軟件的短板。賽義夫表示:“硬件廠商一直在優化軟件指令的執行方式,但軟件開發者也需要更謹慎地向硬件下達指令,充分考慮后續的功耗上限管控、能耗預算平衡等問題。我與許多硬件工程師交流過,能深切體會到他們對現有軟件研發流程的失望。”

結語

目前,行業已形成普遍共識:數據移動無論對性能還是功耗,都會產生巨大的成本損耗。從長遠來看,唯一可行的解決方案,是從根本上減少數據移動的需求。但現階段,行業推出的所有方案,都只是在優化數據移動的功耗。對半導體行業而言,這是一種順理成章的策略,但也意味著,未來一旦有人解決了數據移動的核心問題 —— 而這必然涉及軟件層面的突破,行業將迎來一場重大變革。



評論


相關推薦

技術專區

關閉