超越自動化:物理人工智能開啟智能機器的新紀元
如果有人今天從Spanx LLC的網站上訂購塑形衣,一臺類人機器人會處理該包裹。 在佐治亞州的GXO Logistics配送中心,Agility Robotics Inc.的雙足機器以機械般的精度推動商品運輸。在寶馬集團斯帕坦堡工廠,Figure 02機器人將鈑金零件插入底盤組件時實現了400%的速度提升。
這些不是實驗室演示或風險投資的狂熱夢想。它們是創造收入的部署,標志著機器與我們物理世界互動方式的根本轉變。
智能機器人時代已經到來。先進的硬件現在通過視頻、音頻和傳感器陣列將人工智能模型與現實世界連接起來,使人工智能能夠控制從裝卸貨物的自主托盤千斤頂到能夠精細運動和工具作的人形機器人。這種變革遠遠超出了工廠車間——涵蓋了在城市街道上行駛的自主車輛、響應使用者的智能建筑,以及智能耕作的農業機器人。
這場革命由所謂的“物理人工智能”(Physical AI)的出現推動:將人工智能集成到物理系統中,使機器人和機器能夠實時感知、推理并適應現實世界。與遵循僵化編程的傳統自動化不同,物理人工智能系統結合復雜算法、傳感器和執行器,以導航不可預測環境并處理可變任務。
亞馬遜機器人首席技術專家Tye Brady說:“我們在打造身體方面已經非常出色了?!薄艾F在我們通過生成式人工智能將心靈帶入身體。”
為了了解實體人工智能如何重塑整個行業,并評估人工智能何時能在工廠、企業和家庭中大規模實現,SiliconANGLE采訪了頂尖專家和高管,探討該技術從實驗性好奇心向商業必需性的轉變。
“物理人工智能已達到一個關鍵轉折點,技術準備度與市場需求保持一致,”先進機器人解決方案領導者Teradyne Robotics首席人工智能官James Davidson表示。“市場動態已從懷疑轉向證據。早期采用者報告了切實的效率和收入增長,我們已進入我所稱的早期多數階段,投資規模大幅增長。”
這種劇烈的規?;卜从吃陲L險投資流入中。根據Mind The Bridge的最新分析,硅谷幾乎完全將投資策略轉向人工智能,93%的風險投資現流入與人工智能相關的初創企業。僅2024年,實體人工智能公司就吸引了超過75億美元的資金,超級輪次成為常態:杰夫·貝索斯支持的Physical Intelligence公司以24億美元估值籌集了4億美元,市值24億美元,規模為Figure AI Inc.。 獲得了6.75億美元,Skild AI完成了一輪3億美元的融資。
這一勢頭在2025年更加加速。Figure AI在九月又籌集了10億美元,Physical Intelligence回歸又籌集了6億美元,而開發能夠導航三維環境人工智能模型的初創公司General Intuition PBC在十月籌集了1.337億美元。普羅米修斯計劃是一家由貝索斯和連續創業者維克·巴賈伊共同領導的初創公司,旨在開發“為物質經濟打造人工智能”,籌集了驚人的62億美元資金。
據金融研究公司Crunchbase稱,2025年前七個月已有超過60億美元的資本流入機器人公司和初創企業。Crunchbase預測,照這個速度,今年的資金將超過2024年的水平。
虛擬世界與物理影響:基礎模型的興起
物理人工智能的快速發展得益于機器人基礎模型(RFM)的發展:這些人工智能軟件“大腦”能夠接收信息并運用推理來指導現實世界中執行的機器人動作。
這些模型通常建立在視覺語言模型之上:具有多模態能力的預訓練變換器模型,能夠感知世界,并使機器人能夠識別物體和理解物理。RFM種類繁多,從物理智能(Physical Intelligence) 針對多種機器人的通用π0模型,到英偉達公司的GR00T——一種適用于類人生物的通用模型。
催生這些模型的技術突破是視覺-語言-動作模型(VLA)。Google DeepMind于 2023年開發的機器人變壓器2,通過擴展兩種最先進的基礎模型——PaLI-X和PaLM-E,樹立了智能機器人學的范式。VLA基于龐大的機器人動作數據集進行訓練,使其能夠推廣到新的任務。
VLA使機器人能夠將提示轉換為動作,例如,“請收拾垃圾并丟棄?!蹦P偷挠柧殧祿忍峁┝岁P于物體外觀的知識語料庫,也提供了一套用于處理動作的機器人軌跡。在這種情況下,即使機器人沒有專門訓練來丟棄垃圾,它仍然可以通過攝像頭識別為“垃圾”,抓住它們,找到合適的垃圾桶并執行處理。
這一發展標志著從基于規則的指導——機器人肢體觸發預編程動作——向能夠智能判斷和執行動作的計算機推理的根本轉變。
為了訓練和準備這些模型,出現了一類新的專業人工智能模型:世界基礎模型。WFM為機器人AI承擔兩個主要功能:它們使工程師能夠快速開發龐大的合成數據集,以訓練機器人執行看不見的動作;以及在實際部署前在虛擬環境中測試這些機器人。
WFM允許開發者通過環境的“數字孿生”創建模擬現實的虛擬訓練場。在這些模擬場景中,機器人學會以遠超物理存在所能承受的速度安全應對現實世界的挑戰。
例如英偉達的Cosmos平臺,開發機器人和自動駕駛車輛的WFM,以及Waabi Innovation Inc.的Waabi World,一款旨在教授自動駕駛卡車AI模型如何安全駕駛多種路況的WFM。World Labs Technologies最近推出了Marble,一款完整的虛擬世界生成器,谷歌的DeepMind推出了Genie 3,一款能夠生成互動虛擬世界的AI模型。
“Cosmos通過指數級擴展現有數據,解決了關鍵的模擬到現實挑戰——虛擬訓練與現實世界復雜性之間微妙但顯著的差異,”Nvidia機器人產品經理Spencer Huang表示:“Cosmos通過指數級擴展現有數據和解決關鍵的模擬現實挑戰。
人工智能先驅Yann LeCun離開了Meta Platforms Inc. 他選擇一家開發WFMs的初創公司,因為他認為世界模型將比Meta專注于語言模型的方向,在推動人工智能行業發展的方面有更大進展。
能夠生成大量物理精確的訓練數據,對行業來說是一個分水嶺。傳統機器人需要繁瑣的真實世界數據收集——昂貴、危險且范圍有限——而WFM則能在收集數百個訓練場景的時間內產生數百萬個訓練場景。
Waabi首席執行官Raquel Urtasun解釋道:“我們構建元宇宙是為了自動駕駛?!薄癢aabi World就是那個以現實為基礎構建的世界模型,這對物理人工智能對抗幻覺等你不希望出現在模擬系統中的現象非常重要?!?/p>
Waabi的方法實現了前所未有的99.7%模擬真實度,證明虛擬訓練環境現在可以近乎完美地模擬物理世界。
WFM還將智能機器人產業擴展到機器人肢體、無人機和類人生物之外。由于WFM創建了現實世界的“數字孿生”以模擬和理解真實環境,它可以訓練任何類型的機器人,甚至包括傳統上不被視為機器人技術一部分的系統,如物聯網網絡、智能建筑和智能城市。
原型人工智能公司一家開發物理人工智能基礎模型的公司,創造了Newton模型,該模型旨在實時理解和推理物理世界。與其他模型不同,Newton將實時傳感器數據與自然語言融合,傳遞關于世界的洞察。其應用涵蓋制造業,監控員工安全并預測設備維護,分析交通路口以設置更安全的斑馬線,并提升大型建筑工地的安全。
能力的增長推動商業應用
過去兩年,人形機器人首次商業化部署,包括寶馬工廠和GXO物流倉庫的部署。2024年6月,人形機器人首次投入商業運營,Agility Robotics的Digit正式進入“勞動力市場”。
盡管人形機器人占據了大量頭條新聞,但它們僅占人工智能機器人應用中的一小部分。 目前,正是協作機器人、機械臂和自主移動機器人正在改變倉庫和工廠環境。最典型的例子是 Amazon.com 公司,其倉庫中使用智能機器人。在公司超過75萬臺機器人中,亞馬遜推出了Vulcan,這是一款具備觸覺的AI驅動機械臂;Cardinal,用于疊加包裹;以及Proteus,一臺能移動推車的自主移動機器人。
“以前是有可能做到的......但你需要一個高度訓練的計算機模型,“戴維森補充道。“現在你可以讓物理或生成式AI模型幫你創造,完全不用訓練。”
摩根士丹利分析師估計,到2030年,亞馬遜的機器人技術開發每年可為公司節省多達100億美元。這還沒涉及大量不斷反饋到物理模型的數據,這些數據在業界可能無可匹敵。市場分析師Grand View Research的一份報告估計,2023年全球人工智能機器人市場規模為128億美元,預計到2030年將達到1248億美元。
2024年,工業機器人占據了機器人人工智能市場的68%,全球工廠安裝基數達428萬臺。醫療和醫療機器人是增長最快的細分市場,預計增長率為26%,計算機視覺輔助手術系統和自主醫院物流機器人正迅速發展。
然而,現實依然復雜。Tria Technologies GmbH軟件開發實驗室負責人塞德里克·文森特給出了令人警醒的評價:“雖然你可能在網上看到工業機器人搬運箱子的視頻......但當涉及到類人機器人模擬人類活動時,如果你仔細觀察,會發現它們經常失敗。”
“機器人還不能持續包裝產品”,因為這需要判斷力,而機器人系統尚未具備,Amazon.com 公司機器人入職主管伊戈爾·佩丹說。這就是為什么如今的先進技術是單臂或機器人群,而非類人機器人。
文森特補充說,對于強大的人工智能系統,“需求無疑是工業機器人的應用,這也是一個很好的概念驗證。你在Nvidia身上也能看到這一點,但目前還沒有什么'真正'的東西?!笔聦嵣?,SiliconANGLE的姊妹市場調研公司theCUBE Research指出,由于物理AI模型尚未擁有大型語言模型那樣龐大的數據庫,它們在類似能力方面可能至少落后兩到三年。
演示與部署之間的這種差距解釋了為什么正如戴維森所指出的,企業應“關注現有的,而非仍在出現的”。
自動駕駛汽車還受益于物理AI的突破,包括AI模型和硬件,Waabi計劃在今年年底前使用其下一代基礎模型推出完全無人駕駛卡車。像Aurora Innovation Inc.這樣的公司。 以及Torc Robotics Inc. 最近還推出了德克薩斯州固定路線和美國公共道路上的無人駕駛卡車商業試點服務,為FedEx和Uber Freight等合作伙伴運輸貨物。
自動駕駛汽車市場反映了這一加速趨勢,市場分析師Grand View Research Inc.預計該行業將從2024年的680.9億美元增長到2030年的2143.2億美元。
英偉達的Drive Thor平臺將于2025年推出量產車,已獲得梅賽德斯-奔馳股份公司、捷豹路虎汽車股份有限公司、沃爾沃汽車股份有限公司以及中國電動車制造商理想汽車公司、吉利控股的Zeeker和小米公司在內的主要制造商的采用。該平臺能夠將多種車輛功能——從自動駕駛到AI駕駛艙功能——整合到單一的片上系統,吸引了既有的汽車制造商和機器人出租車公司,如Uber Technologies Inc.。
卡車運輸領域尤其展現了商業可行性。麥肯錫公司 這些項目認為自動駕駛卡車通過運營成本優勢,到2035年有望創造6000億美元的市場。普華永道和制造業協會估計,如果積極采用自動駕駛長途卡車運輸,制造商到2040年將節省近30%的總運輸成本。
“如果你看看今天的人類司機,雖然他們平均能開11個小時,但實際上只開了6個半小時......“突然之間,自動駕駛可以全天候使用你的資產,”烏爾塔松談及經濟性時說。
即將到來的人機交接
英偉達首席執行官黃仁勛宣稱,實體人工智能開啟了“人工智能的新紀元”,這一大膽宣言如今得到了具體的技術突破支持。英偉達的愿景超越了孤立的自動化,實現了根本性的變革。
“大型語言和生成模型的進步預示著人工智能的新時代——能夠推理物理世界,并在工廠、家庭和城市中無縫運行的系統,”Nvidia的Spencer Huang補充道。“有了'機器人大腦',可以在真實或合成數據中重新訓練模擬,機器人可以快速學習新技能,并被重新應用于各種應用?!?/p>
這種適應性代表了對數十年來主導機器人的狹窄預編程系統的巨大轉變。
“到2027年,敘事將不再是關于人類替代,而是關于增強作,人工智能驅動的物理系統作為工具,增強而非取代人類專業知識,”Synapse(Capgemini Invent旗下)人工智能與數據主管兼總監Mat Gilbert說。
吉爾伯特補充說,人類勞動將從重復的體力勞動轉變為與智能系統艦隊并肩工作和監督。這一變化的根本在于人工智能驅動的機器人系統如何處理多變且無結構的環境,而這直到最近還僅由人類工人負責。
吉爾伯特說:“關鍵的業務差異化將是誰具備部署和適應智能的技能,而能夠蓬勃發展的企業將是那些學會快速教授、管理和信任其員工機器人組成部分的企業?!?/p>
勞動力取代的問題為實體人工智能的商業演變投下陰影,盡管早期證據表明現實比末日新聞所暗示的更為復雜。世界經濟論壇2025年《就業未來報告》預測,到2030年,人工智能和自動化將創造全球1.7億個新崗位,同時取代9200萬個崗位,凈增加7800萬個崗位。高盛估計,6%至7%的美國勞動力面臨AI采用帶來的取代風險,盡管隨著新機會出現,這種影響似乎是“暫時的”。一項針對52項工業機器人研究的薈萃分析未發現普遍工資低迷的一致證據。
對于企業領導者來說,吉爾伯特將這一轉變描述為“增強運營而非人類替代”。中國200億美元的人形投資凸顯了利害關系:盡管官員承諾合作而非替代,中國1.23億制造業工人仍面臨真正的不確定性。
歷史證明,這些擔憂并非毫無道理。從之前的自動化浪潮——從織機到工廠車間——的教訓表明,技術取代往往比技術人員預測的慢,但比工人在沒有制度支持的情況下再培訓的速度快。
通往這一轉變的路徑已經被繪制出來。黃斯賓塞觀察到,雖然“大多數機器人仍處于狹窄的預編程狀態”,但一波新興公司已經開始部署可適應系統。有些專注于構建可通用的“機器人大腦”——如Nvidia、Field AI和Skild AI,而另一些則開發實體平臺——如Figure、Agility和Universal Robots A/S。
Gilbert表示,短期內(兩到三年),最直接的價值將來自應用開發者和加速高價值用例開發的公司,如倉庫物流,而硬件和平臺提供商則將縮小潛力與生產之間的差距。從長遠來看,五年內,價值將轉移到平臺提供商以及機器人動作、仿真和訓練的主導基礎模型制造商身上。
戴維森指出:“物理人工智能的成功將取決于四個關鍵因素:易用性、可靠性、多功能性和性能。”







評論