久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 新聞縱覽 > 自變量機器人“零成功率”系誤傳!RoboChallenge平臺證實:實測接口未通

自變量機器人“零成功率”系誤傳!RoboChallenge平臺證實:實測接口未通

作者: 時間:2025-12-10 來源: 收藏

自變量機器人“零成功率”系誤傳!RoboChallenge平臺證實:實測接口未通作為人類前沿技術的無人區,具身智能模型技術晦澀難懂,又不像機器人本體能被C端接觸到,正頻頻被媒體和大眾所“誤讀”。

就在近期,具身智能模型領域的頭部創企自變量機器人就遭遇了一次烏龍事件。

近期,具身智能模型評測平臺RoboChallenge對于多款主流開源具身模型進行真機測試,并發布了一份初步的模型測試結果。

結果顯示,基于 Physical Intelligence(PI)系列構建的π0 和π0.5 表現出色,位列測試榜單的頭部,而國產的開源具身智能模型則表現一般。

image.png

這其中,自變量WALL-OSS-Flow模型的成績表現就被自媒體單拎出來批評了一番,批評其表現名不副實。“自變量開源模型零成功率”的媒體消息報道發出后,作為評測平臺,RoboChallenge官方第一時間全渠道跟進辟謠。

image.png

RoboChallenge官網主頁明確地表示:“請注意,以前顯示的一些結果可能是臨時的、部分的或僅用于調試目的。”

image.png

遺憾的是,仍有不少媒體在傳播這一消息。

這背后傳達出,當前媒體對于具身智能模型這個前沿科技領域,仍然存在著諸多誤解。

對于自變量誤解的核心點在于,具身智能模型雖然形式是軟件,但本質上卻是一個軟硬件一體的產品。這與開源的AI語言大模型可以“拿來即用、即測”是截然不同的。

當模型要被部署到新的本體上,就必須解決跨本體適配的問題,這涉及到不同本體的相關數據的遷移、轉換,以及測試接口的打通等等一系列復雜問題。

據了解,Robochallenge的本體暫時不支持自變量模型主要的控制方式——末端控制,數據回放和對齊存在問題,因此雙方正在做軟硬件適配;而接口調試過程留痕被截屏并迅速傳播,自媒體對于自變量模型的誤解就來源于此。

在這一傳播事件里,我們還看到了高度疑似互聯網水軍和同行故意抹黑的跡象。

比如在原文被辟謠刪除后,網絡多平臺密集出現“自變量開源模型零成功率”的媒體消息,消息投放方身份不明。

在該文章被轉載的微信評論區,有大量疑似水軍的微信用戶聚集并評論。

image.png

我們實測發現,目前自變量機器人的官網已經無法打開,疑似遭遇了黑客攻擊,知情人士也證實了這一消息。

image.png

不光是上述事件,我們發現,媒體和大眾對于具身智能模型的誤讀事件還有很多,近期就有兩起:

比如小鵬機器人最近發布的 IRON 人形機器人,就因形態和動作過于逼真引發網友 “真人套殼” 的質疑。

這個事件同樣源于大眾對于具身模型的認知偏差。

再比如近期具身智能初創公司靈啟萬物MindOn發布的demo視頻。

有具身模型背景的KOL將其解讀為使用了VLA和強化學習的路線,也有資深投資人表示其只運用了小腦的能力、技術陳舊;甚至有自媒體用騰訊元寶檢測認為demo是完全由AI模型生成。

以上種種,都昭示了具身智能模型的技術復雜性,以及其易被誤讀的現實。

這個扼住機器人行業發展咽喉的關鍵環節,為什么自帶“招黑體質”?

| 被誤讀的具身智能模型的一生

不得不承認,具身智能對于普通人是有“壁”的。

大眾可能很難理解,為什么機器人可以炫酷地跳舞、跑步、格斗,卻不能在工廠里打好螺絲,幫我做做家務?

甚至與行業有一定接觸的媒體人、投資人對于個中技術原理也是一頭霧水,容易被誤導。

在不少公開報道中,都可以看到媒體記者對于專家的真誠發問:怎么看一個機器人的demo視頻是不是自主完成的?怎么判斷機器人是否有處理泛化性任務的能力?怎么在展會上識別一個機器人的真正實力?

信息的不對稱自然也就容易滋生騙局。

媒體《藍鯨財經》就曾采訪某大學機器人系統架構師報道稱,國內有些初創公司,甚至是部分知名公司采用遙操作的方式拍攝demo,并將其包裝成為“全自主智能”,誤導投資人判斷。

應對上述騙局,某知名投資機構就直言,專門組建了理工科博士團隊從而提高對這類技術問題的鑒別能力。

專業人士尚且如此,當我們看到市面上形形色色的對于具身智能模型的誤讀現象,也就不足為怪了。

作為一項前沿技術,具身智能模型自身涉及多學科交叉的復雜技術體系,又源于其應用場景的多變性和大眾接觸層面的諸多限制,對普通人存在較高認知門檻。

那么該如何真實評估具身智能模型的技術能力?

無論是投資機構用“真金白銀”做出的判斷,還是模型評測平臺的測試,現場的真機演示都是必須的。

清華交叉信息研究院助理教授高陽曾給出一個小tips:在真機演示場景下,對于號稱能疊衣服的機器人,你可以嘗試把衣服團成一團,隨意丟在桌上,觀察它是否能繼續完成動作;或者是再給它褲子、外套,看它能否具備跨品類的泛化能力。

自變量創始人王潛也曾給出相似的建議。他表示,視頻demo有太多可以造假的方式了。現場才能夠看到模型真實的表現。

“甚至于需要去現場和機器人互動,進行一些人為干擾,看看模型在各種各樣的極限情況下會有什么樣的表現,這才真正能體現模型的水平?!蓖鯘摫硎?。

包含千尋和自變量在內,多家具身模型公司都曾在今年的WAIC(世界人工智能大會)、WRC(世界機器人大會)等展會現場展示了真實的VLA具身智能模型操作。

無論是面向投資人、公眾還是同行,這些公司敢于進行現場真機操作,不怕真實環境的檢驗,它們的技術能力無疑是經得起驗證的。

但需要指出的是,同樣是真機操作,但模型評測平臺的測試與展會現場的真機演示有很大的不同。

前者需要將具身模型部署到一個全新的本體上,這就涉及到具身模型的一個關鍵問題——跨本體適配:當模型在新本體上微調后,原模型的能力就會有比較大的損失。

這與開源的AI語言大模型可以“拿來即用即測”是截然不同的。軟件如模型本身即是產品,而軟硬件一體的具身智能模型的運行機制則要復雜得多。

以PI開源的π0 和π0.5為例,自開源至今已有相當長時間,國內有一些企業也嘗試在其基礎上進行微調,但從實際效果來看,并不會明顯優于其他開源方案,更無法完整復現PI團隊在其自有機器人本體上的表現。

同樣地,包括自變量的WALL-OSS-Flow之內,模型要被評測平臺公正地評價,則必須解決好模型跨本體的適配問題,數據對齊問題,接口聯通問題,才能最大程度復現出模型的真實水平。

| 國家戰略下的具身智能模型:希望和耐心

具身智能模型賽道之所以容易滋生騙局、也容易被質疑,其實還有一個重要原因:“行業太早期,商業化不清晰。”

這也是包括朱嘯虎在內的一些專業人士看空具身智能的核心觀點。

的確,當下具身智能模型確實處于發展的早期階段,技術路線還未完全收斂。模型短期之內很難規?;涞兀蟊娍床坏疆a品,相關的質疑聲在所難免。

但正如眾擎創始人趙同陽對上述質疑的回答,問人形機器人在這個階段有什么用?就像質問一個剛出生的嬰兒,用眼前看到的來否定未來。

可以看到,今年以來,具身智能成為了最炙手可熱的一級市場賽道,被投資機構高度青睞。從投資結構看,國資背景資金的參與度顯著上升,產業基金與地方政府平臺頻繁現身。

更關鍵的是,具身智能產業已經逐漸上升為國家戰略,也成為了未來全球科技產業競爭的高地。

今年3月,國務院政府工作報告首提“具身智能”“智能機器人”,標志著具身智能技術正式上升為國家戰略;10月審議通過的“十五五” 規劃建議,更是明確將具身智能納入未來產業重點布局。

開源證券機械首席分析師孟鵬飛稱,未來人形機器人產業將是中美引領、全球共振,是人類科技史上濃墨重彩的一筆。

具體到具身智能模型環節,中國則有著獨到的競爭優勢。

目前具身智能模型最大的卡點在于數據,它是模型迭代的核心燃料。而我國作為全球唯一擁有全部工業門類的國家,疊加豐富的民生場景,為具身智能模型提供了海量真實數據。

同時中國的硬件、供應鏈、數采工人的工資都更便宜,更具有成本優勢。

當然更關鍵的,還有具身智能模型人才和創新的競爭。

由于不同市場的資本市場環境,盡管中國具身智能模型創企的估值和融資金額不及美國對手PI、Figure和特斯拉。

但以自變量為代表的自研基礎模型創企對外展示的模型能力,在某些環節已經表現出了不輸美國同行的泛化性表現——這是中國模型企業在具身智能模型領域的競爭力和實力的體現。

凡是承載著戰略價值與未來潛力的新興領域,其技術突破與產業成熟必然要經歷一個長期迭代過程。

作為影響全人類未來的高科技產業和我國未來產業重點布局的關鍵方向,對于具身智能,我們不妨秉持長遠視角,少一些誤讀和輕率,多給一些求真精神和耐心。



關鍵詞:

評論


相關推薦

技術專區

關閉