久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 智能計(jì)算 > 市場(chǎng)分析 > 2025年真的是人工智能代理之年嗎?

2025年真的是人工智能代理之年嗎?

作者: 時(shí)間:2026-01-30 來源:IEEE 收藏

2025 年 1 月 5 日,OpenAI 首席執(zhí)行官 Sam Altman 在其個(gè)人博客中勾勒出他對(duì) 2025 年的愿景,宣稱 “2025 年,我們或?qū)⒁娮C首批 AI ‘入職上崗’,并切實(shí)改變企業(yè)的產(chǎn)出效率”。他的這番言論,奠定了 2025 年整個(gè)人工智能行業(yè)的發(fā)展基調(diào)。

但 AI 在 2025 年是否真的走進(jìn)了職場(chǎng)?答案可以是絕對(duì)的肯定,也可以是完全的否定 —— 最終定論,取決于你詢問的對(duì)象。

Bluetuple.ai 的主權(quán)人工智能與安全顧問 Michael Hannecke 表示,如今 “所有人” 都在研究如何運(yùn)用 AI ,“但同時(shí)也存在一種幻滅感:這件事遠(yuǎn)非想象中簡(jiǎn)單,并非把 AI 技術(shù)隨意用在任何場(chǎng)景,就能立刻發(fā)揮效用”。

類智能體實(shí)現(xiàn)突破

盡管多個(gè)行業(yè)都對(duì) AI 智能體表達(dá)了興趣,但程序員與軟件工程師群體顯然走在了前列。《Digital Trends》媒體集團(tuán)的產(chǎn)品與工程高級(jí)總監(jiān) Brandon Clark 便是這一趨勢(shì)的擁護(hù)者,他已將自身工作全面遷移至 AI 工具平臺(tái),如今在絕大多數(shù)工作場(chǎng)景中,都對(duì) AI 智能體的能力充滿信任。

“我每天都用 Cursor 開發(fā)代碼?!盋lark 說。他還頻繁使用 Anthropic 的 Claude Code,在兩款工具間切換操作 —— 這不僅是因?yàn)樗鶕?jù)不同任務(wù)的特性,對(duì)二者各有偏好,同時(shí)也是為了避開工具的使用限額,這一細(xì)節(jié)也直觀反映出他使用 AI 智能體的高頻程度?!坝袝r(shí) Claude Code 的令牌會(huì)用完,這時(shí)我就切回 Cursor,繼續(xù)完成工作?!?/p>

和許多程序員一樣,Clark 愿意接受并使用 AI 智能體,一定程度上源于其專業(yè)背景。他擁有多年使用集成開發(fā)環(huán)境(IDE)軟件的經(jīng)驗(yàn),而 Cursor 這類融入 AI 技術(shù)的集成開發(fā)環(huán)境,將智能體式人工智能以一種相對(duì)便捷的方式,融入了工程師現(xiàn)有的工具體系與工作流程中。

他對(duì) AI 智能體的快速接納,也印證了這類技術(shù)在處理部分軟件工程任務(wù)時(shí)的適配性。例如,測(cè)試代碼的作用是通過輸入已知的正確參數(shù)、驗(yàn)證輸出結(jié)果,來確認(rèn)軟件運(yùn)行是否正常。編寫測(cè)試代碼是一項(xiàng)重要但重復(fù)性高的工作,通常不需要?jiǎng)?chuàng)新性的思維,這也讓這類任務(wù)更易由 AI 智能體完成。

“現(xiàn)在我甚至可以完全不參與測(cè)試代碼的編寫工作。我會(huì)在 AI 系統(tǒng)的指令中明確要求,每當(dāng)它開發(fā)一個(gè)新功能,必須同步編寫對(duì)應(yīng)的測(cè)試代碼;同時(shí)在編寫完成后運(yùn)行測(cè)試,若發(fā)現(xiàn)任何問題,自行完成修復(fù)。”Clark 說。

此外,新的 AI 跨軟件集成技術(shù)的出現(xiàn),也讓程序員的工作效率得到了進(jìn)一步提升,例如 Anthropic 于 2024 年 11 月推出的 Model Context Protocol(MCP)服務(wù)器,以及 Google 于 2025 年 4 月發(fā)布的 Agent2Agent 協(xié)議。這類技術(shù)支持 AI 智能體調(diào)用各類軟件,完成工作任務(wù)或驗(yàn)證工作成果。比如 Cursor 搭載了可作為 MCP 服務(wù)器調(diào)用的瀏覽器工具,從事網(wǎng)頁開發(fā)的 AI 智能體可通過該工具,檢查自身的開發(fā)成果。

其他領(lǐng)域智能體:構(gòu)想易,落地難

對(duì) Clark 而言,2025 年無疑是 AI 智能體的元年。他在年初便開始嘗試使用各類 AI 智能體,而隨著更優(yōu)質(zhì)的模型發(fā)布、聚焦 AI 的工具持續(xù)升級(jí),其使用體驗(yàn)也不斷優(yōu)化。但另一些從業(yè)者,卻有著褒貶不一的使用感受。

身處德國(guó)的 AI 顧問 Michael Hannecke 表示,2025 年各行業(yè)對(duì) AI 智能體的興趣從未消退,但當(dāng)企業(yè)真正開始認(rèn)真考量技術(shù)落地時(shí),往往會(huì)遭遇重重阻礙。

“我目前只見到三四個(gè)企業(yè)將 AI 智能體投入實(shí)際生產(chǎn)的案例?!盚annecke 說,“絕大多數(shù)企業(yè)仍處于開發(fā)、評(píng)估與測(cè)試階段,這一切都源于 AI 智能體應(yīng)用背后的不確定性?!?他提到,許多企業(yè)對(duì) AI 自動(dòng)化帶來的風(fēng)險(xiǎn),都表現(xiàn)出一種程度不同的 “德國(guó)式焦慮”。“關(guān)于 AI 智能體,還有很多問題,我們無法做到 100% 確定?!?/p>

誠(chéng)然,德國(guó)乃至整個(gè)歐洲的相關(guān)監(jiān)管政策,是造成這種謹(jǐn)慎態(tài)度的原因之一,但這并非唯一因素。開發(fā) 3D 設(shè)計(jì)軟件的 Autodesk 公司體驗(yàn)設(shè)計(jì)高級(jí)經(jīng)理 Jason Bejot,道出了一個(gè)諸多領(lǐng)域工程師都能產(chǎn)生共鳴的擔(dān)憂:責(zé)任界定問題。

“這是最大的挑戰(zhàn)之一。如何讓 AI 智能體精準(zhǔn)工作、落地執(zhí)行,最終轉(zhuǎn)化為可落地的成果?”Bejot 發(fā)出了這樣的疑問。

Autodesk 旗下?lián)碛幸豢钪悄荏w式 AI 工具 Assistant,可解答 AutoCAD、Autodesk Fusion、Revit 等 Autodesk 系列軟件用戶的問題。但就目前的產(chǎn)品形態(tài)而言,這款助手工具的定位也僅止步于 “助手”:它能完成信息總結(jié)、提供操作指導(dǎo),卻并非為自主主導(dǎo)工程設(shè)計(jì)、給出解決方案而設(shè)計(jì)。

“工作的責(zé)任鏈路必須清晰可溯。如果建筑師 A 借助這款助手工具更新了設(shè)計(jì)草圖,那么該建筑師仍需為這些更新內(nèi)容負(fù)責(zé)。”Bejot 說,“因此,如何在全流程中明確這種責(zé)任界定,是我們始終高度關(guān)注的問題?!?/p>

彌合智能體應(yīng)用與責(zé)任界定間的鴻溝

Clark、Bejot 與 Hannecke 截然不同的體驗(yàn),恰恰凸顯了 2025 年乃至 2026 年 AI 智能體應(yīng)用的多元結(jié)果:對(duì)一部分從業(yè)者而言,AI 智能體的表現(xiàn)正如 Sam Altman 所預(yù)判的那般,已切實(shí)發(fā)揮效用;而對(duì)另一部分人來說,要讓 AI 智能體真正落地賦能,仍有大量工作亟待完成。

斯坦福大學(xué)博士后研究員 Kiana Jafari 針對(duì)這一技術(shù)落地的鴻溝展開了專項(xiàng)研究。她參與撰寫的一篇論文指出,在 AI 智能體的評(píng)估指標(biāo)中,準(zhǔn)確率、任務(wù)完成率等技術(shù)指標(biāo)占比高達(dá) 83%。這類可驗(yàn)證、可系統(tǒng)化的指標(biāo),也與程序員 Clark 的使用體驗(yàn)相契合。

但技術(shù)準(zhǔn)確率并非唯一值得關(guān)注的指標(biāo)?!澳壳拔覀兘佑|的大多數(shù)智能體式系統(tǒng),從理論上來說,準(zhǔn)確率表現(xiàn)都十分出色?!盝afari 說,“但當(dāng)真正投入實(shí)際使用時(shí),卻會(huì)遭遇諸多阻礙?!?/p>

在那些從業(yè)者需要為工作結(jié)果承擔(dān)個(gè)人責(zé)任的領(lǐng)域,即便是技術(shù)準(zhǔn)確率達(dá)到高標(biāo)準(zhǔn)的 AI 智能體,其表現(xiàn)也難以滿足實(shí)際需求。Jafari 與醫(yī)療行業(yè)從業(yè)者的訪談,也明確揭示了背后的原因?!八麄兯腥硕急硎荆骸呐逻@款 AI 工具有 0.001% 的出錯(cuò)概率,最終承擔(dān)責(zé)任的還是我,一旦出現(xiàn)問題,后果都由我來承擔(dān)?!?這一現(xiàn)狀,也讓 AI 智能體的角色從主動(dòng)執(zhí)行,退回到了輔助建議的位置。

這一現(xiàn)象也解釋了行業(yè)對(duì) AI 智能體的接受度為何存在巨大差異:有人視其為近乎無弊端的生產(chǎn)力助推器,有人認(rèn)為其前景向好但尚處初期,還有人將其視作存在本質(zhì)風(fēng)險(xiǎn)的技術(shù)。而現(xiàn)實(shí)是,AI 智能體的定位究竟如何,最終取決于其被賦予的具體任務(wù)。

“人機(jī)協(xié)同的模式仍不可或缺?!盚annecke 說,“2025 年,整個(gè)行業(yè)都在不斷嘗試、打造原型;而 2026 年,將是我們把 AI 智能體投入實(shí)際生產(chǎn)的一年,也會(huì)在技術(shù)規(guī)?;涞氐倪^程中,發(fā)現(xiàn)并解決那些必須面對(duì)的難題?!?/p>


關(guān)鍵詞: 人工智能代理 智能體 編程

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉