2025年真的是人工智能代理之年嗎？

作者：時(shí)間：2026-01-30 來源：IEEE

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

2025 年 1 月 5 日，OpenAI 首席執(zhí)行官 Sam Altman 在其個(gè)人博客中勾勒出他對(duì) 2025 年的愿景，宣稱 “2025 年，我們或?qū)⒁娮C首批 AI 智能體‘入職上崗’，并切實(shí)改變企業(yè)的產(chǎn)出效率”。他的這番言論，奠定了 2025 年整個(gè)人工智能行業(yè)的發(fā)展基調(diào)。

但 AI 智能體在 2025 年是否真的走進(jìn)了職場(chǎng)？答案可以是絕對(duì)的肯定，也可以是完全的否定 —— 最終定論，取決于你詢問的對(duì)象。

Bluetuple.ai 的主權(quán)人工智能與安全顧問 Michael Hannecke 表示，如今 “所有人” 都在研究如何運(yùn)用 AI 智能體，“但同時(shí)也存在一種幻滅感：這件事遠(yuǎn)非想象中簡(jiǎn)單，并非把 AI 技術(shù)隨意用在任何場(chǎng)景，就能立刻發(fā)揮效用”。

編程類智能體實(shí)現(xiàn)突破

盡管多個(gè)行業(yè)都對(duì) AI 智能體表達(dá)了興趣，但程序員與軟件工程師群體顯然走在了前列。《Digital Trends》媒體集團(tuán)的產(chǎn)品與工程高級(jí)總監(jiān) Brandon Clark 便是這一趨勢(shì)的擁護(hù)者，他已將自身工作全面遷移至 AI 工具平臺(tái)，如今在絕大多數(shù)工作場(chǎng)景中，都對(duì) AI 智能體的能力充滿信任。

“我每天都用 Cursor 開發(fā)代碼?！盋lark 說。他還頻繁使用 Anthropic 的 Claude Code，在兩款工具間切換操作 —— 這不僅是因?yàn)樗鶕?jù)不同任務(wù)的特性，對(duì)二者各有偏好，同時(shí)也是為了避開工具的使用限額，這一細(xì)節(jié)也直觀反映出他使用 AI 智能體的高頻程度?！坝袝r(shí) Claude Code 的令牌會(huì)用完，這時(shí)我就切回 Cursor，繼續(xù)完成工作?！?/p>

和許多程序員一樣，Clark 愿意接受并使用 AI 智能體，一定程度上源于其專業(yè)背景。他擁有多年使用集成開發(fā)環(huán)境（IDE）軟件的經(jīng)驗(yàn)，而 Cursor 這類融入 AI 技術(shù)的集成開發(fā)環(huán)境，將智能體式人工智能以一種相對(duì)便捷的方式，融入了工程師現(xiàn)有的工具體系與工作流程中。

他對(duì) AI 智能體的快速接納，也印證了這類技術(shù)在處理部分軟件工程任務(wù)時(shí)的適配性。例如，測(cè)試代碼的作用是通過輸入已知的正確參數(shù)、驗(yàn)證輸出結(jié)果，來確認(rèn)軟件運(yùn)行是否正常。編寫測(cè)試代碼是一項(xiàng)重要但重復(fù)性高的工作，通常不需要?jiǎng)?chuàng)新性的思維，這也讓這類任務(wù)更易由 AI 智能體完成。

“現(xiàn)在我甚至可以完全不參與測(cè)試代碼的編寫工作。我會(huì)在 AI 系統(tǒng)的指令中明確要求，每當(dāng)它開發(fā)一個(gè)新功能，必須同步編寫對(duì)應(yīng)的測(cè)試代碼；同時(shí)在編寫完成后運(yùn)行測(cè)試，若發(fā)現(xiàn)任何問題，自行完成修復(fù)。”Clark 說。

此外，新的 AI 跨軟件集成技術(shù)的出現(xiàn)，也讓程序員的工作效率得到了進(jìn)一步提升，例如 Anthropic 于 2024 年 11 月推出的 Model Context Protocol（MCP）服務(wù)器，以及 Google 于 2025 年 4 月發(fā)布的 Agent2Agent 協(xié)議。這類技術(shù)支持 AI 智能體調(diào)用各類軟件，完成工作任務(wù)或驗(yàn)證工作成果。比如 Cursor 搭載了可作為 MCP 服務(wù)器調(diào)用的瀏覽器工具，從事網(wǎng)頁開發(fā)的 AI 智能體可通過該工具，檢查自身的開發(fā)成果。

其他領(lǐng)域智能體：構(gòu)想易，落地難

對(duì) Clark 而言，2025 年無疑是 AI 智能體的元年。他在年初便開始嘗試使用各類 AI 智能體，而隨著更優(yōu)質(zhì)的模型發(fā)布、聚焦 AI 的編程工具持續(xù)升級(jí)，其使用體驗(yàn)也不斷優(yōu)化。但另一些從業(yè)者，卻有著褒貶不一的使用感受。

身處德國(guó)的 AI 顧問 Michael Hannecke 表示，2025 年各行業(yè)對(duì) AI 智能體的興趣從未消退，但當(dāng)企業(yè)真正開始認(rèn)真考量技術(shù)落地時(shí)，往往會(huì)遭遇重重阻礙。

“我目前只見到三四個(gè)企業(yè)將 AI 智能體投入實(shí)際生產(chǎn)的案例?！盚annecke 說，“絕大多數(shù)企業(yè)仍處于開發(fā)、評(píng)估與測(cè)試階段，這一切都源于 AI 智能體應(yīng)用背后的不確定性?！?他提到，許多企業(yè)對(duì) AI 自動(dòng)化帶來的風(fēng)險(xiǎn)，都表現(xiàn)出一種程度不同的 “德國(guó)式焦慮”。“關(guān)于 AI 智能體，還有很多問題，我們無法做到 100% 確定?！?/p>

誠(chéng)然，德國(guó)乃至整個(gè)歐洲的相關(guān)監(jiān)管政策，是造成這種謹(jǐn)慎態(tài)度的原因之一，但這并非唯一因素。開發(fā) 3D 設(shè)計(jì)軟件的 Autodesk 公司體驗(yàn)設(shè)計(jì)高級(jí)經(jīng)理 Jason Bejot，道出了一個(gè)諸多領(lǐng)域工程師都能產(chǎn)生共鳴的擔(dān)憂：責(zé)任界定問題。

“這是最大的挑戰(zhàn)之一。如何讓 AI 智能體精準(zhǔn)工作、落地執(zhí)行，最終轉(zhuǎn)化為可落地的成果？”Bejot 發(fā)出了這樣的疑問。

Autodesk 旗下?lián)碛幸豢钪悄荏w式 AI 工具 Assistant，可解答 AutoCAD、Autodesk Fusion、Revit 等 Autodesk 系列軟件用戶的問題。但就目前的產(chǎn)品形態(tài)而言，這款助手工具的定位也僅止步于 “助手”：它能完成信息總結(jié)、提供操作指導(dǎo)，卻并非為自主主導(dǎo)工程設(shè)計(jì)、給出解決方案而設(shè)計(jì)。

“工作的責(zé)任鏈路必須清晰可溯。如果建筑師 A 借助這款助手工具更新了設(shè)計(jì)草圖，那么該建筑師仍需為這些更新內(nèi)容負(fù)責(zé)。”Bejot 說，“因此，如何在全流程中明確這種責(zé)任界定，是我們始終高度關(guān)注的問題?！?/p>

彌合智能體應(yīng)用與責(zé)任界定間的鴻溝

Clark、Bejot 與 Hannecke 截然不同的體驗(yàn)，恰恰凸顯了 2025 年乃至 2026 年 AI 智能體應(yīng)用的多元結(jié)果：對(duì)一部分從業(yè)者而言，AI 智能體的表現(xiàn)正如 Sam Altman 所預(yù)判的那般，已切實(shí)發(fā)揮效用；而對(duì)另一部分人來說，要讓 AI 智能體真正落地賦能，仍有大量工作亟待完成。

斯坦福大學(xué)博士后研究員 Kiana Jafari 針對(duì)這一技術(shù)落地的鴻溝展開了專項(xiàng)研究。她參與撰寫的一篇論文指出，在 AI 智能體的評(píng)估指標(biāo)中，準(zhǔn)確率、任務(wù)完成率等技術(shù)指標(biāo)占比高達(dá) 83%。這類可驗(yàn)證、可系統(tǒng)化的指標(biāo)，也與程序員 Clark 的使用體驗(yàn)相契合。

但技術(shù)準(zhǔn)確率并非唯一值得關(guān)注的指標(biāo)?！澳壳拔覀兘佑|的大多數(shù)智能體式系統(tǒng)，從理論上來說，準(zhǔn)確率表現(xiàn)都十分出色?！盝afari 說，“但當(dāng)真正投入實(shí)際使用時(shí)，卻會(huì)遭遇諸多阻礙?！?/p>

在那些從業(yè)者需要為工作結(jié)果承擔(dān)個(gè)人責(zé)任的領(lǐng)域，即便是技術(shù)準(zhǔn)確率達(dá)到高標(biāo)準(zhǔn)的 AI 智能體，其表現(xiàn)也難以滿足實(shí)際需求。Jafari 與醫(yī)療行業(yè)從業(yè)者的訪談，也明確揭示了背后的原因?！八麄兯腥硕急硎荆骸呐逻@款 AI 工具有 0.001% 的出錯(cuò)概率，最終承擔(dān)責(zé)任的還是我，一旦出現(xiàn)問題，后果都由我來承擔(dān)?！?這一現(xiàn)狀，也讓 AI 智能體的角色從主動(dòng)執(zhí)行，退回到了輔助建議的位置。

這一現(xiàn)象也解釋了行業(yè)對(duì) AI 智能體的接受度為何存在巨大差異：有人視其為近乎無弊端的生產(chǎn)力助推器，有人認(rèn)為其前景向好但尚處初期，還有人將其視作存在本質(zhì)風(fēng)險(xiǎn)的技術(shù)。而現(xiàn)實(shí)是，AI 智能體的定位究竟如何，最終取決于其被賦予的具體任務(wù)。

“人機(jī)協(xié)同的模式仍不可或缺?！盚annecke 說，“2025 年，整個(gè)行業(yè)都在不斷嘗試、打造原型；而 2026 年，將是我們把 AI 智能體投入實(shí)際生產(chǎn)的一年，也會(huì)在技術(shù)規(guī)?；涞氐倪^程中，發(fā)現(xiàn)并解決那些必須面對(duì)的難題?！?/p>

久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

2025年真的是人工智能代理之年嗎？

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)

久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

2025年真的是人工智能代理之年嗎？

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)

2025年真的是人工智能代理之年嗎？