人工智能能否比我們更好地理解情緒?
人工智能(AI)能否在情感緊張的情境中提出適當的行為建議?日內瓦大學(UNIGE)和伯爾尼大學(UniBE)的一個研究團隊使用通常為人類設計的情商(EI)評估方法,對包括 ChatGPT 在內的六個生成式 AI 進行了測試。結果:這些 AI 的表現優于普通人類水平,甚至能夠在創紀錄的時間內生成新的測試。這些發現為 AI 在教育、輔導和沖突管理中的應用開辟了新的可能性。這項研究發表在《 心理學交流 》期刊上。
大型語言模型(LLMs)是能夠處理、解釋和生成人類語言的人工智能(AI)系統。例如,ChatGPT 生成式人工智能就是基于這種模型。LLMs 可以回答問題并解決復雜問題。但它們也能提出具有情商的行為嗎?
這些結果為 AI 在以往被認為是人類專屬的領域中的應用鋪平了道路。
情感緊張的情境
為了找出答案,來自 UniBE 心理學研究所和 UNIGE 瑞士情感科學中心(CISA)的一個團隊對六個大型語言模型(LLMs)(ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku 和 DeepSeek V3)進行了情商測試。“我們選擇了五種在研究和企業環境中常用的測試。它們涉及充滿情感的場景,旨在評估理解、調節和管理情緒的能力,”UniBE 心理學研究所人格心理學、差異心理學和評估系的講師兼首席研究員 Katja Schlegel 說,也是該研究的主要作者。
例如:邁克爾的一個同事偷了他的想法,并且正在不公平地受到祝賀。邁克爾最有效的反應是什么?
a) 與涉及的同事爭論
b) 和他的上級談談情況
c) 悄悄地怨恨他的同事
d) 偷回一個想法
這里,選項 b 被認為是最合適的。
同時,相同的五項測試也 administered 給人類參與者。"最終,LLMs 獲得了顯著更高的分數——82%的正確答案,而人類只有 56%。這表明這些 AI 不僅理解情緒,而且理解這意味著什么,以具有情緒智能的行為",參與研究的 UNIGE 瑞士情感科學中心(CISA)高級科學家 Marcello Mortillaro 解釋道。
新測試在創紀錄的時間內完成
在第二階段,科學家們要求 ChatGPT-4 創建新的情商測試,并設計了新的場景。這些自動生成的測試由 400 多名參與者進行。 “它們與原始測試一樣可靠、清晰和逼真,而原始測試的開發花費了數年時間,”卡特婭·施萊格爾解釋道。“因此,LLMs 不僅能夠從各種選項中找到最佳答案,還能夠生成適應所需上下文的新場景。這進一步證實了 LLMs,如 ChatGPT,具有情感知識并能夠推理情感,”馬塞洛·莫蒂拉羅補充道。
這些結果為 AI 在原本被認為是人類專屬的領域中的應用鋪平了道路,例如教育、輔導或沖突管理,前提是它由專家使用和監督。











評論