人工智能能否比我們更好地理解情緒？

作者：時間：2025-05-26 來源：日內瓦大學

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

人工智能（AI）能否在情感緊張的情境中提出適當的行為建議？日內瓦大學（UNIGE）和伯爾尼大學（UniBE）的一個研究團隊使用通常為人類設計的情商（EI）評估方法，對包括 ChatGPT 在內的六個生成式 AI 進行了測試。結果：這些 AI 的表現優于普通人類水平，甚至能夠在創紀錄的時間內生成新的測試。這些發現為 AI 在教育、輔導和沖突管理中的應用開辟了新的可能性。這項研究發表在《心理學交流》期刊上。

大型語言模型（LLMs）是能夠處理、解釋和生成人類語言的人工智能（AI）系統。例如，ChatGPT 生成式人工智能就是基于這種模型。LLMs 可以回答問題并解決復雜問題。但它們也能提出具有情商的行為嗎？

這些結果為 AI 在以往被認為是人類專屬的領域中的應用鋪平了道路。

情感緊張的情境

為了找出答案，來自 UniBE 心理學研究所和 UNIGE 瑞士情感科學中心（CISA）的一個團隊對六個大型語言模型（LLMs）（ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Copilot 365、Claude 3.5 Haiku 和 DeepSeek V3）進行了情商測試。“我們選擇了五種在研究和企業環境中常用的測試。它們涉及充滿情感的場景，旨在評估理解、調節和管理情緒的能力，”UniBE 心理學研究所人格心理學、差異心理學和評估系的講師兼首席研究員 Katja Schlegel 說，也是該研究的主要作者。

例如：邁克爾的一個同事偷了他的想法，并且正在不公平地受到祝賀。邁克爾最有效的反應是什么？

a) 與涉及的同事爭論

b) 和他的上級談談情況

c) 悄悄地怨恨他的同事

d) 偷回一個想法

這里，選項 b 被認為是最合適的。

同時，相同的五項測試也 administered 給人類參與者。"最終，LLMs 獲得了顯著更高的分數——82%的正確答案，而人類只有 56%。這表明這些 AI 不僅理解情緒，而且理解這意味著什么，以具有情緒智能的行為"，參與研究的 UNIGE 瑞士情感科學中心（CISA）高級科學家 Marcello Mortillaro 解釋道。

新測試在創紀錄的時間內完成

在第二階段，科學家們要求 ChatGPT-4 創建新的情商測試，并設計了新的場景。這些自動生成的測試由 400 多名參與者進行。 “它們與原始測試一樣可靠、清晰和逼真，而原始測試的開發花費了數年時間，”卡特婭·施萊格爾解釋道。“因此，LLMs 不僅能夠從各種選項中找到最佳答案，還能夠生成適應所需上下文的新場景。這進一步證實了 LLMs，如 ChatGPT，具有情感知識并能夠推理情感，”馬塞洛·莫蒂拉羅補充道。

這些結果為 AI 在原本被認為是人類專屬的領域中的應用鋪平了道路，例如教育、輔導或沖突管理，前提是它由專家使用和監督。