

最新一期《自然-人类行为》期刊上发表的研究论文指出,两款AI大语言模型在特定情境下表现出与人类相似甚至超越人类的心理状态能力。
心理状态能力是社交互动中沟通和产生共鸣的关键因素。德国汉堡-埃彭多夫大学医学中心的团队选择了一系列任务来测试不同方面的心灵理论能力,包括发现错误想法、理解间接言语以及识别失礼等。
研究结果显示,在识别间接要求、错误想法和误导的表现上,GPT模型有时甚至超越了人类平均水平,而LLaMA2的表现则稍逊于人类水平。然而,在识别失礼方面,LLaMA2则优于人类水平。不过GPT模型在这一领域表现不佳。
作者解释说,LLaMA2的优异表现归功于回答“偏见程度”较低,并非对失礼敏感。而GPT模型“表现不佳”的原因在于对坚持结论具有“超保守”的态度,而非推理错误。
发表评论 取消回复