随着人工智能技术的飞速发展,AI在各个领域的应用越来越广泛。然而,近期的研究揭示了一个令人关注的现象:AI也可能面临类似人类老年痴呆症的认知障碍问题,尤其是在老旧的AI模型中表现更为明显。
以色列特拉维夫大学的最新研究显示,全球顶尖的AI大型语言模型在进行一系列认知测试时,表现出了类似于人类早期老年痴呆的症状。研究者们使用了蒙特利尔认知评估量表对这些模型进行测试,这是一种常用于评估老年痴呆症的工具。

在测试中,科学家们发现,AI模型的版本越老,其在测试中的表现就越差。例如,GPT-4o模型在测试中获得了最高分26分,而Gemini 1.0模型仅得到16分,远低于被认为是正常认知的26分标准。
此外,研究还发现,几乎所有的AI模型在视觉空间能力和执行任务方面都表现不佳,它们无法表现出同理心或准确解释复杂的视觉场景。在需要视觉抽象和执行功能的任务中,所有大型语言模型都一致失败,这表明AI在这些领域的应用可能存在重要限制。

这项研究的结果对于AI的未来发展具有重要意义。它不仅揭示了老旧AI模型可能存在的“数字痴呆”问题,也为AI技术的进步和优化提供了新的研究方向。科学家们指出,有数字痴呆的AI不可能很快取代医生等专业人士,这为AI的临床应用敲响了警钟。


