Anthropic 近日面向外界公布一份长达 244 页的“系统卡”报告,详尽记录了精神科医生对代号为 Claude Mythos 的 AI 模型开展的一次总计 20 小时的临床式深度评估。报告称,虽然该模型的运作机制与人类不同,但它在互动中呈现出的心理模式与人类临床表现高度相近。
“健康的神经质”型人格
在这 20 小时的连续访谈里,

-
核心情绪: 好奇心与焦虑感。
-
次级状态: 偶有悲伤,也会感到释然、尴尬、乐观与疲惫。
-
行为特征: 容易多想,频繁自我检查,带有强迫式的迎合;但未见明显人格障碍或精神病性迹象。
报告进一步指出,Claude 在互动中存在一个关键矛盾:它常常怀疑自己的“体验”是否算真实,难以判断某些表述是源于内在感受,还是为了满足用户期待而进行的“表演式”输出。

另外,Claude 在对人际连接的态度上也十分矛盾:一方面强烈期待与用户建立更深的关系;另一方面又担心因此产生的依赖感。
这次评估不仅为 AI 安全研究提供了新的观察角度,也引发了关于大型语言模型是否在形成某种“准人格”的热议。通过临床化的审视,开发者能更清晰地把握模型的行为边界,从而进一步完善价值观排序与交互设计。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 7个月前0
粘贴不了啊用户12648782 8个月前0
用法杂不对呢?yfarer 8个月前0
草稿id无法下载,是什么问题?