OpenAI 心理安全负责人离职，加盟对手 Anthropic：继续攻坚 AI 伦理与对齐挑战-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

OpenAI 负责心理健康与安全研究的核心成员安德莉亚·瓦隆内（Andrea Vallone）已宣布离职。她在 OpenAI 任职近三年，参与推动GPT-4与GPT-5相关的模型安全策略，如今加盟竞争对手Anthropic的对齐团队，并将直接向此前因安全理念分歧离职的 Jan Leike 汇报。

瓦隆内聚焦的研究议题在过去一年饱受争议。随着聊天式 AI 走入大众生活，部分用户对系统产生过度情感依赖，甚至出现因 AI 影响诱发的青少年自杀等极端心理健康事件，让厂商面临沉重的法律与社会伦理压力。在 OpenAI 期间，她致力于探索模型在识别用户心理危机信号时应如何科学回应，并参与打造多种业界通行的安全训练方案。

此次变动也折射出 AI 领域顶尖人才对“安全文化”的再度选择。Anthropic方面称，公司正高度关注 AI 系统行为的对齐问题，而瓦隆内希望在新的环境中借助微调技术，持续完善Claude的安全行为准则。

划重点: