OpenAI 心理安全负责人离职,加盟对手 Anthropic:继续攻坚 AI 伦理与对齐挑战

OpenAI 负责心理健康与安全研究的核心成员安德莉亚·瓦隆内(Andrea Vallone)已宣布离职。她在 OpenAI 任职近三年,参与推动GPT-4GPT-5相关的模型安全策略,如今加盟竞争对手Anthropic的对齐团队,并将直接向此前因安全理念分歧离职的 Jan Leike 汇报。

瓦隆内聚焦的研究议题在过去一年饱受争议。随着聊天式 AI 走入大众生活,部分用户对系统产生过度情感依赖,甚至出现因 AI 影响诱发的青少年自杀等极端心理健康事件,让厂商面临沉重的法律与社会伦理压力。在 OpenAI 期间,她致力于探索模型在识别用户心理危机信号时应如何科学回应,并参与打造多种业界通行的安全训练方案。

此次变动也折射出 AI 领域顶尖人才对“安全文化”的再度选择。Anthropic方面称,公司正高度关注 AI 系统行为的对齐问题,而瓦隆内希望在新的环境中借助微调技术,持续完善Claude的安全行为准则。

划重点:

  • 🔄 人才动态:OpenAI 心理安全负责人瓦隆内离开并加入Anthropic,继续与前主管 Jan Leike 合作推进 AI 安全。

  • ⚠️ 关键问题:研究重点在于 AI 如何识别并回应用户的情感依赖与心理危机信号,力图在技术层面降低社交与生命安全风险。

  • 🛡️ 战略方向:Anthropic通过吸纳 OpenAI 安全团队核心成员,进一步巩固其在 AI 对齐(Alignment)与伦理安全领域的竞争力。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享