安全限制下的顶级AI:Claude Fable 5 为何连入门生物题都不愿回答?

Anthropic 近期正式推出了旗下最新一代人工智能模型Claude Fable5。作为目前面向公众开放的最强 AI 之一,它在生物学、网络安全等方向的能力原本被寄予厚望。但在实际体验中,这款模型却出现了类似“选择性失忆”的表现:哪怕只是高中层面的基础生物问题,它也经常直接拒答,并把相关请求转交给上一代旗舰模型Claude Opus4.8

出现这种情况,并不是因为模型本身做不到,而是 Anthropic 基于极高安全要求主动加上的限制。作为Mythos级模型,Claude Fable5拥有很强的复杂任务处理能力,但同时也存在较高的被滥用风险。在研发和上线阶段,Anthropic 将生物学内容列为重点防护区域,相关安全策略甚至可以说谨慎到了偏严的程度。

image.png

从实际测试结果来看,这种保守做法带来的副作用已经很明显。无论是介绍细胞中线粒体的作用、解释花粉过敏的原因,还是说明哮喘药物的基本原理这类无害常识,Claude Fable5都会选择拒绝作答。甚至像埃博拉病毒这样的公共卫生话题,也一样会触发它的拦截机制。这种“统一拦截”的方式,让不少本来具有科普价值和学术意义的正常交流无法继续。

对于这一点,Anthropic 的回应是,核心目标在于防止不法用户借助先进 AI 进行高风险生物研究,例如设计生物武器。公司发言人帕鲁尔・马赫什瓦里表示,为了让模型尽快上线,团队最终采用了非常保守的安全方案,同时也承认当前确实存在不少误判问题。

相比之下,Claude Fable5在化学和网络安全领域的限制明显更灵活一些。虽然它依旧会拒绝提供炸药制作流程或炭疽杆菌培养方法等高危内容,但面对氯气用途、密码安全以及物理学常识等中性技术问题时,模型通常可以正常回答。只有当话题涉及剧毒物质等特别敏感的场景时,它才会调用上一代模型协助处理。

目前,Anthropic 正在持续优化识别机制,希望尽量减少误判情况。与此同时,公司也计划未来面向生物医学领域的专业用户,推出可放宽这类限制的特定版本,以便在科研效率和公共安全之间找到更合适的平衡点。这种“受限开放”的发布方式,或许正体现了当下顶尖 AI 模型在追求高性能与严格安全之间所面临的现实取舍。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享