AI公司 Anthropic 今日正式带来了第五代 Claude 系列的两款新模型:面向大众与通用场景的 Claude Fable5,以及聚焦专业领域应用的 Claude Mythos5(现已结束预览测试)。这两款模型建立在同一底层模型之上,但在安全策略和使用方向上有明显区分。
编程与通识能力:Fable5表现非常突出
作为通用型模型,Claude Fable5在多项主流评测中都拿到了顶尖成绩,尤其在耗时长、难度高的复杂任务里优势更加明显:
-
软件工程能力大幅提升: 在测试模型无辅助完成真实 GitHub 任务的 SWE-Bench Pro 基准中,Fable5拿下了 80.3% 的成绩,明显高于 Claude Opus4.8(69.2%)和 GPT5.5(58.6%)。而在要求更高的生产级编码测试 FrontierCode 中,它也以 29.3% 的分数大幅领先 GPT5.5(5.7%)。
-
实际开发效率惊人: 支付公司 Stripe 表示,Fable5把原本要花5个月完成的工程任务压缩到了几天;在一个包含5000万行 Ruby 代码的项目中,它只用1天就完成了原本整个团队需要两个多月才能做完的迁移工作。
-
知识处理和视觉能力同步提升: Fable5在金融分析(Hebbia 基准)以及图表理解任务中表现出色,IMC 交易集团称它几乎完整通过了内部交易分析测试。在视觉方面,它可以准确提取复杂科学插图中的信息,还能只依靠游戏截图独立打通《精灵宝可梦 火红》,不再需要前代模型依赖的辅助框架。

科学推理与网络安全:Mythos5走向自主研究
和采用较稳健安全防护的 Fable5不同,Claude Mythos5 放开了网络安全等敏感领域的部分限制,主要向指定合作方以及美国政府(通过 Project Glasswing 项目)开放:
-
药物设计效率提升10倍: 在没有人工参与的盲测中,Mythos5可以自己挑选结合位点、调用生物信息学工具,并在出错后自行修正。在14个蛋白质靶点里,它成功为9个生成了有效候选药物。
-
率先具备提出科学假设能力的LLM: 盲法对照结果显示,在约80% 的情况下,科学家更认可 Mythos5给出的分子生物学假设(例如有关大肠杆菌蛋白的新机制,已被独立研究验证)。
-
自主完成基因组学研究: Mythos5在完全没有人工干预的前提下持续运行超过一周,整理了138种动物、数百万细胞的单细胞数据,并训练出自己的机器学习模型,表现超过《科学》(Science)杂志近期发表的模型,同时体积缩小了100倍。
-
强化网络安全能力: 在 ExploitBench 基准中,Mythos5的成绩从预览版的69% 提升到 78%(Opus4.8只有40%),被称作全球领先的网络安全模型之一。
双面效应:更高价格与更严格安全措施
强大能力背后也伴随着明显的成本上涨。Fable5和 Mythos5的价格定为 每百万输入代币(MTok)10美元,每百万输出代币50美元,几乎达到 Claude Opus4.8的两倍。在 Claude.ai 网页订阅方案中,新模型也会按2倍用量来计算。
为了降低 Mythos 级模型可能带来的网络攻击或生物武器风险,Anthropic 在 Fable5里加入了一套新的分类器降级机制:
-
一旦系统识别出涉及网络安全、生物、化学或“提炼(模型能力提取)”等高风险提示词,请求就会自动切换到能力较弱的 Claude Opus4.8模型上处理(影响的会话比例不到5%),同时界面会提示用户。
-
对于意在打造前沿大模型的提示内容(例如预训练流程、分布式训练设计),系统不会直接拒绝,而是通过提示改写、引导向量或 PEFT(参数高效微调)等方式,在不明显提示的情况下限制输出效果。
-
在外部累计超过1000小时的测试里,测试人员没有找到通用型越狱方法,Fable5在攻击任务上的成功率为零。为此,Anthropic 还把数据保留时间增加到了30天,用于识别新型攻击行为。
上线时间安排
目前,Claude Fable5已经通过


















用户38505528 9个月前0
粘贴不了啊用户12648782 10个月前0
用法杂不对呢?yfarer 10个月前0
草稿id无法下载,是什么问题?