人工智能公司 Anthropic 正式推出其全新旗舰模型 Claude Opus4.5。官方介绍称,这一模型在编码(coding)、agent(智能代理)操作与电脑使用等关键生产力场景中已达到行业顶尖水准,同时在科研、演示文稿与电子表格等常见任务上也有明显提升。

核心能力:编程、推理与长时任务管理
软件工程实力大幅提升
在真实的软件工程场景测试中,Opus4.5展现出异常出色的表现。Anthropic 称其在复杂、跨系统的 Bug 修复任务里,能够自主推理出修复思路,几乎不需额外提示。在 Terminal Bench 测试中,该模型较上一代 Sonnet4.5的表现提升约15%。 不少开发者表示,Opus4.5在代码迁移与重构上更拿手,推理链更复杂却更高效。
长周期工作与自动化 Agent
Opus4.5支持更长的上下文(context)窗口,据官方页面显示为 200K tokens。 (Anthropic)
Anthropic 在开发平台中加入了 “effort 参数”,开发者可调节模型的计算强度:为追求速度与成本可降低“思考”力度,也能拉满以追求最佳输出。
它在多智能体(multi-agent)任务上的表现也更突出。Anthropic 的评测显示,该模型在复杂 agent 系统中协调子 agent 的能力得到加强,因而显著提升任务完成的质量与效率。

日常办公与生产力工具全面增强
在 Claude 应用端,长对话更不易触及上下文上限:模型会自动概括早期内容,保持对话连贯。 Chrome 扩展第一次向 Max 用户全面开放;此前仅提供试用。Excel 集成也迎来更新:内部评估显示,Opus4.5在复杂财务建模与自动化任务中的准确率约提升20%,效率约提升15%。
在 Claude Code 桌面版中,用户可并行打开多组会话(如分别用于调试、写文档、测试等 Agent 子任务),而 Plan Mode(规划模式)进一步升级:在正式执行前,模型会先给出可编辑的计划文件(如 plan.md),并主动向用户确认关键信息。 (Anthropic)
性能与效率:更强、更省、更灵活
Opus4.5在多项内部基准中表现亮眼,覆盖编码 (SWE-bench)、agent 能力 (τ²-bench)、推理、数学和视觉等多个维度。 在效率方面,新模型显著降低 token 使用。例如,在部分设置下,通过调节 effort 参数,Opus4.5可在保持或超过 Sonnet4.5 表现的同时,输出 token 数减少达 76%。
此外,借助上下文压缩(context compaction)和 memory 管理优化,它在长时间运行时更稳健,适合大型、持续性的 agent 工作流。

安全:对齐与稳健性双重加强
Anthropic 表示,Opus4.5是目前 对齐性 (alignment) 最强、同时也更稳健的前沿模型之一。 在抵御恶意提示注入 (prompt injection) 攻击方面,Opus4.5的防护能力较以往版本更强。Anthropic 称其相比业内其他前沿模型更不易被误导。安全评估覆盖范围广,包含主动与被动的风险路径;完整的评测方法与结果记录在 Opus4.5 的“system card”中。

价格、可用性与开放平台
价格:通过 Claude API 调用 Opus4.5的费用为 每百万输入 tokens5美元,每百万输出 tokens25美元。
可用性:该模型已在 Anthropic 自家应用中上线,并通过 API 面向开发者开放。同时,可在 三大云平台 (Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry) 使用。
使用限制变更:对于已拥有 Opus 访问权限的用户 (如 Max、Team Premium 等),Anthropic 已取消此前对 Opus 模型的使用“封顶(cap)”限制,并上调总体使用额度,便于更广泛地投入日常工作。
影响
-
工程师与开发者:Opus4.5在编码、调试、重构以及大型多 agent 协作方面表现优异,有望明显提升开发效率,减少人工反复介入。
-
企业与办公自动化:凭借对 Excel、Chrome 等工具的集成,企业更容易把 AI 融入日常流程,加速分析与自动化推进。
-
AI 代理 (Agent) 生态:更强的长期推理与 memory 管理,或将推动复杂、长周期 agent 的落地(如流程自动化、客户服务、研发助手等)。
-
安全可信:Anthropic 强调对齐(alignment)与对抗攻击(robustness)的增强,有助于在高责任场景(如企业与关键任务)提升信任度。
Claude Opus4.5 标志着 Anthropic 在 AI 能力与安全性方面的又一次跃升。它不仅在编码和智能代理任务上展现领先实力,还通过更高效率、更灵活的资源使用方式,以及更稳健的对齐机制,为开发者和企业用户带来更强的生产力工具。随着其在云平台上的广泛可用,Opus4.5 有望成为推动下一代 AI 驱动工作流的中坚力量。


















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?