Anthropic 发布 Claude Opus4.5：混合推理升级，智能与效率再进阶-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

人工智能公司 Anthropic 正式推出其全新旗舰模型 Claude Opus4.5。官方介绍称，这一模型在编码（coding）、agent（智能代理）操作与电脑使用等关键生产力场景中已达到行业顶尖水准，同时在科研、演示文稿与电子表格等常见任务上也有明显提升。

核心能力：编程、推理与长时任务管理

软件工程实力大幅提升

在真实的软件工程场景测试中，Opus4.5展现出异常出色的表现。Anthropic 称其在复杂、跨系统的 Bug 修复任务里，能够自主推理出修复思路，几乎不需额外提示。在 Terminal Bench 测试中，该模型较上一代 Sonnet4.5的表现提升约15%。不少开发者表示，Opus4.5在代码迁移与重构上更拿手，推理链更复杂却更高效。

长周期工作与自动化 Agent

Opus4.5支持更长的上下文（context）窗口，据官方页面显示为 200K tokens。（Anthropic）

Anthropic 在开发平台中加入了 “effort 参数”，开发者可调节模型的计算强度：为追求速度与成本可降低“思考”力度，也能拉满以追求最佳输出。

它在多智能体（multi-agent）任务上的表现也更突出。Anthropic 的评测显示，该模型在复杂 agent 系统中协调子 agent 的能力得到加强，因而显著提升任务完成的质量与效率。

日常办公与生产力工具全面增强

在 Claude 应用端，长对话更不易触及上下文上限：模型会自动概括早期内容，保持对话连贯。 Chrome 扩展第一次向 Max 用户全面开放；此前仅提供试用。Excel 集成也迎来更新：内部评估显示，Opus4.5在复杂财务建模与自动化任务中的准确率约提升20%，效率约提升15%。

在 Claude Code 桌面版中，用户可并行打开多组会话（如分别用于调试、写文档、测试等 Agent 子任务），而 Plan Mode(规划模式)进一步升级：在正式执行前，模型会先给出可编辑的计划文件（如 plan.md），并主动向用户确认关键信息。 (Anthropic)

性能与效率：更强、更省、更灵活

Opus4.5在多项内部基准中表现亮眼，覆盖编码（SWE-bench）、agent 能力 (τ²-bench)、推理、数学和视觉等多个维度。在效率方面，新模型显著降低 token 使用。例如，在部分设置下，通过调节 effort 参数，Opus4.5可在保持或超过 Sonnet4.5 表现的同时，输出 token 数减少达 76%。

此外，借助上下文压缩（context compaction）和 memory 管理优化，它在长时间运行时更稳健，适合大型、持续性的 agent 工作流。

安全：对齐与稳健性双重加强

Anthropic 表示，Opus4.5是目前 对齐性（alignment） 最强、同时也更稳健的前沿模型之一。在抵御恶意提示注入（prompt injection）攻击方面，Opus4.5的防护能力较以往版本更强。Anthropic 称其相比业内其他前沿模型更不易被误导。安全评估覆盖范围广，包含主动与被动的风险路径；完整的评测方法与结果记录在 Opus4.5 的“system card”中。

价格、可用性与开放平台

价格:通过 Claude API 调用 Opus4.5的费用为 每百万输入 tokens5美元，每百万输出 tokens25美元。

可用性:该模型已在 Anthropic 自家应用中上线，并通过 API 面向开发者开放。同时，可在 三大云平台 （Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry）使用。

使用限制变更:对于已拥有 Opus 访问权限的用户（如 Max、Team Premium 等），Anthropic 已取消此前对 Opus 模型的使用“封顶（cap）”限制，并上调总体使用额度，便于更广泛地投入日常工作。

影响

工程师与开发者:Opus4.5在编码、调试、重构以及大型多 agent 协作方面表现优异，有望明显提升开发效率，减少人工反复介入。
企业与办公自动化:凭借对 Excel、Chrome 等工具的集成，企业更容易把 AI 融入日常流程，加速分析与自动化推进。
AI 代理（Agent）生态:更强的长期推理与 memory 管理，或将推动复杂、长周期 agent 的落地（如流程自动化、客户服务、研发助手等）。
安全可信:Anthropic 强调对齐（alignment）与对抗攻击（robustness）的增强，有助于在高责任场景（如企业与关键任务）提升信任度。

Claude Opus4.5 标志着 Anthropic 在 AI 能力与安全性方面的又一次跃升。它不仅在编码和智能代理任务上展现领先实力，还通过更高效率、更灵活的资源使用方式，以及更稳健的对齐机制，为开发者和企业用户带来更强的生产力工具。随着其在云平台上的广泛可用，Opus4.5 有望成为推动下一代 AI 驱动工作流的中坚力量。