Anthropic于4月16日正式发布Claude Opus 4.7,这是Claude 4系列的最新旗舰更新。该模型在高级软件工程和复杂、长时间运行任务处理能力上较Opus 4.6实现显著提升,用户反馈目前可更自信地将最棘手的编码工作交给它自主完成,无需频繁监督。
Opus 4.7在93项编码基准测试中的任务分辨率比Opus 4.6提升13%,并成功解决了此前Opus 4.6与Sonnet 4.6均未完成的4项任务。在Rakuten-SWE-Bench上,生产级任务解决数量达到前代3倍,代码质量和测试质量均有两位数增长。CursorBench得分从58%升至70%,TBench通过了此前模型无法完成的3项任务,包括修复竞态条件等遗漏问题。模型在指令遵循上更为精准,能在规划阶段捕捉逻辑漏洞,并在输出前自行验证结果,减少工具调用错误约三分之一,同时在多步骤异步工作流、CI/CD和完整系统构建场景下表现更稳定,例如可从零自主构建并验证Rust文本转语音引擎。
视觉能力同步升级,支持长边最高2576像素(约375万像素)的图像输入,视觉敏锐度基准测试准确率从54.5%跃升至98.5%。OfficeQA Pro文档推理错误减少21%,BigLaw Bench高努力模式下准确率达90.9%,金融代理评估也达到当前领先水平。
Opus 4.7现已通过Claude全线产品、API以及Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry等平台全面可用,开发者可使用claude-opus-4-7标识符调用。定价与Opus 4.6保持一致,输入每百万token 5美元,输出每百万token 25美元。同步推出的功能包括新增xhigh努力级别以精细控制推理与延迟、Claude Platform API公开测试版的任务预算功能,以及Claude Code中的/ultrareview斜杠命令。安全层面,模型新增自动检测并阻断高风险网络安全请求的防护机制。
Claude 4系列自2025年5月推出Opus 4和Sonnet 4以来,已通过多次迭代持续强化编码、代理和专业知识工作能力。需注意的是,原版Claude Sonnet 4(claude-sonnet-4-0)和Opus 4(claude-opus-4-0)将于2026年6月15日停止支持,开发者应提前完成迁移。早期用户反映,Opus 4.7在金融分析、法律文档处理等场景下严谨性和专业输出质量更高,成为软件工程与长时程代理任务的实用升级选择。





