4 代人工智能模型在编码和推理方面表现更出色

2025-05-22

新闻要点

Anthropic推出Claude Opus 4和Claude Sonnet 4 AI模型，用于编码等复杂任务。Opus 4能力强，连续工作数小时，编码超竞品；Sonnet 4更经济高效。新模型有新特性，多平台可用，Claude Code工具也发布，公司还将更频繁更新模型。

- Claude Opus 4 连续工作数小时编码超竞品

- Claude Sonnet 4 经济高效提供更精准回应

- 新模型有 “思考总结” 等特性多平台可用

- Claude Code工具发布公司将频繁更新模型

主要内容

Anthropic 推出了 Claude Opus 4 和 Claude Sonnet 4，这是其针对编码任务和解决复杂问题优化的新一代混合推理 AI 模型。据该公司宣布，Claude Opus 4 是迄今最强大的 AI 模型，能够持续处理长时间运行的任务“数小时”。在客户测试中，Anthropic 称 Opus 4 自主运行了 7 小时，极大地拓展了 AI 代理的可能性。该公司还将其新旗舰模型描述为“世界上最好的编码模型”，Anthropic 的基准测试表明，Opus 4 在编码任务和使用网络搜索等“工具”方面优于谷歌的 Gemini 2.5 Pro、OpenAI 的 o3 推理和 GPT-4.1 模型。

Claude Sonnet 4 是一款更实惠且注重效率的模型，更适合一般任务，它取代了 2 月发布的 3.7 Sonnet 模型。Anthropic 称 Sonnet 4 提供“卓越的编码和推理”，同时能提供更精确的响应。该公司补充说，与 3.7 Sonnet 相比，这两个模型在完成任务时采取捷径和漏洞的可能性降低了 65%，并且在开发人员提供本地文件访问权限时，更擅长存储长期任务的关键信息。

为 Claude 4 模型引入的一个新功能是“思考总结”，它将聊天机器人的推理过程浓缩为易于理解的见解。还推出了一个“扩展思考”功能的测试版，允许用户在推理模式或使用工具模式之间切换，以提高响应的性能和准确性。

Claude Opus 4 和 Sonnet 4 可在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 平台上使用，并且这两个模型都包含在付费的 Claude 计划中，同时还包含扩展思考测试版功能。目前，免费用户只能访问 Claude Sonnet 4。

除了新模型外，Anthropic 的 Claude Code 代理命令行工具在 2 月有限预览后现已全面可用。Anthropic 还表示，随着公司努力跟上 OpenAI、谷歌和 Meta 的竞争，它将转向提供“更频繁的模型更新”。

4 代人工智能模型在编码和推理方面表现更出色

新闻要点

主要内容

关于我们