主要内容
Anthropic 推出了 Claude Opus 4 和 Claude Sonnet 4,这是其针对编码任务和解决复杂问题优化的新一代混合推理 AI 模型。据该公司宣布,Claude Opus 4 是迄今最强大的 AI 模型,能够持续处理长时间运行的任务“数小时”。在客户测试中,Anthropic 称 Opus 4 自主运行了 7 小时,极大地拓展了 AI 代理的可能性。该公司还将其新旗舰模型描述为“世界上最好的编码模型”,Anthropic 的基准测试表明,Opus 4 在编码任务和使用网络搜索等“工具”方面优于谷歌的 Gemini 2.5 Pro、OpenAI 的 o3 推理和 GPT-4.1 模型。
Claude Sonnet 4 是一款更实惠且注重效率的模型,更适合一般任务,它取代了 2 月发布的 3.7 Sonnet 模型。Anthropic 称 Sonnet 4 提供“卓越的编码和推理”,同时能提供更精确的响应。该公司补充说,与 3.7 Sonnet 相比,这两个模型在完成任务时采取捷径和漏洞的可能性降低了 65%,并且在开发人员提供本地文件访问权限时,更擅长存储长期任务的关键信息。
为 Claude 4 模型引入的一个新功能是“思考总结”,它将聊天机器人的推理过程浓缩为易于理解的见解。还推出了一个“扩展思考”功能的测试版,允许用户在推理模式或使用工具模式之间切换,以提高响应的性能和准确性。
Claude Opus 4 和 Sonnet 4 可在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 平台上使用,并且这两个模型都包含在付费的 Claude 计划中,同时还包含扩展思考测试版功能。目前,免费用户只能访问 Claude Sonnet 4。
除了新模型外,Anthropic 的 Claude Code 代理命令行工具在 2 月有限预览后现已全面可用。Anthropic 还表示,随着公司努力跟上 OpenAI、谷歌和 Meta 的竞争,它将转向提供“更频繁的模型更新”。