主要内容
Anthropic今日推出Claude Sonnet 5模型,并恢复Fable和Mythos前沿模型的访问权限,结束因美国政府出口管制审查引发的18天运营暂停。此前6月12日的政府指令要求暂停其最高能力系统,直接原因为亚马逊研究人员发现Fable 5存在安全控制被绕过漏洞,可能导致模型识别软件漏洞并提供利用代码。
为解决此问题,Anthropic开发了自动安全分类器,针对亚马逊报告的特定绕过机制训练,可识别含恶意意图统计概率的提示,99%以上测试中能阻止该利用技术。该系统设置宽安全边际,误判良性请求时自动路由至较旧架构(如Claude Opus 4.8)维持连续性。
新模型Sonnet 5成为商业焦点,工程团队正将自主代理迁移至此以降低成本,同时保持高执行能力。性能数据显示,其SWE-bench Pro得分为63.2%,Terminal-Bench 2.1达80.4%,成本仅为Opus 4.8的60%,可独立处理多步骤计划、终端环境及网页浏览操作,无需人工干预。
实际部署中,Rakuten、Zapier等企业已应用该模型。例如,Zapier将多阶段行政任务迁移至此,实现端到端执行;Rakuten优化代码审查流程,减少人工干预,系统能独立完成复杂调试与任务规划。