Anthropic为网络合作伙伴提供Mythos升级,为其他用户提供“安全”版本 - AI News
Anthropic为网络合作伙伴提供Mythos升级,为其他用户提供“安全”版本

Anthropic为网络合作伙伴提供Mythos升级,为其他用户提供“安全”版本

2026-06-09

新闻要点

周二,Anthropic发布Claude Fable 5与Claude Mythos 5两款AI模型,能力优于4月推出的Mythos预览版。Mythos 5仅限行业伙伴及美国政府合作推出;Fable 5公开但设安全护栏,将网络安全等敏感问题及疑似蒸馏请求转至Claude Opus 4.8,目前防护机制偏谨慎,未来计划优化分类器精度。

- Anthropic发布两款AI模型,能力超4月预览版

- Mythos 5仅限行业伙伴及美国政府合作推出

- Fable 5设护栏,敏感请求转至Claude Opus 4.8

- 计划通过可信访问程序扩展Mythos级能力

- 模型可发现软件漏洞,需强化安全防护

主要内容

Anthropic周二发布了两款新AI模型Claude Fable 5和Claude Mythos 5。其中,Mythos 5仅向部分科技行业合作伙伴有限开放,而Fable 5面向公众发布。新模型能力较4月发布的Mythos Preview模型显著提升,但Anthropic通过防护机制平衡安全与功能。

Fable 5设置了多重“护栏”:涉及网络安全、生物或化学领域的请求,或检测到用户试图对其进行“蒸馏训练”(基于大模型响应训练小模型)时,相关请求将重定向至旧模型Claude Opus 4.8处理。

Anthropic产品管理负责人Diane Penn表示,团队自4月发布Mythos Preview以来,通过测试和用户反馈不断优化策略。“我们优先确保安全,部分看似合理的请求可能被路由至能力较弱的模型。”Penn称,尽管机制仍需迭代,但目前方案已能为用户提供Fable 5的最大价值。

Mythos 5仅向Project Glasswing合作伙伴和部分生物研究人员开放,直至信任访问计划推出后扩大。Anthropic强调,需在更广泛发布前建立防护,防范AI被用于开发黑客工具,这也是全球科技公司和政府提前加固软件防御的原因。

Anthropic指出,从4月起就致力于安全发布策略,称“当前选择虽非完美,但仍是最佳方案”。Penn补充,未来将逐步提升分类器精度,确保用户在安全前提下获得最大价值。