Anthropic今天发布了Claude Fable 5,这是其Mythos级模型的第一个公开可用版本,同时发布的还有Claude Mythos 5——面向关键基础设施组织的无限制企业版。这是该公司向公众提供的最强模型。
Fable 5相较于仅两周前发布的Claude Opus 4.8有了显著飞跃。Opus 4.8以其诚实和自我质疑著称,而Fable 5则直接以自主性和多步执行作为其核心差异化优势。
Fable 5带来什么
该模型默认拥有100万token的上下文窗口,每次请求可生成多达12.8万token的输出。在基准测试中,数据令人瞩目:
- SWE-bench Pro上达到80.3%,远超GPT-5.5(58.6%)和Gemini 3.1 Pro(54.2%)
- Frontier Code Diamond上达到29.3%,几乎是GPT-5.5(5.7%)的6倍,是Opus 4.8(13.4%)的两倍以上
- 在视觉、金融和科学推理基准测试中达到SOTA水平
价格为每百万输入token 10美元,每百万输出token 50美元,约为Opus 4.8成本的两倍。但这仍不到Claude Mythos Preview价格的一半。
关键能力
自主软件工程。 Stripe报告称,Fable 5将数月工程压缩为几天。在一个5000万行Ruby代码库中,该模型在一天内完成了通常需要整个团队完成的完整迁移。
最先进的视觉能力。 Fable 5能从详细的科学图表中提取精确数字,并能根据截图重建完整的Web应用。在一次演示中,它仅凭游戏截图完整通关了《宝可梦 火红》,没有使用地图或导航辅助。
记忆与自主性。 该模型能在包含数百万token的长任务中保持专注。当赋予其基于文件的持久化记忆时,其性能提升幅度是Opus 4.8的三倍以上。
护栏与安全
Fable 5包含安全屏障,在网络安全、生物学、化学和模型蒸馏等高风险领域阻止相关回答。在这些类别中,模型会自动将查询重定向到Claude Opus 4.8。
据Anthropic称,这些护栏在不到5%的会话中被触发。该公司将这种方法描述为”设计上的安全”——最强大的模型需要最严格的保护。
企业版Mythos 5没有这些限制,面向管理关键基础设施的组织开放,并与美国政府合作提供。
可用性与定价
Fable 5今天已在Claude API和基于消费的企业计划中可用。订阅方面:
- 截至6月22日: Pro、Max、Team和企业计划用户无需额外费用即可使用
- 从6月23日起: 将需要使用积分,计划尽快将其恢复为标准功能
这意味着什么
Fable 5的发布标志着一个转折点。Anthropic在隐晦地表明,原始能力已不再是问题——问题在于如何安全地部署它。面向特定合作伙伴的无限制版Mythos 5和面向公众的受限版Fable 5并存,创造了一种双速模式,其他实验室很可能会效仿。
对于开发者而言,Fable 5开启了真正长期自动化的可能性,而这以前需要复杂的基础设施。尽管价格高于Opus 4.8,但对于以前需要整支人类团队完成的任务而言,它仍然具有竞争力。