2026年6月9日,人工智能公司Anthropic正式发布旗下最新旗舰模型Claude Fable 5,这是该公司首次将Mythos级(神话级)AI能力面向公众开放。就在发布当天,Claude Fable 5在全球权威AI竞技场AgentArena榜单中以11.2%的净提升率登顶,创下该榜单有史以来最大分差纪录,一举超越GPT-5.5等所有主要竞争对手,被业界称为"AI行业的历史性时刻"。

Anthropic此前在2026年4月通过名为"透明翼计划"(Project Glasswing)的项目,仅向少数政府机构开放了Mythos级别模型的Preview版本,原因在于这一级别的模型在网络安全和生物化学领域展现出前所未有的跨时代杀伤力。而此次通过创新的动态安全分流架构,Anthropic终于将这种神级算力安全地交付给大众。
一、AgentArena创纪录:11.2%分差超越GPT-5.5
Claude Fable 5最引人瞩目的成绩,是在全球AI竞技场AgentArena的自主智能体任务评测中创下新标杆。该榜单专门评估AI模型在复杂多步骤任务中的自主执行能力,涵盖软件开发、数据分析、视觉推理等高难度场景。Claude Fable 5以11.2%的净提升率大幅领先排名第二的GPT-5.5,刷新了该榜单自设立以来的最大分差纪录。
Anthropic研究团队指出,Fable 5的核心突破在于处理长周期、高复杂度任务的自主工作能力。任务难度和复杂度越高,Fable 5相对其他模型的优势就越明显——这正是神话级模型区别于普通旗舰的核心标志。
二、性能实测:5000万行代码一天搞定
除榜单成绩外,Fable 5在实际测试中也展现出惊人的能力。支付巨头Stripe在早期测试中发现,Fable 5不仅能编写代码,还能自动生成测试程序验证结果,并利用视觉能力对最终输出进行检查,确保与设计目标保持一致。
最具说服力的数据来自代码迁移实测:Fable 5完成5000万行Ruby代码库的迁移工作仅用时1天,而同等工作量的人工团队需要两个多月才能完成。这意味着AI已正式具备替代人类完成企业级大规模工程任务的能力。
三、安全与商业并行:冲刺IPO的技术底牌
Fable 5与Anthropic同时发布的另一款模型Mythos 5共用同一底层基座,但安全管控策略不同。Fable 5内置全新安全防护机制,当检测到特定高风险类型的请求时,系统会将其转交给次强模型Claude Opus 4.8处理。该机制在不到5%的会话中触发,且安全防护体系已完成超1000小时内部越狱测试。
值得注意的是,Claude Fable 5是Anthropic冲刺IPO的核心技术标杆产品。在上市前的关键窗口期发布一款能力大幅领先的新旗舰,对于估值和投资者信心有着重要的支撑作用。Anthropic方面表示,Fable 5现已部署于Claude API、AWS Amazon Bedrock、Google Cloud Vertex AI及Microsoft Foundry等多平台。


