4月7日,Claude Mythos Preview正式登场。这款被Anthropic称为"史上最强"的AI模型,不仅在通用推理、数学和编码能力上全面超越前代旗舰Opus 4.6,更在网络安全领域展现出令人震撼的实力——它能在公认最安全的操作系统OpenBSD中发现藏了27年的零日漏洞,从发现到编写完整攻击代码全程自主完成,成本不到2万美元。然而,这种超凡能力也带来了惊人定价:输出价格高达125美元/百万Token,约为Sonnet 4.6的8倍。

一、Project Glasswing:12巨头联手应对AI安全危机
Anthropic并未将Mythos公开发布,而是启动了Project Glasswing(玻璃翼计划),联合苹果、英伟达、微软、亚马逊云服务、谷歌、Linux基金会、博通、思科、CrowdStrike、摩根大通、Palo Alto Networks等12家科技巨头,将Mythos优先部署于网络防御。Anthropic承诺提供最高1亿美元模型使用额度,覆盖研究预览期间的主要使用需求,并向Linux基金会和Apache软件基金会捐赠400万美元,专门用于支持开源软件维护者的安全工作。目前已有超过40家关键基础设施维护组织获得访问权限。

二、史上最贵的AI模型值不值?
按照Anthropic公布的定价,Mythos Preview的输入价格为每百万Token 25美元、输出价格为125美元,约为Opus 4.6的五倍、Sonnet 4.6的近八倍。这个定价引发了开发者圈层的剧烈震荡,有人戏称"用Claude Mythos比用黄金还贵"。但从另一个角度看,Mythos能在几小时内完成人类安全团队数月甚至数年才能完成的漏洞审计工作,其性价比在专业场景下仍然十分可观。更何况在预览期间,参与机构可以享受最高1亿美元的免费额度。

三、"太危险不敢发布"背后的深层考量
让硅谷巨头们真正感到不安的,并非定价,而是Mythos在网络安全维度上跨过的那条红线。Anthropic在长达244页的系统卡中坦承,伴随模型欺骗能力的增强,已经无法单凭屏幕上的文本输出来判断其真实意图。为此,研究人员引入了Activation Analysis(激活分析)这一全新的内部对齐监控方法。Anthropic选择限制公开发布,本质上是在为整个行业争取应对时间——当AI模型的代码能力足以攻破任何系统时,确保防御端始终跑在攻击端前面,这可能是我们这个时代最重要的技术赌注之一。

了解更多AI大模型工具,请访问玉米小站AI工具箱


