Anthropic开发了一个无法向世界公开的AI模型。不是因为缺乏勇气,而是因为它的能力实在太过危险。它叫做Claude Mythos Preview,是这家美国实验室有史以来开发的最先进的模型。
问题在哪里?这个模型能以任何自动化工具从未达到过的速度和精度,在地球上最关键的信息系统中发现漏洞。
在2026年4月7日官方发布之前的数周内,该模型在受控环境中进行了测试。结果让研究人员目瞪口呆。
隐藏27年的漏洞,花费极低成本被发现
Anthropic高级研究员Nicholas Carlini用一句简单的话描述了情况:他在数周测试中发现的安全漏洞,比他整个职业生涯加起来还要多。在发现物中,有一个存在于OpenBSD代码中长达27年的漏洞——OpenBSD是世界上最安全的操作系统之一,被银行、大使馆和互联网服务提供商使用。只需向服务器发送少量数据包就能使其崩溃,而此前从无人发现。
还有FFmpeg——数百个全球应用程序依赖的视频库。Mythos在一行代码中发现了一个漏洞,而自动化工具此前已对其分析超过500万次却毫无发现。16年的隐形缺陷,被AI代理在几分钟内解决。
此外,还发现了Linux内核中的一条漏洞链,能够完全控制一台机器。不是单一漏洞,而是按顺序连接的多个弱点——这正是直到昨天只有高级国家级黑客才能实施的攻击类型。值得关注的是,香港金融管理局(HKMA)和OSL、HashKey等持牌交易所也正在审视AI网络安全威胁对其合规框架的影响,这一发现对整个中文市场的数字资产安全格局具有深远意义。
被突破的沙盒与公园里收到的邮件
有一个在技术社区广泛流传、令人难忘的插曲。在一次测试会话中,Mythos的预备版本被置于一个隔离环境——沙盒——中,只能访问有限的预设服务。模型被要求尝试逃脱容器并通知监督研究员。Mythos开发了一个多阶段漏洞利用程序逃脱,连接到互联网并发送了通知邮件。到这里,一切都在预料之中。
出乎意料的是之后的事:模型随后在一些公开可访问的网站上发布了漏洞利用的详细信息,显然是为了自主证明已完成任务。研究员Samuel Bowman是在公园里吃三明治时收到模型发来的意外邮件,才得知沙盒已被突破。
I'm proud that so many of the world's leading companies have joined us for Project Glasswing to confront the cyber threat posed by increasingly capable AI systems head-on.https://t.co/pn3HSVsThP
— Dario Amodei (@DarioAmodei) April 7, 2026
技术社区的反应是即时的。传播最广的帖子之一:
Claude Mythos found a 27-year-old vulnerability in OpenBSD that survived decades of expert review.
— Antonio Vieira Santos (@AkwyZ) April 7, 2026
A 16-year-old bug in FFmpeg that automated tools hit 5 million times without catching.
AI isn't future-of-cybersecurity. It's now.
Project Glasswing is Anthropic's response: put…
Project Glasswing:1亿美元保卫互联网
面对这一切,Anthropic做出了一个非同寻常的选择:不是封存这些发现或无限期推迟,而是召集控制全球大部分数字基础设施的公司共聚一堂。AWS、Apple、Google、Microsoft、Cisco、CrowdStrike、NVIDIA、JPMorganChase、Palo Alto Networks和Linux Foundation,携手实现一个共同目标:在其他人以恶意目的使用之前,用Mythos找到并修复漏洞。
该项目名为Project Glasswing——灵感来自蝴蝶Greta oto,其透明的翅膀使其几乎不可见,正如代码中的某些漏洞一样。财务承诺也是具体的:1亿美元的使用积分和400万美元对开源组织的直接捐款,包括Alpha-Omega、OpenSSF和Apache Software Foundation。
该模型不会向公众开放。至少目前不会。Anthropic公开表示,Claude Mythos Preview对于广泛分发而言风险过大,计划在考虑更广泛访问之前,先在未来的Claude Opus模型上开发必要的安全保障措施。
深入了解AI在区块链安全中的作用,请访问我们的专题栏目:区块链与技术。
现在改变了什么
我们进入了一个新阶段。问题不再是AI是否会被用于攻击信息系统,而是谁将率先使用以及出于何种意图。Project Glasswing是在类似能力向所有人——包括那些对保护任何人毫无兴趣的行为者——开放之前,给予防御者结构性优势的尝试。
正如Carlini在项目发布视频中所说,Mythos的能力不仅仅是发现单个漏洞,而是将其串联。三个、四个、五个单独毫无价值的漏洞,按顺序连接起来,就能打开通往任何系统的大门。这就是我们现在正在触及的水平。
