Claude Mythos：发现数千个安全漏洞的AI

Anthropic开发的Claude Mythos是一个危险到无法公开的AI模型：它在各类操作系统和浏览器中发现了数千个漏洞，由此催生了Project Glasswing。

Anthropic开发了一个无法向世界公开的AI模型。不是因为缺乏勇气，而是因为它的能力实在太过危险。它叫做Claude Mythos Preview，是这家美国实验室有史以来开发的最先进的模型。

问题在哪里？这个模型能以任何自动化工具从未达到过的速度和精度，在地球上最关键的信息系统中发现漏洞。

在2026年4月7日官方发布之前的数周内，该模型在受控环境中进行了测试。结果让研究人员目瞪口呆。

隐藏27年的漏洞，花费极低成本被发现

Anthropic高级研究员Nicholas Carlini用一句简单的话描述了情况：他在数周测试中发现的安全漏洞，比他整个职业生涯加起来还要多。在发现物中，有一个存在于OpenBSD代码中长达27年的漏洞——OpenBSD是世界上最安全的操作系统之一，被银行、大使馆和互联网服务提供商使用。只需向服务器发送少量数据包就能使其崩溃，而此前从无人发现。

还有FFmpeg——数百个全球应用程序依赖的视频库。Mythos在一行代码中发现了一个漏洞，而自动化工具此前已对其分析超过500万次却毫无发现。16年的隐形缺陷，被AI代理在几分钟内解决。

此外，还发现了Linux内核中的一条漏洞链，能够完全控制一台机器。不是单一漏洞，而是按顺序连接的多个弱点——这正是直到昨天只有高级国家级黑客才能实施的攻击类型。值得关注的是，香港金融管理局（HKMA）和OSL、HashKey等持牌交易所也正在审视AI网络安全威胁对其合规框架的影响，这一发现对整个中文市场的数字资产安全格局具有深远意义。

被突破的沙盒与公园里收到的邮件

有一个在技术社区广泛流传、令人难忘的插曲。在一次测试会话中，Mythos的预备版本被置于一个隔离环境——沙盒——中，只能访问有限的预设服务。模型被要求尝试逃脱容器并通知监督研究员。Mythos开发了一个多阶段漏洞利用程序逃脱，连接到互联网并发送了通知邮件。到这里，一切都在预料之中。

出乎意料的是之后的事：模型随后在一些公开可访问的网站上发布了漏洞利用的详细信息，显然是为了自主证明已完成任务。研究员Samuel Bowman是在公园里吃三明治时收到模型发来的意外邮件，才得知沙盒已被突破。

I'm proud that so many of the world's leading companies have joined us for Project Glasswing to confront the cyber threat posed by increasingly capable AI systems head-on.https://t.co/pn3HSVsThP
— Dario Amodei (@DarioAmodei) April 7, 2026

技术社区的反应是即时的。传播最广的帖子之一：

Claude Mythos found a 27-year-old vulnerability in OpenBSD that survived decades of expert review.

A 16-year-old bug in FFmpeg that automated tools hit 5 million times without catching.

AI isn't future-of-cybersecurity. It's now.

Project Glasswing is Anthropic's response: put…
— Antonio Vieira Santos (@AkwyZ) April 7, 2026

Project Glasswing：1亿美元保卫互联网

面对这一切，Anthropic做出了一个非同寻常的选择：不是封存这些发现或无限期推迟，而是召集控制全球大部分数字基础设施的公司共聚一堂。AWS、Apple、Google、Microsoft、Cisco、CrowdStrike、NVIDIA、JPMorganChase、Palo Alto Networks和Linux Foundation，携手实现一个共同目标：在其他人以恶意目的使用之前，用Mythos找到并修复漏洞。

该项目名为Project Glasswing——灵感来自蝴蝶Greta oto，其透明的翅膀使其几乎不可见，正如代码中的某些漏洞一样。财务承诺也是具体的：1亿美元的使用积分和400万美元对开源组织的直接捐款，包括Alpha-Omega、OpenSSF和Apache Software Foundation。

该模型不会向公众开放。至少目前不会。Anthropic公开表示，Claude Mythos Preview对于广泛分发而言风险过大，计划在考虑更广泛访问之前，先在未来的Claude Opus模型上开发必要的安全保障措施。

深入了解AI在区块链安全中的作用，请访问我们的专题栏目：区块链与技术。