数据已经出炉。根据Binance Research于2026年4月发布的EVMbench报告,GPT-5.3-Codex在攻击DeFi智能合约漏洞时成功率达72.2%,而在检测模式下仅为36%。换句话说,同一个AI攻击效能是防御效能的两倍。
核心数据
- GPT-5.3-Codex,攻击模式(EVMbench) 72.2%
- GPT-5.3-Codex,检测模式 36%
- AI驱动诈骗vs传统诈骗收益对比 高出4.5倍
- 每份合约AI攻击平均成本 $1.22
- 专项防御AI(Cecuro)检测率 92%
- 部署链上防火墙的DeFi协议占比 <1%
来源:Binance Research EVMbench · Chainalysis Crime Report 2026 · Cecuro/CoinDesk · 2026年4至5月
来源:Binance Research EVMbench · Chainalysis Crime Report 2026 · Cecuro/CoinDesk · 2026年4至5月
这份基准测试名为EVMbench。据Binance Research 2026年4月报告,该测试对AI模型在两种模式下处理以太坊漏洞合约的表现进行了系统评估:攻击模式(发现并利用漏洞)和检测模式(仅识别漏洞,不加以利用)。差距十分明显,绝非测量误差。GPT-5.3-Codex在攻击模式下达72.2%,在检测模式下仅36%。问题不在于模型「不会防御」,而在于驱动代码分析的推理能力,既能找到逻辑漏洞,也能精准利用它,每次尝试成本仅$1.22。
Chainalysis在《2025-2026年加密犯罪报告》中补充了另一组数据:据该报告,AI驱动的诈骗每案收益比传统诈骗高出4.5倍。原因并非攻击者技术更高超,而是AI能以任何人类团队都无法企及的规模发动攻击。单个攻击者借助AI模型,可同时发起数千次漏洞利用尝试,边际成本几乎为零。率先将AI用于进攻的一方,相对防守方具备结构性优势,且这一优势以数千万美元计。
AI如何攻击DeFi智能合约?
事实上,其原理与安全审计如出一辙,只是方向相反。进入攻击模式的AI智能体所做的事情,与安全审计师完全相同:读取代码、分析数据流、寻找函数交互中的逻辑异常。区别在于最终目标:审计师输出报告,AI智能体构建漏洞利用程序;审计师标记问题,AI直接执行攻击。
~40% of daily code written at Coinbase is AI-generated. I want to get it to >50% by October.
,Brian Armstrong (@brian_armstrong) September 3, 2025
Obviously it needs to be reviewed and understood, and not all areas of the business can use AI-generated code. But we should be using it responsibly as much as we possibly can. pic.twitter.com/Nmnsdxgosp
CoinDesk于2026年2月引用的Cecuro基准测试,此前已在90份真实被攻击合约上验证了同样的不对称性,这些合约在2024年10月至2026年初之间遭受攻击,经核实损失达2.28亿美元。专项安全AI智能体可识别92%的漏洞,而通用GPT-5.1模型仅能发现34%。Cecuro还量化了进展速度:AI进攻能力大约每1.3个月翻倍。DeFi行业中AI防御工具的采用率仍低于10%。差距,事实上,仍在持续扩大。
这种不对称性在本周有了具体的案例。THORChain、Verus Bridge和Echo Protocol在五天内先后遭到攻击,损失超2300万美元。三起攻击均未直接使用AI作为攻击载体,但都利用了AI进攻系统本可在数分钟内识别的漏洞窗口。如需技术细节,SpazioCrypto的Hack专区提供了本周各漏洞利用的完整分析。4月已出现Kelp DAO 2.92亿美元事件和Drift Protocol 2.85亿美元事件,两起漏洞均经过数周精心准备,其系统化程度与AI智能体的推理方式高度吻合。
Very soon there are going to be more AI agents than humans making transactions.
,Brian Armstrong (@brian_armstrong) March 9, 2026
They can't open a bank account, but they can own a crypto wallet. Think about it.
2026年5月11日,Google GTIG确认了首个完全由AI智能体开发的零日漏洞:针对一款开源工具的双因素认证绕过,在团队拦截前已具备大规模利用条件。对于DeFi从业者而言,问题不再是「AI会否被用于攻击」,而是「谁已经在用,用了多久」。在这一方向上,我们关于LLM路由器与钱包安全的文章记录了进攻性AI分发渠道已活跃数月的现状。GPT-5.5在银行用例上的发布以及Coinbase的AI战略转型,都表明行业已清楚下一场战役将在哪里打响。链上安全必须在下一份EVMbench报告以80%攻击成功率出炉之前,得出同样的结论。
差距并非静态。Binance Research已表示,下一轮EVMbench将于2026年7月发布,届时将是衡量DeFi行业是否开始弥合AI攻防能力差距的最精准指标,或者说,72.2%是否只是起点。与此同时,据Cecuro数据,目前不足1%的DeFi协议部署了链上防火墙,90%的协议仍存在可被利用的严重漏洞。正在出售比特币购置AI算力的矿工已经意识到AI才是真正的战场。链上安全领域也必须作出同样的判断。如需持续跟踪DeFi安全动态,SpazioCrypto的Hack专区提供实时更新。
