Sakana AI发布Fugu：7B编排模型挑战顶级AI巨头

Sakana AI发布70亿参数编排模型Fugu，协调多个顶级LLM协同工作，声称性能媲美Fable 5和Mythos Preview，并可绕开出口管制限制。

日本初创公司Sakana AI声称，无需构建一个庞大的模型，就能媲美全球顶级人工智能系统。2026年6月22日。Sakana AI正式发布Fugu，这是一套不追求成为最智能模型、而专注于成为最佳“指挥家”的系统。其核心承诺更具锋芒：在规避出口管制风险的同时，实现前沿级别的能力。

为何这一理念值得关注

说白了，Fugu挑战了“规模越大越好”的传统认知。它并非拥有数千亿参数的庞然大物，而是一个仅有70亿参数的编排器，名为Conductor。Conductor被训练专注于做一件事：理解请求，判断是独立作答，还是将任务分派给一组专家模型，再对结果进行整合与验证。对用户而言，整个过程通过一个兼容OpenAI标准的统一接口呈现，就如同与单一模型对话。

Sakana AI背后的创始人阵容颇为耀眼。联合创始人之一Llion Jones是Transformer研究论文的共同作者，而Transformer正是现代AI技术的基石。据报道，该公司估值超过25亿美元，并获得英伟达（NVIDIA）和谷歌（Google）的投资支持。Fugu目前推出两个版本：面向日常使用的标准版，以及针对复杂任务的Fugu Ultra。

数据及其局限性

在基准测试方面，Sakana AI的表态相当自信。根据Sakana AI公布的数据，Fugu Ultra在SWE-Bench Pro上得分73.7分，在TerminalBench上得分82.1分，公司声称该模型可与Anthropic旗下的顶级模型Fable 5和Mythos Preview相抗衡。不过，这里必须保持审慎态度。上述数字均由Sakana AI单方面披露，尚未经过独立机构核实；竞争对手的分数同样来自各家自行公布的数据。尤其值得注意的是，在SWE-Bench Pro上，Fable 5的得分仍高于Fugu Ultra。总体而言，Fugu是一个具有竞争力的模型，而非一骑绝尘的主导者。

Fugu Ultra与顶级模型对比（LiveCodeBench）

数据由Sakana AI公布，未经独立机构核实。2026年6月

战略意图：绕开出口管制

这则新闻真正的重心不在于分数，而在于战略布局。Fugu的核心优势在于其模型团队具备可互换性：若某个供应商因政策决定或封锁而停止服务，系统将把请求路由至其他模型。Sakana AI对此直言不讳，并援引了近期Anthropic旗下Fable和Mythos模型因美国政府出口管制指令而遭暂停服务一事作为例证。

公司的逻辑清晰而直接：对于任何组织或国家而言，在关键基础设施上依赖单一服务商的API，已是真实存在的安全隐患，而非假设性风险。对于被美国出口管制排除在顶级模型之外的国家，一套能够绕过障碍进行路由的系统，便成了一条出路。熟悉加密货币世界的读者对这种逻辑并不陌生：对单点控制的警惕。以及去中心化分布所带来的韧性，正是驱动AI智能体及其支付机制的同一套逻辑。

质疑者的声音

外界的反应远未达到一致认可，这恰恰是这个故事的另一面。讨论中最尖锐的问题只有一个：Fugu究竟是真正的新模型，还是一个调用他人API的精巧路由器？批评者指出，Fugu的运行依然依赖美国公司的API，因此并非完全独立，同时对延迟、成本以及对比测试的公正性提出了质疑。

另一方面，Box首席执行官Aaron Levie在其公开发言中认为，这种将智能路由至最优模型的中间层本身具有独特价值。宾夕法尼亚大学教授Ethan Mollick则将其描述为“速度偏慢、但最终有效”。真相或许如常：理念精彩，疑点犹存。

Fugu的赌注是：AI的未来不仅在于打造最大的模型，更在于编排最好的模型。对于日本而言，相较于美国和中国在算力上的巨大差距，这是一种无需巨头预算即可保持竞争力的路径。无论Fugu最终是一次真正的突破，还是一个精心设计的外壳，它都指向了一个切实的转变：价值从“生产智能”的层级，向“调度智能”的层级迁移。这与让网络比单点控制更具韧性的逻辑如出一辙。产品详情可参阅Sakana AI官方页面，独立报道可见于日经亚洲。更多AI动态，请关注我们的人工智能专栏。

作者