日本初创公司Sakana AI声称,无需构建一个庞大的模型,就能媲美全球顶级人工智能系统。2026年6月22日。Sakana AI正式发布Fugu,这是一套不追求成为最智能模型、而专注于成为最佳“指挥家”的系统。其核心承诺更具锋芒:在规避出口管制风险的同时,实现前沿级别的能力。
为何这一理念值得关注
说白了,Fugu挑战了“规模越大越好”的传统认知。它并非拥有数千亿参数的庞然大物,而是一个仅有70亿参数的编排器,名为Conductor。Conductor被训练专注于做一件事:理解请求,判断是独立作答,还是将任务分派给一组专家模型,再对结果进行整合与验证。对用户而言,整个过程通过一个兼容OpenAI标准的统一接口呈现,就如同与单一模型对话。
Sakana AI背后的创始人阵容颇为耀眼。联合创始人之一Llion Jones是Transformer研究论文的共同作者,而Transformer正是现代AI技术的基石。据报道,该公司估值超过25亿美元,并获得英伟达(NVIDIA)和谷歌(Google)的投资支持。Fugu目前推出两个版本:面向日常使用的标准版,以及针对复杂任务的Fugu Ultra。
数据及其局限性
在基准测试方面,Sakana AI的表态相当自信。根据Sakana AI公布的数据,Fugu Ultra在SWE-Bench Pro上得分73.7分,在TerminalBench上得分82.1分,公司声称该模型可与Anthropic旗下的顶级模型Fable 5和Mythos Preview相抗衡。不过,这里必须保持审慎态度。上述数字均由Sakana AI单方面披露,尚未经过独立机构核实;竞争对手的分数同样来自各家自行公布的数据。尤其值得注意的是,在SWE-Bench Pro上,Fable 5的得分仍高于Fugu Ultra。总体而言,Fugu是一个具有竞争力的模型,而非一骑绝尘的主导者。
Fugu Ultra与顶级模型对比(LiveCodeBench)
数据由Sakana AI公布,未经独立机构核实。2026年6月
战略意图:绕开出口管制
这则新闻真正的重心不在于分数,而在于战略布局。Fugu的核心优势在于其模型团队具备可互换性:若某个供应商因政策决定或封锁而停止服务,系统将把请求路由至其他模型。Sakana AI对此直言不讳,并援引了近期Anthropic旗下Fable和Mythos模型因美国政府出口管制指令而遭暂停服务一事作为例证。
公司的逻辑清晰而直接:对于任何组织或国家而言,在关键基础设施上依赖单一服务商的API,已是真实存在的安全隐患,而非假设性风险。对于被美国出口管制排除在顶级模型之外的国家,一套能够绕过障碍进行路由的系统,便成了一条出路。熟悉加密货币世界的读者对这种逻辑并不陌生:对单点控制的警惕。以及去中心化分布所带来的韧性,正是驱动AI智能体及其支付机制的同一套逻辑。

质疑者的声音
外界的反应远未达到一致认可,这恰恰是这个故事的另一面。讨论中最尖锐的问题只有一个:Fugu究竟是真正的新模型,还是一个调用他人API的精巧路由器?批评者指出,Fugu的运行依然依赖美国公司的API,因此并非完全独立,同时对延迟、成本以及对比测试的公正性提出了质疑。
另一方面,Box首席执行官Aaron Levie在其公开发言中认为,这种将智能路由至最优模型的中间层本身具有独特价值。宾夕法尼亚大学教授Ethan Mollick则将其描述为“速度偏慢、但最终有效”。真相或许如常:理念精彩,疑点犹存。
Fugu的赌注是:AI的未来不仅在于打造最大的模型,更在于编排最好的模型。对于日本而言,相较于美国和中国在算力上的巨大差距,这是一种无需巨头预算即可保持竞争力的路径。无论Fugu最终是一次真正的突破,还是一个精心设计的外壳,它都指向了一个切实的转变:价值从“生产智能”的层级,向“调度智能”的层级迁移。这与让网络比单点控制更具韧性的逻辑如出一辙。产品详情可参阅Sakana AI官方页面,独立报道可见于日经亚洲。更多AI动态,请关注我们的人工智能专栏。
