Sakana sfida Claude: ecco Fugu, l’IA che orchestra il
Antropic tira giù la serranda proprio quando serviva di più. Il 12 giugno, l’azienda californiana ha revocato l’accesso pubblico ai suoi modelli più potenti, Claude Mythos 5 e Claude Fable 5, cedendo alle pressioni dei controlli all’esportazione americani. Una mossa che lascia molti sviluppatori e aziende con le mani vuote, costretti a cercare alternative. Ed è qui che entra in scena Sakana, la startup giapponese che ieri notte ha lanciato Fugu, un sistema di orchestrazione multi-agente che promette prestazioni da frontiera senza dipendere da un singolo fornitore.

David Ha, co-fondatore di Sakana e veterano di Google Brain, ha descritto Fugu come una risposta concreta a un problema sempre più urgente nel settore: la concentrazione del potere nelle mani di poche aziende. In un post su X, Ha ha scritto che orchestrare i migliori modelli del mondo per affrontare compiti complessi è possibile, e che un pool di agenti ben coordinati e intercambiabili può competere con modelli ristretti come Fable e Mythos. Ma c’è qualcosa di più profondo dietro questa mossa. Fugu rappresenta una filosofia diversa: anziché confidare nelle infrastrutture critiche di una singola azienda, il sistema costruisce resilienza attraverso la diversità.
Come funziona il pufferfish dell’IA
Immaginatevi Fugu come un direttore d’orchestra che non suona alcuno strumento. Quando riceve un compito complesso, non cerca di risolvere ogni passaggio da solo. Invece, lo scompone, delega i sotto-compiti a un pool di modelli fondazionali specializzati, verifica il lavoro e sintetizza l’output finale. Il sistema stesso è un LLM addestrato a richiamare altri LLM, incluse istanze ricorsive di se stesso. Tutto questo si basa su due articoli di ricerca di Sakana del 2026: TRINITY e The Conductor. L’orchestrazione avviene autonomamente, senza workflow progettati manualmente, e per chi usa il sistema rimane completamente trasparente dietro un semplice endpoint API compatibile con OpenAI.
Sakana offre due varianti per esigenze operative diverse. Fugu è ottimizzato per velocità e bassa latenza, pensato come motore predefinito per chatbot interattivi e integrato direttamente in ambienti di coding. Fugu Ultra, invece, è lo strato flagship per compiti complessi e ad alto rischio: ricerca sull’IA, analisi di cybersecurity, indagini multi-step su brevetti. Entrambe le versioni dispongono di modelli di pricing flessibili. Il Fugu standard usa tariffe dinamiche basate sui modelli sottostanti attivati, mentre Fugu Ultra ha una struttura fissa: cinque dollari per milione di token di input, trenta per milione di output.
I numeri che parlano
I benchmark diffusi da Sakana disegnano un quadro interessante. Su LiveCodeBench, il test open-source che valuta le prestazioni di coding su problemi software regolarmente aggiornati, Fugu Ultra raggiunge 93,2, Fugu base 92,9, e Claude Fable 5 si ferma a 89,8. Su GPQA-D, il test di graduate-level con 198 domande a scelta multipla in biologia, fisica e chimica, entrambe le versioni di Fugu toccano 95,5, superando Claude Mythos Preview che si ferma a 94,6.
Questi risultati non sono marginali. Dimostrano che l’orchestrazione intelligente può compensare, e talvolta superare, le prestazioni di modelli monolitici costruiti con budget e risorse enormi. È un segnale potente per il mercato. Se Sakana manterrà questi standard su benchmarks indipendenti, la narrative che solo i giganti possono fornire IA performante inizierà a sgretolarsi.
La ridondanza nativa come vantaggio strategico
C’è un elemento sottovalutato in Fugu: la ridondanza costruita nel DNA del sistema. Orchestrando modelli da provider diversi, Sakana integra automaticamente un backup nel suo stack IA. Se uno dei fornitori subisce un’interruzione o affronta restrizioni normative improvvise, Fugu può ridirigere il traffico mantenendo l’uptime. Non è una caratteristica tecnica minore. In un mondo dove gli ordini di controllo all’esportazione possono comparire dall’oggi al domani, la resilienza vale oro.
Sakana mantiene segreta la sua proprietà intellettuale più critica: il routing specifico. Il sistema non rivela quali modelli sottostanti vengono selezionati per una query particolare. La documentazione parla genericamente di un pool diversificato di modelli potenti, LLM multipli e modelli specializzati, senza conteggi precisi. È una scelta strategica intelligente. Protegge i segreti commerciali di Sakana pur mantenendo trasparente il contratto di servizio verso l’utente.
Il vero cambio di paradigma
Quello che Sakana propone non è solo una alternativa tecnica. È un ripensamento dei fondamenti su cui costruiamo l’infrastruttura IA moderna. Ha ha descritto questo come il passaggio verso gli Orchestration Models, oltre il paradigma dei modelli sempre più grandi. È una transizione filosofica: dalla potenza grezza alla intelligenza collettiva, dalla concentrazione alla diversità, dalla dipendenza dal singolo fornitore alla resilienza attraverso la varietà.
Il timing di Sakana è quasi perfetto, anche se accidentale. Proprio nel momento in cui Antropic ha chiuso le porte ai suoi modelli più avanzati per questioni geopolitiche, ecco che un’altra azienda propone un’alternativa che trasforma il vincolo in opportunità. Non è che Fugu sia la soluzione universale. Ma dimostra che quando le porte si chiudono da una parte, ingegneri intelligenti trovano sempre il modo di costruire ponti altrove.
Entro i prossimi sei mesi, osserverò tre indicatori critici per capire se Sakana ha veramente cambiato il gioco: primo, l’adozione da parte di aziende che prima usavano Claude in produzione; secondo, la stabilità dei benchmark su test indipendenti e regolarmente aggiornati; terzo, la capacità di mantenere uptime superiore al 99,9% nonostante le volatilità normative globali. Questi numeri diranno molto più di qualsiasi promessa di marketing.
Ripreso da: VentureBeat