AI Agents

Claude Fable 5, prime impressioni: il punto di vista di un operatore

Alejandro Rioja

11 giugno 2026 8 min di lettura

TL;DR

Fable 5 è il modello più capace di Anthropic e si vede nel lavoro agentico difficile e a lungo orizzonte, ma non è l'aggiornamento predefinito. Costa di più per token, usa un nuovo tokenizer che gonfia i tuoi conteggi di token di circa il 30%, esegue un thinking sempre attivo che non puoi disabilitare e può rifiutare richieste a livello di classificatore. Per la maggior parte dei carichi di lavoro Opus 4.8 resta la scelta giusta. Punta su Fable 5 quando il compito è davvero difficile.

Newsletter gratuita

Ogni mercoledì. 28.400+ operatori. Zero riempitivo.

Indice

Aggiornato a giugno 2026.

TL;DR: Fable 5 è il modello più capace di Anthropic e si vede nel lavoro agentico difficile e a lungo orizzonte, ma non è l’aggiornamento predefinito. Costa di più per token, usa un nuovo tokenizer che gonfia i tuoi conteggi di token di circa il 30%, esegue un thinking sempre attivo che non puoi disabilitare e può rifiutare richieste a livello di classificatore. Per la maggior parte dei carichi di lavoro Opus 4.8 resta la scelta giusta. Punta su Fable 5 quando il compito è davvero difficile.

[La lettura dell’operatore] Gestisco oltre 30 agenti in produzione tra un brand di consulenza e una struttura per il pickleball, quindi un nuovo modello di punta per me non è un benchmark: è una voce di costo e una migrazione. Ecco cosa è cambiato quando ho effettivamente collegato Fable 5 ad alcuni di loro, e dove invece ho lasciato Opus 4.8 al suo posto.

Cos’è davvero Fable 5

Claude Fable 5 è il modello più capace che Anthropic abbia distribuito su larga scala. È pensato per l’estremità più esigente dello spettro: ragionamento profondo e lavoro agentico a lungo orizzonte, le esecuzioni in cui un agente deve tenere insieme un piano lungo decine di chiamate a strumenti senza perdere il filo.

La superficie dell’API è quasi identica a quella di Opus 4.7/4.8, il che ne ha reso facile il test. Finestra di contesto da 1M di token per impostazione predefinita, fino a 128K token di output per richiesta. Se hai costruito qualcosa sulla recente linea Opus, la forma della richiesta ti è familiare. Le differenze stanno nei dettagli, e nei dettagli si annidano i soldi e le sorprese.

Una nota sui nomi, così non ti confondi: Mythos 5 è lo stesso modello — stesse capacità, stesso prezzo, stesso comportamento — disponibile solo tramite il programma Project Glasswing di Anthropic. Se non fai parte di quel programma, il modello che ti serve è claude-fable-5. Tutto ciò che segue vale per entrambi.

Dove è davvero migliore

Gli ho lanciato per primo il mio compito agentico più ostico: un’esecuzione in più passaggi di ricerca e sintesi che legge un mucchio di fonti, verifica le affermazioni incrociandole e scrive un brief con le citazioni. È il tipo di lavoro in cui i modelli più deboli vanno alla deriva: dopo una decina di chiamate a strumenti perdono il conto di quale affermazione provenisse da quale fonte.

Fable 5 ha tenuto il filo. La sintesi era più stringata, le citazioni sono rimaste agganciate alle affermazioni giuste e ha colto due contraddizioni tra le fonti su cui la mia versione con Opus 4.8 era passata sopra in sordina. Sul ragionamento lungo e strutturato è un vero salto di qualità, non un marginale aumento nei benchmark.

Questa è l’argomentazione onesta a suo favore. Se la modalità di fallimento del tuo agente è “si sgretola sul 10% più difficile”, Fable 5 riduce quel divario. Se il tuo agente riassume newsletter o redige post per i social, la differenza non la sentirai — e pagherai per una capacità che non stai usando.

L’insidia sui costi di cui nessuno ti avverte

Ecco quella che ti coglierà alla sprovvista se scorri di fretta le note di rilascio. Fable 5 arriva con un nuovo tokenizer, e gli stessi contenuti si tokenizzano in circa il 30% di token in più rispetto alla linea Opus.

Rileggilo, perché si combina con il prezzo. Fable 5 ha già di per sé un prezzo superiore alla fascia Opus (10 dollari per milione di token in input, 50 dollari per milione in output). Ora aggiungi un’inflazione dei token di circa il 30% sopra ogni prompt e ogni completamento. Un carico di lavoro invariato — stessi prompt, stessi output — può costare sensibilmente di più dopo la migrazione, prima ancora che tu abbia cambiato una sola cosa di ciò che fa l’agente.

Quindi non riutilizzare i tuoi vecchi numeri. Le tue impostazioni di max_tokens, i tuoi budget per la finestra di contesto, le tue stime di costo per esecuzione — erano tutti misurati su un tokenizer diverso. La buona notizia: l’endpoint di conteggio dei token restituisce i conteggi con entrambi i tokenizer quando passi model: "claude-fable-5", così puoi misurare lo scarto sui tuoi prompt reali prima di cambiare qualsiasi cosa.

bash

# Measure the tokenizer delta on YOUR prompt before migrating.
# The response includes input_tokens (new) AND input_tokens_prior_tokenizer (old).
curl https://api.anthropic.com/v1/messages/count_tokens \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{ "model": "claude-fable-5", "messages": [{"role":"user","content":"<your real prompt>"}] }'

L’ho eseguito per primo sui miei prompt più pesanti. Lo scarto non era uniforme — varia in base al contenuto — ma “metti a budget circa il 30% in più, poi aggiungi il sovrapprezzo” era il modello mentale giusto.

Il thinking è sempre attivo — e non puoi disattivarlo

Su Fable 5, il thinking adattivo è sempre in funzione. L’unica nuova breaking change rispetto alla linea Opus: se invii un esplicito thinking: {type: "disabled"}, ottieni un 400. La soluzione è semplice — basta omettere del tutto il parametro thinking — ma se avevi del codice che disabilitava esplicitamente il thinking per chiamate veloci ed economiche, quel codice ora va in errore.

Inoltre non ricevi indietro la catena di ragionamento grezza. Fable 5 la protegge: ricevi normali blocchi thinking e puoi chiedere un riepilogo leggibile con display: "summarized", ma il ragionamento non filtrato non viene mai esposto. Per la maggior parte delle applicazioni non è un problema — leggi il riepilogo se ti serve visibilità. Il punto in cui conta sono gli agenti multi-turno: quando prosegui una conversazione sullo stesso modello, devi rispedire i blocchi di thinking invariati. Se li elimini o li modifichi, il turno si rompe. Se stai costruendo loop agentici, tratta i blocchi di thinking come token opachi da riportare avanti alla lettera.

I rifiuti ora sono un problema di control-flow

Questo è il cambiamento che incide di più su come scrivi il codice attorno al modello. Fable 5 esegue classificatori di sicurezza sulle richieste in arrivo, mirando soprattutto alla biologia di ricerca e a gran parte dei contenuti di cybersecurity. Quando una richiesta viene declinata, ottieni un HTTP 200 di successo con stop_reason: "refusal" — non un errore, non un’eccezione. L’array content potrebbe essere vuoto.

Se il tuo codice fa response.content[0].text senza prima controllare stop_reason, andrà in crash il giorno in cui una richiesta verrà rifiutata. E del lavoro adiacente benigno — strumenti di sicurezza legittimi, compiti nelle scienze della vita — può occasionalmente far scattare un falso positivo, quindi non è un problema solo per chi fa cose losche.

La regola è: diramare su stop_reason, mai su stop_details.

typescript

const res = await client.messages.create({
  model: "claude-fable-5",
  max_tokens: 1024,
  messages,
});

if (res.stop_reason === "refusal") {
  // classifiers declined — content is empty or partial. Don't read content[0].
  await handleRefusal(res);
} else {
  console.log(res.content[0].text);
}

Per la produzione c’è una strada più pulita: un parametro fallbacks lato server (in beta) che riprova automaticamente una richiesta rifiutata su claude-opus-4-8 nello stesso giro di richiesta, applicando una riprezzatura in stile credito. Se gestisci agenti senza supervisione, predisponilo così che un singolo rifiuto da falso positivo non mandi a sbattere un’intera esecuzione. È la stessa lezione che continuo a re-imparare sugli agenti che continuano a fallire in produzione: il fatto che il modello diventi più intelligente non elimina la necessità di gestire i suoi casi limite — li sposta soltanto altrove.

Altri due dettagli sulla migrazione

Un paio di cose più piccole che mi sono costate tempo, perché non costino il tuo:

Niente prefill dell’assistente. Se guidavi l’output precompilando l’ultimo turno dell’assistente, quel pattern non c’è più. Usa invece output strutturati (output_config.format) o istruzioni nel system prompt.
La retention dei dati a 30 giorni è obbligatoria. Fable 5 non è disponibile in modalità zero-data-retention. Se sei in ZDR per ragioni di conformità, Fable 5 è fuori discussione e Opus 4.8 resta il tuo tetto. Verificalo prima di pianificare una migrazione, non dopo.

Conviene davvero passare?

Ecco il mio verdetto da operatore dopo averci convissuto. Fable 5 non è l’obiettivo predefinito del “aggiorna all’ultimo modello”: lo è Opus 4.8. La cosa sorprende le persone, ma è l’inquadramento giusto. Opus 4.8 è un semplice cambio di model-ID rispetto a 4.7, senza nuove breaking change, costa meno, e per la stragrande maggioranza del lavoro agentico è indistinguibile nella qualità dell’output.

Fable 5 si guadagna il suo posto sui compiti davvero difficili: agenti a lungo orizzonte che devono restare coerenti lungo molti passaggi, ragionamento profondo su più fonti, le esecuzioni in cui il fallimento che vuoi eliminare è sottile. Per questi, la capacità è reale e vale il sovrapprezzo. Per tutto il resto — redazione di contenuti, classificazione, routing, sintesi — stai pagando più token a un prezzo più alto per una qualità che non riesci a percepire.

Alla fine ho finito per usarli entrambi. Il mio agente di ricerca e sintesi è passato a Fable 5. Tutto il resto è rimasto su Opus 4.8. È proprio questa la divisione che conta: scegli il modello per ogni compito, non per moda. Se gestisci una flotta di agenti, vale la stessa disciplina di cui ho scritto nel mio stack da operatore del 2026: instrada il lavoro difficile verso il modello costoso e smetti di pagare troppo per quello facile.

La conclusione dell’operatore

Testa Fable 5 sul tuo singolo compito più difficile prima di toccare qualsiasi altra cosa — è lì che ripaga, e se lì non sposta l’ago della bilancia, non lo farà da nessuna parte. Esegui il contatore di token sui tuoi prompt reali, così l’inflazione del tokenizer di circa il 30% e il sovrapprezzo non ti sorprendano sulla fattura. Aggiungi un controllo su stop_reason: "refusal" (o il fallback lato server verso Opus 4.8) ovunque Fable 5 tocchi la produzione. Poi instrada con criterio: Fable 5 per il 10% difficile, Opus 4.8 per il resto. Il modello migliore non è quello più capace — è quello adatto al compito.

Continua a leggere

AI Agents

Agenti IA con Supervisione Umana: Quando Costruire un Cancello di Approvazione (e Quando No)

Aggiornato per il 2026. Il framework decisionale che uso per determinare quando un agente IA in produzione ha bisogno di una fase di approvazione umana — e quando aggiungerne una uccide silenziosamente l'adozione.

AI Agents

Claude Tool Use: Come Do Capacità Reali ai Miei Agenti IA

Aggiornato per il 2026. Il tool use di Claude permette al tuo agente di compiere azioni oltre la generazione di testo. Il pattern TypeScript che uso in 15+ agenti di produzione su Cloudflare Workers — definisci strumenti, gestisci i blocchi tool_use, restituisci risultati puliti.

AI Agents

Claude vs ChatGPT per le Aziende nel 2026: Il Punto di Vista Onesto di un Operatore

Aggiornato per il 2026. Gestisco oltre 30 agenti IA in produzione su Claude. Ecco il mio confronto onesto tra Claude e ChatGPT per il business — dove ciascuno vince, dove fallisce e come scegliere quello giusto per il tuo stack.

Continua a leggere

Ricevi il manuale dell'IA nella tua casella di posta

Ogni mercoledì. 28.400+ operatori. Zero riempitivo.

Claude Fable 5, prime impressioni: il punto di vista di un operatore

Indice

Cos’è davvero Fable 5

Dove è davvero migliore

L’insidia sui costi di cui nessuno ti avverte

Il thinking è sempre attivo — e non puoi disattivarlo

I rifiuti ora sono un problema di control-flow

Altri due dettagli sulla migrazione

Conviene davvero passare?

La conclusione dell’operatore

Articoli correlati

Agenti IA con Supervisione Umana: Quando Costruire un Cancello di Approvazione (e Quando No)

Claude Tool Use: Come Do Capacità Reali ai Miei Agenti IA

Claude vs ChatGPT per le Aziende nel 2026: Il Punto di Vista Onesto di un Operatore

Ricevi il manuale dell'IA nella tua casella di posta