AI Agents

Claude Fable 5 eerste indrukken: de kijk van een operator

Alejandro Rioja

11 juni 2026 7 min lezen

TL;DR

Fable 5 is het meest capabele model van Anthropic en dat merk je bij zware agenttaken met een lange horizon — maar het is niet de standaardupgrade. Het kost meer per token, gebruikt een nieuwe tokenizer die je tokenaantallen met ~30% opblaast, draait altijd-aan thinking die je niet kunt uitzetten, en kan verzoeken weigeren op classifierniveau. Voor de meeste workloads is Opus 4.8 nog steeds de juiste keuze. Grijp naar Fable 5 wanneer de taak echt moeilijk is.

Gratis nieuwsbrief

Elke woensdag. 28.400+ operators. Geen opvulling.

Inhoudsopgave

Bijgewerkt juni 2026.

TL;DR: Fable 5 is het meest capabele model van Anthropic en dat merk je bij zware agenttaken met een lange horizon — maar het is niet de standaardupgrade. Het kost meer per token, gebruikt een nieuwe tokenizer die je tokenaantallen met ~30% opblaast, draait altijd-aan thinking die je niet kunt uitzetten, en kan verzoeken weigeren op classifierniveau. Voor de meeste workloads is Opus 4.8 nog steeds de juiste keuze. Grijp naar Fable 5 wanneer de taak echt moeilijk is.

[Operator-perspectief] Ik draai 30+ agents in productie verspreid over een consultancymerk en een pickleballfaciliteit, dus een nieuw vlaggenschipmodel is voor mij geen benchmark — het is een kostenpost en een migratie. Hier is wat er veranderde toen ik Fable 5 daadwerkelijk in een paar ervan inbouwde, en waar ik Opus 4.8 liet staan.

Wat Fable 5 eigenlijk is

Claude Fable 5 is het meest capabele model dat Anthropic op grote schaal heeft uitgebracht. Het is gericht op het veeleisende eind van het spectrum: diep redeneren en agentwerk met een lange horizon — de runs waarin een agent een plan moet vasthouden over tientallen tool calls zonder de draad kwijt te raken.

Het API-oppervlak is vrijwel identiek aan Opus 4.7/4.8, wat het makkelijk maakte om te testen. Standaard een contextvenster van 1M tokens, tot 128K outputtokens per verzoek. Als je iets hebt gebouwd op de recente Opus-lijn, is de vorm van het verzoek vertrouwd. De verschillen zitten in de details, en in de details zitten het geld en de verrassingen.

Eén opmerking over de naamgeving, zodat je niet in de war raakt: Mythos 5 is hetzelfde model — dezelfde mogelijkheden, dezelfde prijsstelling, hetzelfde gedrag — alleen beschikbaar via het Project Glasswing-programma van Anthropic. Zit je niet in dat programma, dan is het model dat je wilt claude-fable-5. Alles hieronder geldt voor beide.

Waar het echt beter is

Ik gooide eerst mijn zwaarste agenttaak ertegenaan: een research-en-synthese-run in meerdere stappen die een stapel bronnen leest, claims kruislings controleert en een onderbouwde briefing schrijft. Dit is het soort werk waarbij zwakkere modellen afdwalen — ze raken het spoor bijster welke claim van welke bron kwam, zo’n tien tool calls verderop.

Fable 5 hield de draad vast. De synthese was strakker, de bronvermeldingen bleven aan de juiste claims gekoppeld, en het ving twee tegenstrijdigheden tussen bronnen op die mijn Opus 4.8-versie stilletjes had weggemiddeld. Bij lang, gestructureerd redeneren is het een echte stap vooruit — geen marginaal benchmarkstapje.

Dat is het eerlijke argument ervoor. Als de faalmodus van je agent is “valt uit elkaar bij de moeilijke 10%”, dan verkleint Fable 5 die kloof. Als je agent nieuwsbrieven samenvat of socialmediaposts opstelt, zul je het verschil niet voelen — en betaal je voor capaciteit die je niet gebruikt.

De kostenval waar niemand je voor waarschuwt

Hier komt degene die je raakt als je de release notes te snel doorleest. Fable 5 komt met een nieuwe tokenizer, en dezelfde inhoud tokeniseert tot grofweg 30% meer tokens dan op de Opus-lijn.

Lees dat nog eens, want het stapelt op met de prijs. Fable 5 is om te beginnen al hoger geprijsd dan het Opus-niveau ($10 per miljoen inputtokens, $50 per miljoen outputtokens). Leg daar nu een tokeninflatie van ~30% bovenop elke prompt en completion. Een ongewijzigde workload — dezelfde prompts, dezelfde outputs — kan na migratie merkbaar meer kosten, voordat je ook maar iets hebt veranderd aan wat de agent doet.

Dus hergebruik je oude cijfers niet. Je max_tokens-instellingen, je contextvensterbudgetten, je schattingen van kosten per run — die zijn allemaal gemeten op een andere tokenizer. Het goede nieuws: het token-counting-endpoint geeft aantallen terug onder beide tokenizers wanneer je model: "claude-fable-5" meegeeft, dus je kunt de delta op je echte prompts meten voordat je iets omzet.

bash

# Measure the tokenizer delta on YOUR prompt before migrating.
# The response includes input_tokens (new) AND input_tokens_prior_tokenizer (old).
curl https://api.anthropic.com/v1/messages/count_tokens \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{ "model": "claude-fable-5", "messages": [{"role":"user","content":"<your real prompt>"}] }'

Ik draaide dit eerst over mijn zwaarste prompts. De delta was niet uniform — het varieert per inhoud — maar “budgetteer ~30% meer, en tel daar de prijspremie bij op” was het juiste mentale model.

Thinking staat altijd aan — en je kunt het niet uitzetten

Op Fable 5 draait adaptieve thinking altijd. De ene nieuwe breaking change ten opzichte van de Opus-lijn: als je een expliciete thinking: {type: "disabled"} stuurt, krijg je een 400. De oplossing is simpel — laat de thinking-parameter gewoon helemaal weg — maar als je code had die thinking expliciet uitschakelde voor goedkope, snelle calls, dan geeft die code nu een fout.

Je krijgt ook de ruwe gedachtegang niet terug. Fable 5 beschermt die: je ontvangt normale thinking-blokken, en je kunt om een leesbare samenvatting vragen met display: "summarized", maar de ongefilterde redenering wordt nooit blootgegeven. Voor de meeste apps is dit geen probleem — lees de samenvatting als je inzicht nodig hebt. Waar het wél uitmaakt, is bij multi-turn agents: wanneer je een gesprek voortzet op hetzelfde model, moet je de thinking-blokken ongewijzigd terugsturen. Laat je ze weg of bewerk je ze, dan breekt de beurt. Als je agentlussen bouwt, behandel thinking-blokken dan als ondoorzichtige tokens die je woordelijk meedraagt.

Weigeringen zijn nu een control-flowprobleem

Dit is de verandering die het meest invloed heeft op hoe je de code rond het model schrijft. Fable 5 draait safety classifiers op binnenkomende verzoeken, vooral gericht op onderzoeksbiologie en de meeste cybersecurity-inhoud. Wanneer een verzoek wordt afgewezen, krijg je een geslaagde HTTP 200 met stop_reason: "refusal" — geen fout, geen exception. De content-array kan leeg zijn.

Als je code response.content[0].text doet zonder eerst stop_reason te controleren, crasht hij op de dag dat een verzoek wordt geweigerd. En aanpalend onschuldig werk — legitieme securitytooling, levenswetenschappelijke taken — kan af en toe een false positive triggeren, dus dit is niet alleen een probleem voor mensen die louche dingen doen.

De regel is: vertak op stop_reason, nooit op stop_details.

typescript

const res = await client.messages.create({
  model: "claude-fable-5",
  max_tokens: 1024,
  messages,
});

if (res.stop_reason === "refusal") {
  // classifiers declined — content is empty or partial. Don't read content[0].
  await handleRefusal(res);
} else {
  console.log(res.content[0].text);
}

Voor productie is er een nettere weg: een server-side fallbacks-parameter (in beta) die een geweigerd verzoek automatisch opnieuw probeert op claude-opus-4-8 binnen dezelfde round trip, met krediet-achtige herprijzing toegepast. Als je agents onbeheerd draait, sluit dat dan aan zodat één enkele false-positive-weigering niet een hele run laat doodlopen. Dit is dezelfde les die ik telkens opnieuw leer over agents die in productie blijven falen: dat het model slimmer wordt, neemt niet de noodzaak weg om zijn randgevallen af te handelen — het verplaatst de randgevallen alleen.

Nog twee migratiedetails

Een paar kleinere dingen die mij tijd kostten, zodat ze jou geen tijd kosten:

Geen assistant prefill. Als je output stuurde door de laatste assistantbeurt voor te vullen, dan is dat patroon weg. Gebruik in plaats daarvan structured outputs (output_config.format) of instructies in de system prompt.
30 dagen dataretentie is verplicht. Fable 5 is niet beschikbaar onder zero-data-retention. Zit je om compliancereden op ZDR, dan valt Fable 5 af en blijft Opus 4.8 je plafond. Controleer dit voordat je een migratie plant, niet erna.

Moet je echt overstappen?

Hier is mijn operatorbeslissing nadat ik ermee heb geleefd. Fable 5 is niet het standaarddoel voor “upgraden naar het nieuwste model” — Opus 4.8 wel. Dat verrast mensen, maar het is de juiste framing. Opus 4.8 is een model-ID-wissel ten opzichte van 4.7 zonder nieuwe breaking changes, het is goedkoper, en voor de overgrote meerderheid van agentwerk is het qua outputkwaliteit niet te onderscheiden.

Fable 5 verdient zijn plek bij de echt moeilijke taken: agents met een lange horizon die coherent moeten blijven over veel stappen, diep multibron-redeneren, de runs waar de fout die je probeert te doden subtiel is. Daarvoor is de capaciteit echt en de premie waard. Voor al het andere — content opstellen, classificatie, routing, samenvatten — betaal je meer tokens tegen een hogere prijs voor kwaliteit die je niet kunt waarnemen.

Ik kwam er uiteindelijk op uit beide te draaien. Mijn research-en-synthese-agent verhuisde naar Fable 5. Al het andere bleef op Opus 4.8. Die splitsing is het hele punt: kies het model per taak, niet per mode. Als je een vloot agents draait, geldt dezelfde discipline waar ik over schreef in mijn 2026 operator-stack — stuur het zware werk naar het dure model en stop met te veel betalen voor het makkelijke werk.

De conclusie van de operator

Test Fable 5 op je allerzwaarste taak voordat je iets anders aanraakt — daar betaalt het zich uit, en als het daar de naald niet beweegt, doet het dat nergens. Draai de token-counter tegen je echte prompts zodat de tokenizerinflatie van ~30% en de prijspremie je niet verrassen op de factuur. Voeg een stop_reason: "refusal"-check toe (of de server-side fallback naar Opus 4.8) overal waar Fable 5 productie raakt. Route vervolgens bewust: Fable 5 voor de moeilijke 10%, Opus 4.8 voor de rest. Het beste model is niet het meest capabele — het is het model dat past bij de taak.

Lees verder

AI Agents

AI-Agenten met Menselijke Controle: Wanneer een Goedkeuringspoort Bouwen (en Wanneer Niet)

Bijgewerkt voor 2026. Het beslissingskader dat ik gebruik om te bepalen wanneer een AI-agent in productie een menselijke goedkeuringsstap nodig heeft — en wanneer het toevoegen ervan de adoptie stil saboteert.

AI Agents

Claude Tool Use: Zo Geef Ik Mijn AI-Agents Echte Mogelijkheden

Bijgewerkt voor 2026. Claude tool use laat uw agent acties ondernemen voorbij tekstgeneratie. Het TypeScript-patroon dat ik gebruik in 15+ productie-agents op Cloudflare Workers — definieer tools, verwerk tool_use-blokken, geef resultaten schoon terug.

AI Agents

Claude vs ChatGPT voor Bedrijven in 2026: Een Eerlijke Kijk van een Operator

Bijgewerkt voor 2026. Ik draai 30+ productie-AI-agents op Claude. Hier is mijn eerlijke vergelijking van Claude vs ChatGPT voor zakelijk gebruik — waar elke wint, waar elke faalt en hoe de juiste te kiezen voor jouw stack.

Lees verder

Ontvang het AI-playbook in je inbox

Elke woensdag. 28.400+ operators. Geen opvulling.

Claude Fable 5 eerste indrukken: de kijk van een operator

Inhoudsopgave

Wat Fable 5 eigenlijk is

Waar het echt beter is

De kostenval waar niemand je voor waarschuwt

Thinking staat altijd aan — en je kunt het niet uitzetten

Weigeringen zijn nu een control-flowprobleem

Nog twee migratiedetails

Moet je echt overstappen?

De conclusie van de operator

Gerelateerde berichten

AI-Agenten met Menselijke Controle: Wanneer een Goedkeuringspoort Bouwen (en Wanneer Niet)

Claude Tool Use: Zo Geef Ik Mijn AI-Agents Echte Mogelijkheden

Claude vs ChatGPT voor Bedrijven in 2026: Een Eerlijke Kijk van een Operator

Ontvang het AI-playbook in je inbox