Alejandro Rioja.
AI Agents

Claude Fable 5 के शुरुआती अनुभव: एक ऑपरेटर का नज़रिया

Alejandro Rioja
Alejandro Rioja
8 मिनट पढ़ें
TL;DR

Fable 5 Anthropic का सबसे सक्षम मॉडल है और कठिन, लंबे-दौर वाले एजेंट काम में यह साफ़ झलकता है — लेकिन यह डिफ़ॉल्ट अपग्रेड नहीं है। यह प्रति टोकन ज़्यादा महंगा है, एक नया tokenizer इस्तेमाल करता है जो आपके टोकन काउंट को ~30% फुला देता है, हमेशा-ऑन thinking चलाता है जिसे आप बंद नहीं कर सकते, और classifier स्तर पर रिक्वेस्ट ठुकरा सकता है। ज़्यादातर वर्कलोड के लिए Opus 4.8 ही सही चुनाव है। Fable 5 तब उठाइए जब काम सचमुच कठिन हो।

मुफ़्त न्यूज़लेटर

हर बुधवार। 28,400+ पाठक। बिना फालतू बात।

विषय-सूची

जून 2026 में अपडेटेड।

TL;DR: Fable 5 Anthropic का सबसे सक्षम मॉडल है और कठिन, लंबे-दौर वाले एजेंट काम में यह साफ़ झलकता है — लेकिन यह डिफ़ॉल्ट अपग्रेड नहीं है। यह प्रति टोकन ज़्यादा महंगा है, एक नया tokenizer इस्तेमाल करता है जो आपके टोकन काउंट को ~30% फुला देता है, हमेशा-ऑन thinking चलाता है जिसे आप बंद नहीं कर सकते, और classifier स्तर पर रिक्वेस्ट ठुकरा सकता है। ज़्यादातर वर्कलोड के लिए Opus 4.8 ही सही चुनाव है। Fable 5 तब उठाइए जब काम सचमुच कठिन हो।

[ऑपरेटर का नज़रिया] मैं एक कंसल्टिंग ब्रांड और एक पिकलबॉल फैसिलिटी के पार 30+ प्रोडक्शन एजेंट चलाता हूँ, तो मेरे लिए कोई नया फ्लैगशिप मॉडल कोई बेंचमार्क नहीं — यह एक खर्च की लाइन और एक माइग्रेशन है। यहाँ बताता हूँ कि जब मैंने सचमुच Fable 5 को उनमें से कुछ एजेंट्स में जोड़ा तो क्या बदला, और कहाँ मैंने Opus 4.8 को यथावत रहने दिया।

Fable 5 असल में है क्या

Claude Fable 5 सबसे सक्षम मॉडल है जिसे Anthropic ने व्यापक रूप से उतारा है। इसका निशाना स्पेक्ट्रम का सबसे मांगभरा सिरा है: गहरी तर्कक्षमता और लंबे-दौर वाला एजेंटिक काम — वे रन जहाँ एक एजेंट को दर्जनों tool calls के पार एक प्लान को थामे रखना होता है, बिना सूत्र खोए।

API सरफेस लगभग Opus 4.7/4.8 जैसा ही है, जिसने इसे टेस्ट करना आसान बना दिया। डिफ़ॉल्ट रूप से 1M-token का कॉन्टेक्स्ट विंडो, प्रति रिक्वेस्ट 128K आउटपुट टोकन तक। अगर आपने हालिया Opus लाइन पर कुछ भी बनाया है, तो रिक्वेस्ट का ढाँचा जाना-पहचाना लगेगा। फ़र्क ब्योरों में है, और ब्योरे ही वहाँ हैं जहाँ पैसा और चौंकाने वाली बातें छिपी हैं।

एक नामकरण नोट ताकि आप उलझें नहीं: Mythos 5 वही मॉडल है — वही क्षमताएँ, वही कीमत, वही व्यवहार — जो सिर्फ़ Anthropic के Project Glasswing प्रोग्राम के ज़रिए उपलब्ध है। अगर आप उस प्रोग्राम में नहीं हैं, तो जो मॉडल आपको चाहिए वह है claude-fable-5। नीचे लिखी हर बात दोनों पर लागू होती है।

जहाँ यह सचमुच बेहतर है

मैंने सबसे पहले अपना सबसे कठिन एजेंट टास्क इस पर फेंका: एक मल्टी-स्टेप रिसर्च-और-संश्लेषण रन जो ढेर सारे स्रोत पढ़ता है, दावों को आपस में जाँचता है, और एक हवाला-सहित ब्रीफ़ लिखता है। यह ऐसा काम है जहाँ कमज़ोर मॉडल भटक जाते हैं — दस tool calls के बाद वे यह पकड़ खो देते हैं कि कौन-सा दावा किस स्रोत से आया।

Fable 5 ने सूत्र थामे रखा। संश्लेषण ज़्यादा कसा हुआ था, हवाले सही दावों से जुड़े रहे, और इसने दो स्रोतों के बीच ऐसे दो विरोधाभास पकड़े जिन्हें मेरा Opus 4.8 वर्ज़न चुपचाप औसत में मिला रहा था। लंबी, संरचित तर्कक्षमता पर यह सचमुच एक कदम ऊपर है — कोई मामूली बेंचमार्क उछाल नहीं।

यही इसका ईमानदार पक्ष है। अगर आपके एजेंट का फेल्योर मोड है “कठिन 10% पर बिखर जाना,” तो Fable 5 उस फ़ासले को कम करता है। अगर आपका एजेंट न्यूज़लेटर सारांशित कर रहा है या सोशल पोस्ट ड्राफ़्ट कर रहा है, तो आपको फ़र्क महसूस नहीं होगा — और आप ऐसी क्षमता के पैसे चुकाएँगे जिसे आप इस्तेमाल ही नहीं कर रहे।

वह कॉस्ट वाला झटका जिसके बारे में कोई आगाह नहीं करता

यह वही चीज़ है जो आपको काटेगी अगर आप रिलीज़ नोट्स बस सरसरी तौर पर पढ़ते हैं। Fable 5 एक नए tokenizer के साथ आता है, और वही कॉन्टेंट Opus लाइन के मुक़ाबले लगभग 30% ज़्यादा टोकन में टोकनाइज़ होता है।

इसे दोबारा पढ़िए, क्योंकि यह कीमत के साथ मिलकर बढ़ता है। Fable 5 की कीमत शुरू से ही Opus-टियर से ऊपर है ($10 प्रति मिलियन input token, $50 प्रति मिलियन output)। अब हर प्रॉम्प्ट और कम्प्लीशन के ऊपर ~30% का टोकन फुलाव जोड़ दीजिए। एक अपरिवर्तित वर्कलोड — वही प्रॉम्प्ट, वही आउटपुट — माइग्रेशन के बाद काफ़ी ज़्यादा खर्च करा सकता है, इससे पहले कि आपने एजेंट के काम में एक भी चीज़ बदली हो।

तो अपने पुराने आँकड़े दोबारा मत इस्तेमाल कीजिए। आपकी max_tokens सेटिंग्स, आपके कॉन्टेक्स्ट-विंडो बजट, आपके प्रति-रन कॉस्ट अनुमान — ये सब एक अलग tokenizer पर मापे गए थे। अच्छी ख़बर: token-counting endpoint दोनों tokenizers के तहत काउंट लौटाता है जब आप model: "claude-fable-5" पास करते हैं, तो कुछ भी पलटने से पहले आप अपने असली प्रॉम्प्ट पर डेल्टा माप सकते हैं।

bash
# Measure the tokenizer delta on YOUR prompt before migrating.
# The response includes input_tokens (new) AND input_tokens_prior_tokenizer (old).
curl https://api.anthropic.com/v1/messages/count_tokens \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{ "model": "claude-fable-5", "messages": [{"role":"user","content":"<your real prompt>"}] }'

मैंने यह सबसे पहले अपने सबसे भारी प्रॉम्प्ट पर चलाया। डेल्टा एकसमान नहीं था — यह कॉन्टेंट के हिसाब से बदलता है — पर “~30% ज़्यादा के लिए बजट रखो, फिर कीमत प्रीमियम जोड़ो” सही मानसिक मॉडल साबित हुआ।

Thinking हमेशा ऑन रहता है — और आप इसे बंद नहीं कर सकते

Fable 5 पर, adaptive thinking हमेशा चलता रहता है। Opus लाइन के मुक़ाबले एकमात्र नया ब्रेकिंग चेंज: अगर आप एक स्पष्ट thinking: {type: "disabled"} भेजते हैं, तो आपको 400 मिलता है। उपाय सरल है — बस thinking पैरामीटर को पूरी तरह छोड़ दीजिए — लेकिन अगर आपके पास ऐसा कोड था जो सस्ते, तेज़ कॉल के लिए thinking को स्पष्ट रूप से बंद करता था, तो वह कोड अब error देगा।

आपको कच्ची chain of thought भी वापस नहीं मिलती। Fable 5 इसे सुरक्षित रखता है: आपको सामान्य thinking ब्लॉक मिलते हैं, और आप display: "summarized" के साथ एक पढ़ने योग्य सारांश माँग सकते हैं, पर बिना छने तर्क को कभी उजागर नहीं किया जाता। ज़्यादातर ऐप्स के लिए यह कोई मुद्दा नहीं — अगर आपको दृश्यता चाहिए तो सारांश पढ़ लीजिए। जहाँ यह मायने रखता है वह है मल्टी-टर्न एजेंट: जब आप उसी मॉडल पर बातचीत जारी रखते हैं, तो आपको thinking ब्लॉक बिना बदले वापस पास करने होते हैं। उन्हें हटाइए या एडिट कीजिए तो टर्न टूट जाता है। अगर आप एजेंट लूप बना रहे हैं, तो thinking ब्लॉक को ऐसे अपारदर्शी टोकन मानिए जिन्हें आप हू-ब-हू आगे ले जाते हैं।

Refusals अब एक control-flow समस्या हैं

यह वह बदलाव है जो सबसे ज़्यादा असर डालता है कि आप मॉडल के इर्द-गिर्द कोड कैसे लिखते हैं। Fable 5 आने वाली रिक्वेस्ट्स पर safety classifiers चलाता है, जो मुख्यतः रिसर्च बायोलॉजी और अधिकांश साइबरसिक्योरिटी कॉन्टेंट को निशाना बनाते हैं। जब कोई रिक्वेस्ट अस्वीकार होती है, तो आपको stop_reason: "refusal" के साथ एक सफल HTTP 200 मिलता है — कोई error नहीं, कोई exception नहीं। content array खाली हो सकता है।

अगर आपका कोड पहले stop_reason जाँचे बिना response.content[0].text करता है, तो जिस दिन कोई रिक्वेस्ट ठुकराई जाएगी, यह क्रैश कर जाएगा। और सौम्य आसपास के काम — वैध security tooling, लाइफ-साइंसेज़ टास्क — कभी-कभार false positive में फँस सकते हैं, तो यह सिर्फ़ संदिग्ध काम करने वालों की समस्या नहीं है।

नियम यह है: stop_reason पर ब्रांच करो, कभी stop_details पर नहीं।

typescript
const res = await client.messages.create({
  model: "claude-fable-5",
  max_tokens: 1024,
  messages,
});

if (res.stop_reason === "refusal") {
  // classifiers declined — content is empty or partial. Don't read content[0].
  await handleRefusal(res);
} else {
  console.log(res.content[0].text);
}

प्रोडक्शन के लिए एक साफ़-सुथरा रास्ता है: एक सर्वर-साइड fallbacks पैरामीटर (बीटा में) जो किसी ठुकराई गई रिक्वेस्ट को उसी राउंड ट्रिप में claude-opus-4-8 पर अपने-आप दोबारा कोशिश करता है, क्रेडिट-शैली री-प्राइसिंग लागू करके। अगर आप एजेंट बिना निगरानी के चला रहे हैं, तो इसे जोड़ दीजिए ताकि एक अकेला false-positive refusal पूरे रन को मृत-छोर तक न ले जाए। यह वही सबक है जो एजेंट्स के बारे में मैं बार-बार सीखता रहता हूँ जो प्रोडक्शन में फेल होते रहते हैं: मॉडल का ज़्यादा स्मार्ट होना उसके edge cases को संभालने की ज़रूरत खत्म नहीं करता — यह बस edge cases को इधर-उधर खिसका देता है।

माइग्रेशन के दो और ब्योरे

कुछ छोटी चीज़ें जिन्होंने मेरा वक़्त खाया ताकि वे आपका न खाएँ:

क्या आपको सचमुच स्विच करना चाहिए?

इसके साथ रहने के बाद यह रहा मेरा ऑपरेटर वाला फ़ैसला। Fable 5 डिफ़ॉल्ट “नवीनतम मॉडल पर अपग्रेड करो” लक्ष्य नहीं है — Opus 4.8 है। यह लोगों को चौंकाता है, पर यही सही ढाँचा है। Opus 4.8, 4.7 से बस एक मॉडल-ID की अदला-बदली है जिसमें कोई नया ब्रेकिंग चेंज नहीं, यह सस्ता है, और एजेंट के अत्यधिक बहुसंख्यक काम के लिए आउटपुट गुणवत्ता में यह अप्रभेद्य है।

Fable 5 सचमुच कठिन काम पर अपनी जगह अर्जित करता है: लंबे-दौर वाले एजेंट जिन्हें कई कदमों के पार सुसंगत रहना होता है, गहरा बहु-स्रोत तर्क, वे रन जहाँ जिस विफलता को आप मारने की कोशिश कर रहे हैं वह सूक्ष्म है। उनके लिए क्षमता असली है और प्रीमियम के लायक है। बाक़ी हर चीज़ के लिए — कॉन्टेंट ड्राफ़्टिंग, क्लासिफिकेशन, रूटिंग, सारांशीकरण — आप ऐसी गुणवत्ता के लिए ज़्यादा कीमत पर ज़्यादा टोकन चुका रहे हैं जिसे आप महसूस ही नहीं कर सकते।

आख़िरकार मैं दोनों चलाने लगा। मेरा रिसर्च-और-संश्लेषण एजेंट Fable 5 पर चला गया। बाक़ी सब Opus 4.8 पर रहा। यही बँटवारा पूरा मुद्दा है: मॉडल हर काम के हिसाब से चुनिए, फ़ैशन के हिसाब से नहीं। अगर आप एजेंट्स का एक बेड़ा चलाते हैं, तो वही अनुशासन लागू होता है जिसके बारे में मैंने मेरे 2026 ऑपरेटर स्टैक में लिखा था — कठिन काम को महंगे मॉडल पर भेजिए और आसान काम के लिए ज़्यादा भुगतान करना बंद कीजिए।

ऑपरेटर का अंतिम निचोड़

किसी और चीज़ को छूने से पहले Fable 5 को अपने एकमात्र सबसे कठिन काम पर टेस्ट कीजिए — वहीं यह कीमत वसूल करता है, और अगर यह वहाँ सुई नहीं हिलाता, तो कहीं नहीं हिलाएगा। token-counter को अपने असली प्रॉम्प्ट के ख़िलाफ़ चलाइए ताकि ~30% tokenizer फुलाव और कीमत प्रीमियम इनवॉइस पर आपको न चौंकाएँ। जहाँ कहीं Fable 5 प्रोडक्शन को छूता है वहाँ एक stop_reason: "refusal" जाँच (या Opus 4.8 की ओर सर्वर-साइड fallback) जोड़ दीजिए। फिर सोच-समझकर रूट कीजिए: कठिन 10% के लिए Fable 5, बाक़ी के लिए Opus 4.8। सबसे अच्छा मॉडल सबसे सक्षम वाला नहीं — वह है जो काम से मेल खाता हो।

पढ़ते रहें

AI प्लेबुक अपने इनबॉक्स में पाएं

हर बुधवार। 28,400+ पाठक। बिना फालतू बात।

↵ सभी परिणाम देखें esc esc बंद करें