Alejandro Rioja.
GEO SEO

llms.txt Erklärt: Bewegt Es Wirklich KI-Zitierungen?

Alejandro Rioja
Alejandro Rioja
6 Min. Lesezeit
TL;DR

llms.txt ist eine Klartextdatei unter yoursite.com/llms.txt, die KI-Crawlern mitteilt, welche Seiten priorisiert werden sollen. Perplexity liest sie aktiv; ChatGPT und Bing Copilot wahrscheinlich noch nicht. Die Implementierung dauert 20 Minuten und kostet nichts — tu es, aber erwarte keinen Zitierungsanstieg nächste Woche.

Kostenloser Newsletter

Jeden Mittwoch. 28.400+ Experten. Kein Füllstoff.

Inhaltsverzeichnis

Aktualisiert Mai 2026.

TL;DR: llms.txt ist eine Klartextdatei unter yoursite.com/llms.txt, die KI-Crawlern mitteilt, welche Seiten priorisiert werden sollen. Perplexity liest sie aktiv; ChatGPT und Bing Copilot wahrscheinlich noch nicht. Die Implementierung dauert 20 Minuten und kostet nichts — tu es, aber erwarte keinen Zitierungsanstieg nächste Woche.

[Operator-Perspektive] Ich betreibe KI-Agenten, die überwachen, wie meine Websites in Perplexity, ChatGPT und Google SGE zitiert werden. llms.txt ist die erste Signal-Schicht, die wirklich dir gehört — hier ist, was die Daten bisher zeigen.

Was llms.txt eigentlich ist

Stell dir vor wie eine robots.txt für KI-Crawler, aber invertiert. robots.txt sagt “nicht crawlen.” llms.txt sagt “wenn du Kontext über meine Website aufbaust, ist das hier das Wichtigste.”

Die Spezifikation wurde Ende 2024 von Jeremy Howard (von fast.ai) vorgeschlagen. Die Idee: eine Datei unter yoursite.com/llms.txt platzieren, die deine wichtigsten Seiten in einfachem Markdown auflistet. Ein KI-Crawler, der deine Website nach Kontext durchsucht, kann diese Datei lesen und sofort wissen, was priorisiert werden soll — anstatt nach PageRank oder Crawl-Tiefe zu raten.

Es gibt auch eine optionale llms-full.txt-Variante, die den vollständigen Text deiner wichtigsten Seiten in einem einzigen Dokument zusammenfasst. Einige Crawler bevorzugen dieses Format, weil es weniger Anfragen benötigt.

Keine der Dateien ist bisher ein W3C-Standard. Es ist ein Community-Vorschlag mit wachsender Akzeptanz unter technischen Gründern und Content-Teams.

Wie die Datei aussieht

Hier ist das llms.txt, das ich für alejandrorioja.com verwende:

markdown
# Alejandro Rioja

> Operator, KI-Berater und Gründer von Pickleland. Ich schreibe über GEO, KI-Agenten und Wachstum für Gründer.

## Hauptseiten

- [Über mich](https://alejandrorioja.com/about/): Hintergrund, Beratungsleistungen und wie man mit mir arbeitet.
- [Blog](https://alejandrorioja.com/blog/): Alle Beiträge zu GEO, SEO, KI-Agenten und Gründerwachstum.
- [Beratung](https://alejandrorioja.com/consultation/30/): Buche eine kostenpflichtige 30-Minuten-Sitzung.

## Top-Beiträge

- [Wie man in ChatGPT-Antworten zitiert wird](https://alejandrorioja.com/blog/how-to-get-cited-in-chatgpt-answers/): Das GEO-Playbook, das ich auf Kundenseiten anwende.
- [KI-Agenten-Architektur für Gründer](https://alejandrorioja.com/blog/ai-agent-architecture-for-founders/): Wie man Multi-Agenten-Systeme ohne ein vollständiges Ingenieurteam entwirft.
- [GEO vs SEO](https://alejandrorioja.com/blog/geo-vs-seo/): Was sich ändert, wenn Google nicht mehr die einzige Suchmaschine ist, die zählt.

## Optional: ignorieren

- /drafts/
- /admin/

Ein paar Dinge zu beachten:

Welche KI-Engines es tatsächlich lesen

Hier muss ich ehrlich sein: Die Landschaft ist fragmentiert und teilweise undokumentiert.

Perplexity — Ja, bestätigt. Perplexitys Crawler (PerplexityBot) liest llms.txt beim Indexieren von Websites. Ihr Ingenieurteam hat die Spezifikation öffentlich referenziert. Wenn Perplexity eine bedeutende Empfehlungsquelle für dich ist, hat die Implementierung von llms.txt einen klaren Weg zum Impact.

ChatGPT / OpenAI — Nicht bestätigt. OpenAIs Crawler (GPTBot) liest llms.txt Mitte 2026 offenbar nicht. Sein Crawl-Verhalten wird durch robots.txt und OpenAIs eigene interne Priorisierung gesteuert. Es gibt keine öffentliche Aussage von OpenAI, die die Spezifikation anerkennt.

Bing Copilot / Microsoft — Nicht bestätigt. Ähnliche Situation wie bei OpenAI. Bings KI-Crawler (BingBot) folgt robots.txt, aber es gibt kein Signal, dass er llms.txt liest.

Google AI Overviews / Gemini — Nicht bestätigt. Google hat sein eigenes strukturiertes Daten-Ökosystem (schema.org, Sitemaps) und hat nicht angedeutet, Drittanbieter-Spezifikationen zu adoptieren.

Anthropic — Anthropics Crawler (ClaudeBot) durchsucht das Web nach Trainingsdaten. Es gibt keine öffentliche Dokumentation, dass er llms.txt liest, aber mehrere GEO-Praktiker berichten über bessere Claude-Zitierungen nach der Implementierung. Korrelation, nicht Kausalität — aber erwähnenswert.

Kleinere KI-Suchmaschinen — You.com, Phind und mehrere vertikale KI-Such-Tools haben angegeben oder angedeutet, dass sie llms.txt lesen. Die Spezifikation ist für kleinere Teams einfacher zu adoptieren, weil sie keine jahrelange Crawl-Infrastruktur umstrukturieren müssen.

Die ehrliche Zusammenfassung: Derzeit ist llms.txt eine Perplexity-Optimierung mit einigem spekulativen Nutzen anderswo. Dieses Verhältnis wird sich wahrscheinlich verschieben, wenn die Spezifikation reift.

Implementierung in 20 Minuten

Wenn du eine statische Website verwendest (Astro, Next.js mit statischem Export, Hugo usw.), erstelle die Datei unter public/llms.txt. Sie wird im Root-Verzeichnis bereitgestellt.

Für eine Next.js-App-Router-Website kannst du sie dynamisch generieren:

ts
// app/llms.txt/route.ts
import { allPosts } from "@/lib/content";

export async function GET() {
  const topPosts = allPosts
    .filter((p) => p.featured || p.views > 1000)
    .slice(0, 10);

  const lines = [
    "# Alejandro Rioja",
    "",
    "> Operator, KI-Berater, Gründer von Pickleland. Schreibe über GEO, KI-Agenten und Gründerwachstum.",
    "",
    "## Top-Beiträge",
    "",
    ...topPosts.map(
      (p) => `- [${p.title}](https://alejandrorioja.com/blog/${p.slug}/): ${p.description}`
    ),
    "",
    "## Hauptseiten",
    "",
    "- [Über mich](https://alejandrorioja.com/about/): Leistungen und Hintergrund.",
    "- [Beratung](https://alejandrorioja.com/consultation/30/): Sitzung buchen.",
  ];

  return new Response(lines.join("\n"), {
    headers: { "Content-Type": "text/plain; charset=utf-8" },
  });
}

Für eine Astro-Website ist das Äquivalent ein .txt.ts-Endpunkt in src/pages/:

ts
// src/pages/llms.txt.ts
import type { APIRoute } from "astro";
import { getCollection } from "astro:content";

export const GET: APIRoute = async () => {
  const posts = await getCollection("posts", (p) => p.data.lang === "en");
  const top = posts
    .sort((a, b) => b.data.pubDate.valueOf() - a.data.pubDate.valueOf())
    .slice(0, 10);

  const body = [
    "# Alejandro Rioja",
    "",
    "> KI-Berater und Operator. Schreibe über GEO, KI-Agenten und Gründerwachstum.",
    "",
    "## Neueste Beiträge",
    "",
    ...top.map(
      (p) =>
        `- [${p.data.title}](https://alejandrorioja.com/blog/${p.slug}/): ${p.data.description}`
    ),
  ].join("\n");

  return new Response(body, {
    headers: { "Content-Type": "text/plain; charset=utf-8" },
  });
};

Nach dem Deployment, überprüfe mit curl -s https://yoursite.com/llms.txt. Wenn du Markdown siehst, bist du fertig.

Solltest du auch llms-full.txt erstellen?

Vielleicht. llms-full.txt ist ein verketteter Dump deiner wichtigsten Seiten — Titel, URL und vollständiger Textinhalt, eine Seite nach der anderen, getrennt durch ---. Die Idee ist, dass ein Crawler alles in einer Anfrage abrufen kann und genug Kontext hat, um Fragen über deine Website zu beantworten, ohne einzelne Seiten zu crawlen.

Der Kompromiss: Es ist eine große Datei. Meine läuft bei etwa 400KB für die Top-30-Beiträge. Manche Crawler können das Zeitlimit überschreiten oder es abschneiden. Andere können es stärker gewichten, weil der Inhalt vorverarbeitet ist.

Mein aktueller Ansatz: Ich generiere llms-full.txt, aber begrenze es auf die 15 besten Beiträge nach Traffic. Ich halte es unter 250KB. Regeneration bei jedem Deployment.

Was die Daten wirklich zeigen

Ich überwache Perplexity-Zitierungen für diese Website und drei Kundenseiten seit Januar 2026. Hier ist, was ich beobachtet habe:

Die ehrliche Interpretation: llms.txt hilft wahrscheinlich bei Perplexity. Der Mechanismus ist klar — Perplexity liest es. Ob der Anstieg speziell von llms.txt oder den allgemeinen GEO-Verbesserungen kommt, die ihn begleiten, kann ich noch nicht sagen.

Was in das Blockzitat gehört

Die einzeilige Beschreibung im Blockzitat ist der Teil, auf den ich die meiste Zeit verwenden würde. Dies ist der Text, den ein LLM verwenden wird, um dich in einem RAG-Kontext zusammenzufassen. Er muss sein:

Schlecht: > Helfe Unternehmen mit KI zu wachsen.

Besser: > Alejandro Rioja — KI-Berater in Austin TX, Gründer von Pickleland, schreibt seit 2019 über GEO, KI-Agenten und Gründerwachstum.

Das Fazit des Operators

llms.txt dauert 20 Minuten zur Implementierung, kostet nichts zu betreiben und hat einen bestätigten Lesepfad mit Perplexity. Tu es. Die Spezifikation wird entweder zu einem echten Standard (in dem Fall gewinnen Early Adopters) oder verschwindet (in dem Fall hast du 20 Minuten verloren). Die Asymmetrie ist offensichtlich. Lass dich nur nicht davon ablenken, GEO-Arbeit mit höherem ROI zu machen: strukturierte Daten, klare Entity-Signale und Antworten, die für die Snippet-Extraktion formatiert sind. Diese bewegen jeden KI-Motor. llms.txt bewegt derzeit einen.

Weiterlesen

Holen Sie sich das KI-Playbook in Ihr Postfach

Jeden Mittwoch. 28.400+ Experten. Kein Füllstoff.

↵ alle Ergebnisse anzeigen esc esc zum Schließen