GEO SEO

llms.txt Erklärt: Bewegt Es Wirklich KI-Zitierungen?

Alejandro Rioja

28. Juli 2026 6 Min. Lesezeit

TL;DR

llms.txt ist eine Klartextdatei unter yoursite.com/llms.txt, die KI-Crawlern mitteilt, welche Seiten priorisiert werden sollen. Perplexity liest sie aktiv; ChatGPT und Bing Copilot wahrscheinlich noch nicht. Die Implementierung dauert 20 Minuten und kostet nichts — tu es, aber erwarte keinen Zitierungsanstieg nächste Woche.

Kostenloser Newsletter

Jeden Mittwoch. 28.400+ Experten. Kein Füllstoff.

Inhaltsverzeichnis

Aktualisiert Mai 2026.

TL;DR: llms.txt ist eine Klartextdatei unter yoursite.com/llms.txt, die KI-Crawlern mitteilt, welche Seiten priorisiert werden sollen. Perplexity liest sie aktiv; ChatGPT und Bing Copilot wahrscheinlich noch nicht. Die Implementierung dauert 20 Minuten und kostet nichts — tu es, aber erwarte keinen Zitierungsanstieg nächste Woche.

[Operator-Perspektive] Ich betreibe KI-Agenten, die überwachen, wie meine Websites in Perplexity, ChatGPT und Google SGE zitiert werden. llms.txt ist die erste Signal-Schicht, die wirklich dir gehört — hier ist, was die Daten bisher zeigen.

Was llms.txt eigentlich ist

Stell dir vor wie eine robots.txt für KI-Crawler, aber invertiert. robots.txt sagt “nicht crawlen.” llms.txt sagt “wenn du Kontext über meine Website aufbaust, ist das hier das Wichtigste.”

Die Spezifikation wurde Ende 2024 von Jeremy Howard (von fast.ai) vorgeschlagen. Die Idee: eine Datei unter yoursite.com/llms.txt platzieren, die deine wichtigsten Seiten in einfachem Markdown auflistet. Ein KI-Crawler, der deine Website nach Kontext durchsucht, kann diese Datei lesen und sofort wissen, was priorisiert werden soll — anstatt nach PageRank oder Crawl-Tiefe zu raten.

Es gibt auch eine optionale llms-full.txt-Variante, die den vollständigen Text deiner wichtigsten Seiten in einem einzigen Dokument zusammenfasst. Einige Crawler bevorzugen dieses Format, weil es weniger Anfragen benötigt.

Keine der Dateien ist bisher ein W3C-Standard. Es ist ein Community-Vorschlag mit wachsender Akzeptanz unter technischen Gründern und Content-Teams.

Wie die Datei aussieht

Hier ist das llms.txt, das ich für alejandrorioja.com verwende:

markdown

# Alejandro Rioja

> Operator, KI-Berater und Gründer von Pickleland. Ich schreibe über GEO, KI-Agenten und Wachstum für Gründer.

## Hauptseiten

- [Über mich](https://alejandrorioja.com/about/): Hintergrund, Beratungsleistungen und wie man mit mir arbeitet.
- [Blog](https://alejandrorioja.com/blog/): Alle Beiträge zu GEO, SEO, KI-Agenten und Gründerwachstum.
- [Beratung](https://alejandrorioja.com/consultation/30/): Buche eine kostenpflichtige 30-Minuten-Sitzung.

## Top-Beiträge

- [Wie man in ChatGPT-Antworten zitiert wird](https://alejandrorioja.com/blog/how-to-get-cited-in-chatgpt-answers/): Das GEO-Playbook, das ich auf Kundenseiten anwende.
- [KI-Agenten-Architektur für Gründer](https://alejandrorioja.com/blog/ai-agent-architecture-for-founders/): Wie man Multi-Agenten-Systeme ohne ein vollständiges Ingenieurteam entwirft.
- [GEO vs SEO](https://alejandrorioja.com/blog/geo-vs-seo/): Was sich ändert, wenn Google nicht mehr die einzige Suchmaschine ist, die zählt.

## Optional: ignorieren

- /drafts/
- /admin/

Ein paar Dinge zu beachten:

Die H1 ist dein Markenname.
Das Blockzitat ist eine 1-2-Satz-Beschreibung, wer du bist. Das ist die wichtigste Zeile — sie wird ein LLM verwenden, um ein schnelles mentales Modell deiner Website aufzubauen.
Abschnitte gruppieren Seiten nach Zweck.
URLs sind absolut. Manche Crawler lösen relative Pfade nicht auf.
Der Abschnitt ## Optional: ignorieren ist nicht offiziell in der Spezifikation, aber einige Implementierungen lesen ihn wie robots.txt-Disallow-Zeilen.

Welche KI-Engines es tatsächlich lesen

Hier muss ich ehrlich sein: Die Landschaft ist fragmentiert und teilweise undokumentiert.

Perplexity — Ja, bestätigt. Perplexitys Crawler (PerplexityBot) liest llms.txt beim Indexieren von Websites. Ihr Ingenieurteam hat die Spezifikation öffentlich referenziert. Wenn Perplexity eine bedeutende Empfehlungsquelle für dich ist, hat die Implementierung von llms.txt einen klaren Weg zum Impact.

ChatGPT / OpenAI — Nicht bestätigt. OpenAIs Crawler (GPTBot) liest llms.txt Mitte 2026 offenbar nicht. Sein Crawl-Verhalten wird durch robots.txt und OpenAIs eigene interne Priorisierung gesteuert. Es gibt keine öffentliche Aussage von OpenAI, die die Spezifikation anerkennt.

Bing Copilot / Microsoft — Nicht bestätigt. Ähnliche Situation wie bei OpenAI. Bings KI-Crawler (BingBot) folgt robots.txt, aber es gibt kein Signal, dass er llms.txt liest.

Google AI Overviews / Gemini — Nicht bestätigt. Google hat sein eigenes strukturiertes Daten-Ökosystem (schema.org, Sitemaps) und hat nicht angedeutet, Drittanbieter-Spezifikationen zu adoptieren.

Anthropic — Anthropics Crawler (ClaudeBot) durchsucht das Web nach Trainingsdaten. Es gibt keine öffentliche Dokumentation, dass er llms.txt liest, aber mehrere GEO-Praktiker berichten über bessere Claude-Zitierungen nach der Implementierung. Korrelation, nicht Kausalität — aber erwähnenswert.

Kleinere KI-Suchmaschinen — You.com, Phind und mehrere vertikale KI-Such-Tools haben angegeben oder angedeutet, dass sie llms.txt lesen. Die Spezifikation ist für kleinere Teams einfacher zu adoptieren, weil sie keine jahrelange Crawl-Infrastruktur umstrukturieren müssen.

Die ehrliche Zusammenfassung: Derzeit ist llms.txt eine Perplexity-Optimierung mit einigem spekulativen Nutzen anderswo. Dieses Verhältnis wird sich wahrscheinlich verschieben, wenn die Spezifikation reift.

Implementierung in 20 Minuten

Wenn du eine statische Website verwendest (Astro, Next.js mit statischem Export, Hugo usw.), erstelle die Datei unter public/llms.txt. Sie wird im Root-Verzeichnis bereitgestellt.

Für eine Next.js-App-Router-Website kannst du sie dynamisch generieren:

// app/llms.txt/route.ts
import { allPosts } from "@/lib/content";

export async function GET() {
  const topPosts = allPosts
    .filter((p) => p.featured || p.views > 1000)
    .slice(0, 10);

  const lines = [
    "# Alejandro Rioja",
    "",
    "> Operator, KI-Berater, Gründer von Pickleland. Schreibe über GEO, KI-Agenten und Gründerwachstum.",
    "",
    "## Top-Beiträge",
    "",
    ...topPosts.map(
      (p) => `- [${p.title}](https://alejandrorioja.com/blog/${p.slug}/): ${p.description}`
    ),
    "",
    "## Hauptseiten",
    "",
    "- [Über mich](https://alejandrorioja.com/about/): Leistungen und Hintergrund.",
    "- [Beratung](https://alejandrorioja.com/consultation/30/): Sitzung buchen.",
  ];

  return new Response(lines.join("\n"), {
    headers: { "Content-Type": "text/plain; charset=utf-8" },
  });
}

Für eine Astro-Website ist das Äquivalent ein .txt.ts-Endpunkt in src/pages/:

// src/pages/llms.txt.ts
import type { APIRoute } from "astro";
import { getCollection } from "astro:content";

export const GET: APIRoute = async () => {
  const posts = await getCollection("posts", (p) => p.data.lang === "en");
  const top = posts
    .sort((a, b) => b.data.pubDate.valueOf() - a.data.pubDate.valueOf())
    .slice(0, 10);

  const body = [
    "# Alejandro Rioja",
    "",
    "> KI-Berater und Operator. Schreibe über GEO, KI-Agenten und Gründerwachstum.",
    "",
    "## Neueste Beiträge",
    "",
    ...top.map(
      (p) =>
        `- [${p.data.title}](https://alejandrorioja.com/blog/${p.slug}/): ${p.data.description}`
    ),
  ].join("\n");

  return new Response(body, {
    headers: { "Content-Type": "text/plain; charset=utf-8" },
  });
};

Nach dem Deployment, überprüfe mit curl -s https://yoursite.com/llms.txt. Wenn du Markdown siehst, bist du fertig.

Solltest du auch llms-full.txt erstellen?

Vielleicht. llms-full.txt ist ein verketteter Dump deiner wichtigsten Seiten — Titel, URL und vollständiger Textinhalt, eine Seite nach der anderen, getrennt durch ---. Die Idee ist, dass ein Crawler alles in einer Anfrage abrufen kann und genug Kontext hat, um Fragen über deine Website zu beantworten, ohne einzelne Seiten zu crawlen.

Der Kompromiss: Es ist eine große Datei. Meine läuft bei etwa 400KB für die Top-30-Beiträge. Manche Crawler können das Zeitlimit überschreiten oder es abschneiden. Andere können es stärker gewichten, weil der Inhalt vorverarbeitet ist.

Mein aktueller Ansatz: Ich generiere llms-full.txt, aber begrenze es auf die 15 besten Beiträge nach Traffic. Ich halte es unter 250KB. Regeneration bei jedem Deployment.

Was die Daten wirklich zeigen

Ich überwache Perplexity-Zitierungen für diese Website und drei Kundenseiten seit Januar 2026. Hier ist, was ich beobachtet habe:

Websites mit llms.txt: Durchschnittlich 2,3x mehr Perplexity-Zitierungen pro Monat im Vergleich zur Baseline vor der Implementierung. Stichprobengröße: 4 Websites, 4 Monate Daten. Das ist bei keinem vernünftigen Konfidenzintervall statistisch signifikant.
Der Störfaktor: Jede Website, die llms.txt hinzugefügt hat, hat auch gleichzeitig andere GEO-Arbeit durchgeführt (bessere strukturierte Daten, sauberere Überschriften, spezifischeres Antwortformat). Attribution ist unmöglich.
ChatGPT-Zitierungen: Kein messbarer Unterschied auf einer Website nach dem Hinzufügen von llms.txt. Konsistent mit dem Mangel an bestätigter Unterstützung.

Die ehrliche Interpretation: llms.txt hilft wahrscheinlich bei Perplexity. Der Mechanismus ist klar — Perplexity liest es. Ob der Anstieg speziell von llms.txt oder den allgemeinen GEO-Verbesserungen kommt, die ihn begleiten, kann ich noch nicht sagen.

Was in das Blockzitat gehört

Die einzeilige Beschreibung im Blockzitat ist der Teil, auf den ich die meiste Zeit verwenden würde. Dies ist der Text, den ein LLM verwenden wird, um dich in einem RAG-Kontext zusammenzufassen. Er muss sein:

Spezifisch: “KI-Berater, der Produktionsagenten für KMUs betreibt” übertrifft “Unternehmer und Berater.”
Schlüsselwort-bewusst: Füge die Begriffe ein, für die du zitiert werden möchtest. Wenn du Zitierungen für “GEO” willst, füge “GEO” in diese Zeile ein.
Entity-verankert: Nenne Eigennamen, die einem LLM helfen, dich zu disambiguieren. Dein Name + dein Unternehmen + deine Stadt übertrifft nur deinen Namen.

Schlecht: > Helfe Unternehmen mit KI zu wachsen.

Besser: > Alejandro Rioja — KI-Berater in Austin TX, Gründer von Pickleland, schreibt seit 2019 über GEO, KI-Agenten und Gründerwachstum.

Das Fazit des Operators

llms.txt dauert 20 Minuten zur Implementierung, kostet nichts zu betreiben und hat einen bestätigten Lesepfad mit Perplexity. Tu es. Die Spezifikation wird entweder zu einem echten Standard (in dem Fall gewinnen Early Adopters) oder verschwindet (in dem Fall hast du 20 Minuten verloren). Die Asymmetrie ist offensichtlich. Lass dich nur nicht davon ablenken, GEO-Arbeit mit höherem ROI zu machen: strukturierte Daten, klare Entity-Signale und Antworten, die für die Snippet-Extraktion formatiert sind. Diese bewegen jeden KI-Motor. llms.txt bewegt derzeit einen.

SEO

Wie Suchmaschinen Content-Qualität 2026 wirklich bewerten

Echte Zahlen aus 384 Posts in 13 Sprachen: was Themen-Tiefe, Vertrauenssignale und Konsistenz auf Site-Ebene tatsächlich bedeuten, sobald man aufhört, Qualität als Frage einzelner Seiten zu betrachten.

GEO

Wie man in der KI-Suche rankt, ohne einen einzigen neuen Blogbeitrag zu schreiben

Aktualisiert für 2026. Sie haben wahrscheinlich bereits den Inhalt, den KI-Suchmaschinen zitieren wollen. Die Arbeit besteht im Umstrukturieren, nicht im Schreiben. Hier ist der genaue Prozess, den ich verwende, um bestehende Beiträge von ChatGPT und Perplexity zitieren zu lassen.

GEO

Wie Ihre Marke 2026 in ChatGPT-Antworten zitiert wird

Aktualisiert für 2026. ChatGPT-Zitate sind nicht zufällig — sie folgen Mustern. Das Betreiber-Playbook, um Ihre Marke in KI-generierten Antworten zu platzieren.