Alejandro Rioja.
GEO SEO

llms.txt Spiegato: Sposta Davvero le Citazioni IA?

Alejandro Rioja
Alejandro Rioja
7 min di lettura
TL;DR

llms.txt è un file di testo semplice su yoursite.com/llms.txt che indica ai crawler IA quali pagine prioritizzare. Perplexity lo legge attivamente; ChatGPT e Bing Copilot probabilmente ancora no. Richiede 20 minuti per essere implementato e non costa nulla — fallo, ma non aspettarti un picco di citazioni la prossima settimana.

Newsletter gratuita

Ogni mercoledì. 28.400+ operatori. Zero riempitivo.

Indice

Aggiornato maggio 2026.

TL;DR: llms.txt è un file di testo semplice su yoursite.com/llms.txt che indica ai crawler IA quali pagine prioritizzare. Perplexity lo legge attivamente; ChatGPT e Bing Copilot probabilmente ancora no. Richiede 20 minuti per essere implementato e non costa nulla — fallo, ma non aspettarti un picco di citazioni la prossima settimana.

[Prospettiva dell’operatore] Gestisco agenti IA che monitorano come i miei siti vengono citati in Perplexity, ChatGPT e Google SGE. llms.txt è il primo livello di segnali che appartiene davvero a te — ecco cosa mostrano i dati finora.

Cos’è davvero llms.txt

Pensaci come un robots.txt per i crawler IA, ma invertito. robots.txt dice “non indicizzare questo.” llms.txt dice “quando stai costruendo contesto sul mio sito, ecco cosa conta di più.”

La specifica è stata proposta alla fine del 2024 da Jeremy Howard (di fast.ai). L’idea: mettere un file su yoursite.com/llms.txt che elenca le tue pagine più importanti in Markdown semplice. Un crawler IA che raschia il tuo sito per il contesto può leggere quel file e sapere immediatamente cosa prioritizzare — invece di indovinare per PageRank o profondità di crawl.

Esiste anche una variante opzionale llms-full.txt che include il testo completo delle tue pagine chiave concatenate in un unico documento. Alcuni crawler preferiscono questo formato perché riduce i round-trip.

Nessun file è ancora uno standard W3C. È una proposta della community con adozione crescente tra fondatori tecnici e team di contenuto.

Come appare il file

Ecco il llms.txt che uso per alejandrorioja.com:

markdown
# Alejandro Rioja

> Operatore, consulente IA e fondatore di Pickleland. Scrivo di GEO, agenti IA e crescita per i fondatori.

## Pagine principali

- [Chi sono](https://alejandrorioja.com/about/): Background, servizi di consulenza e come lavorare con me.
- [Blog](https://alejandrorioja.com/blog/): Tutti gli articoli su GEO, SEO, agenti IA e crescita per fondatori.
- [Consulenza](https://alejandrorioja.com/consultation/30/): Prenota una sessione a pagamento di 30 minuti.

## Articoli top

- [Come essere citato nelle risposte ChatGPT](https://alejandrorioja.com/blog/how-to-get-cited-in-chatgpt-answers/): Il playbook GEO che uso sui siti dei clienti.
- [Architettura di agenti IA per fondatori](https://alejandrorioja.com/blog/ai-agent-architecture-for-founders/): Come progettare sistemi multi-agente senza un team di ingegneria completo.
- [GEO vs SEO](https://alejandrorioja.com/blog/geo-vs-seo/): Cosa cambia quando Google non è più l'unico motore di ricerca che conta.

## Opzionale: ignora

- /drafts/
- /admin/

Alcune cose da notare:

Quali motori IA lo leggono davvero

Qui devo essere onesto: il panorama è frammentato e parzialmente non documentato.

Perplexity — Sì, confermato. Il crawler di Perplexity (PerplexityBot) legge llms.txt quando indicizza i siti. Il loro team di ingegneria ha fatto riferimento alla specifica pubblicamente. Se Perplexity è una fonte di riferimento significativa per te, implementare llms.txt ha un percorso chiaro verso l’impatto.

ChatGPT / OpenAI — Non confermato. Il crawler di OpenAI (GPTBot) non sembra leggere llms.txt a metà 2026. Il suo comportamento di crawl è governato da robots.txt e dalla propria prioritizzazione interna di OpenAI. Non c’è nessuna dichiarazione pubblica di OpenAI che riconosca la specifica.

Bing Copilot / Microsoft — Non confermato. Situazione simile a OpenAI. Il crawler IA di Bing (BingBot) segue robots.txt ma non c’è segnale che legga llms.txt.

Google AI Overviews / Gemini — Non confermato. Google ha il proprio ecosistema di dati strutturati (schema.org, sitemap) e non ha indicato che adotterà specifiche di terze parti.

Anthropic — Il crawler di Anthropic (ClaudeBot) scansiona il web per dati di addestramento. Non c’è documentazione pubblica che legga llms.txt, ma diversi pratici GEO riportano migliori citazioni di Claude dopo l’implementazione. Correlazione, non causalità — ma vale la pena notarlo.

Motori di ricerca IA più piccoli — You.com, Phind e diversi strumenti di ricerca IA verticale hanno dichiarato o lasciato intendere che leggono llms.txt. La specifica è più facile da adottare per i team più piccoli perché non hanno anni di infrastruttura di crawl da refactoring.

Il riassunto onesto: al momento, llms.txt è un’ottimizzazione per Perplexity con qualche beneficio speculativo altrove. Quel rapporto cambierà probabilmente man mano che la specifica matura.

Come implementarlo in 20 minuti

Se sei su un sito statico (Astro, Next.js con export statico, Hugo, ecc.), crea il file in public/llms.txt. Verrà servito alla root.

Per un sito Next.js con app router, puoi generarlo dinamicamente:

ts
// app/llms.txt/route.ts
import { allPosts } from "@/lib/content";

export async function GET() {
  const topPosts = allPosts
    .filter((p) => p.featured || p.views > 1000)
    .slice(0, 10);

  const lines = [
    "# Alejandro Rioja",
    "",
    "> Operatore, consulente IA, fondatore di Pickleland. Scrivo di GEO, agenti IA e crescita per fondatori.",
    "",
    "## Articoli top",
    "",
    ...topPosts.map(
      (p) => `- [${p.title}](https://alejandrorioja.com/blog/${p.slug}/): ${p.description}`
    ),
    "",
    "## Pagine principali",
    "",
    "- [Chi sono](https://alejandrorioja.com/about/): Servizi e background.",
    "- [Consulenza](https://alejandrorioja.com/consultation/30/): Prenota una sessione.",
  ];

  return new Response(lines.join("\n"), {
    headers: { "Content-Type": "text/plain; charset=utf-8" },
  });
}

Per un sito Astro, l’equivalente è un endpoint .txt.ts in src/pages/:

ts
// src/pages/llms.txt.ts
import type { APIRoute } from "astro";
import { getCollection } from "astro:content";

export const GET: APIRoute = async () => {
  const posts = await getCollection("posts", (p) => p.data.lang === "en");
  const top = posts
    .sort((a, b) => b.data.pubDate.valueOf() - a.data.pubDate.valueOf())
    .slice(0, 10);

  const body = [
    "# Alejandro Rioja",
    "",
    "> Consulente IA e operatore. Scrivo di GEO, agenti IA e crescita per fondatori.",
    "",
    "## Articoli recenti",
    "",
    ...top.map(
      (p) =>
        `- [${p.data.title}](https://alejandrorioja.com/blog/${p.slug}/): ${p.data.description}`
    ),
  ].join("\n");

  return new Response(body, {
    headers: { "Content-Type": "text/plain; charset=utf-8" },
  });
};

Dopo il deployment, verifica con curl -s https://yoursite.com/llms.txt. Se vedi Markdown, hai finito.

Dovresti anche creare llms-full.txt?

Forse. llms-full.txt è un dump concatenato delle tue pagine chiave — titolo, URL e testo completo del corpo, una pagina dopo l’altra, separate da ---. L’idea è che un crawler può prendere tutto in una sola richiesta e avere abbastanza contesto per rispondere a domande sul tuo sito senza scansionare le singole pagine.

Il compromesso: è un file grande. Il mio è di circa 400KB per i 30 articoli migliori. Alcuni crawler possono andare in timeout o troncarlo. Altri possono ponderarlo più pesantemente perché il contenuto è pre-digerito.

Il mio approccio attuale: genero llms-full.txt ma lo limito ai 15 articoli con le migliori prestazioni per traffico. Lo mantengo sotto i 250KB. Rigenero ad ogni deployment.

Cosa mostrano davvero i dati

Sto monitorando le citazioni di Perplexity per questo sito e tre siti di clienti da gennaio 2026. Ecco cosa ho osservato:

L’interpretazione onesta: llms.txt probabilmente aiuta con Perplexity. Il meccanismo è chiaro — Perplexity lo legge. Se l’aumento sia specificamente di llms.txt o dei miglioramenti GEO generali che tendono ad accompagnarlo, non posso ancora dirlo.

Cosa mettere nella citazione in blocco

La descrizione di una riga nella citazione in blocco è la parte su cui passerei più tempo. Questo è il testo che un LLM userà per riassumerti in un contesto RAG. Deve essere:

Cattivo: > Aiuto le aziende a crescere con l'IA.

Meglio: > Alejandro Rioja — consulente IA ad Austin TX, fondatore di Pickleland, scrivo di GEO, agenti IA e crescita per fondatori dal 2019.

La conclusione dell’operatore

llms.txt richiede 20 minuti per essere implementato, non costa nulla da servire e ha un percorso di lettura confermato con Perplexity. Fallo. La specifica diventerà o un vero standard (nel qual caso i primi ad adottarlo vincono) o svanirà (nel qual caso hai perso 20 minuti). L’asimmetria è ovvia. Basta non lasciarti distrarre dal lavoro GEO ad alto ROI: dati strutturati, segnali di entità chiari e risposte formattate per l’estrazione di snippet. Quelli muovono ogni motore IA. llms.txt ne muove attualmente uno.

Continua a leggere

Ricevi il manuale dell'IA nella tua casella di posta

Ogni mercoledì. 28.400+ operatori. Zero riempitivo.

↵ per tutti i risultati esc esc per chiudere