Il Manuale di llms.txt: Configurazione, Esempi e Perché È Importante per la Ricerca con IA
llms.txt è un file di testo semplice nella radice del tuo sito che indica ai crawler LLM (ChatGPT, Perplexity, Claude, Gemini) cosa trovare sul tuo sito e dove trovarlo. Richiede 20 minuti per essere scritto, non necessita di plugin e vale la pena pubblicarlo — anche se l'adozione e l'applicazione da parte dei motori IA rimane irregolare.
Ogni mercoledì. 28.400+ operatori. Zero riempitivo.
✓ Controlla la tua casella — clicca sul link di conferma per completare l'iscrizione.
✓ Iscrizione completata!
✓ Sei già nella lista.
Indice
Aggiornato maggio 2026.
TL;DR: llms.txt è un file di testo semplice nella radice del tuo sito che indica ai crawler LLM (ChatGPT, Perplexity, Claude, Gemini) cosa trovare sul tuo sito e dove trovarlo. Richiede 20 minuti per essere scritto, non necessita di plugin e vale la pena pubblicarlo — anche se l’adozione e l’applicazione da parte dei motori IA rimane irregolare.
[Punto di vista dell’operatore] Scrivo questi testi dall’interno dei sistemi di agenti IA che sto costruendo — per me stesso e per i clienti. Quello che segue è ciò che funziona davvero quando un agente esegue il ciclo, non la versione LinkedIn.
llms.txt è un file di testo semplice nella radice del tuo sito che indica ai crawler LLM cosa trovare sul tuo sito e dove. Richiede 20 minuti per essere scritto, non necessita di plugin e vale la pena pubblicarlo — con la sincera avvertenza che il supporto dei motori IA è ancora irregolare e la specifica è una convenzione emergente, non uno standard imposto.
Cosa è davvero llms.txt
llms.txt è un file di testo semplice che si posiziona nella directory radice del documento del tuo sito (accanto a robots.txt e sitemap.xml). Lo standard proposto vive su llmstxt.org — Jeremy Howard lo propose nel 2024, e nel corso del 2025 ha guadagnato vera trazione come uno dei segnali che alcuni motori IA usano per capire di cosa tratta un sito e quali pagine sono importanti.
Il formato è in stile markdown: un H1 con il nome del sito, un blocco di citazione con un riepilogo di un paragrafo, poi sezioni H2 contenenti elenchi puntati di pagine importanti, nel formato - [Titolo della pagina](URL): Descrizione opzionale.
Questa è tutta la specifica. È intenzionalmente semplice, perché l’obiettivo è essere leggibile dalle macchine senza richiedere al motore IA di analizzare una navigazione pesante in JavaScript, sitemap complete e decine di migliaia di link interni.
Avvertenza importante: all’inizio del 2026, llms.txt è ancora una convenzione emergente — non uno standard universalmente rispettato. Diversi motori IA gli prestano diversi livelli di attenzione. Pubblicarlo ha un costo basso e un valore atteso positivo, ma non aspettarti che cambi da un giorno all’altro le posizioni nei risultati generativi.
Perché è importante nel 2026
I motori generativi hanno un problema di scoperta. Possono fare il crawl del tuo sito, ma capire quali pagine di un blog con 1.000 post siano le risposte canoniche e di alta qualità che vale la pena citare costa vera potenza di calcolo. Un llms.txt ben fatto taglia corto: dice al motore quali sono i miei post pilastro, i miei casi studio, le mie guide più aggiornate — inizia da qui.
Nei miei log ho osservato i tassi di citazione dei motori IA cambiare modestamente dopo la pubblicazione di llms.txt. Non in modo drammatico — di solito qualche punto percentuale nel corso di diverse settimane — ma in modo coerente sui post pilastro che ho evidenziato. I motori che lo rispettano lo leggono davvero.
Cosa inserire nel tuo llms.txt
- Titolo del sito — H1, una riga.
- Riepilogo di un paragrafo — blocco di citazione (
>), 2–4 frasi. Indica chi sei, quali argomenti tratti e le convenzioni strutturali dei tuoi post pilastro (es. “ogni post di punta ha un TL;DR, un passo dopo passo e una FAQ”). - Pagine pilastro / canoniche — sezione H2, elenco puntato delle 8–15 pagine più importanti. Queste sono le pagine che vuoi che i LLM citino maggiormente.
- Pagine adiacenti / di supporto — sezione H2, elenco puntato di contenuti secondari che il motore dovrebbe conoscere.
- Informazioni sull’autore — sezione H2, link alla tua pagina autore e a eventuali post di riferimento vocale.
- Politica di citazione — sezione H2, un breve paragrafo: come vuoi essere citato, qual è la tua preferenza di attribuzione, quando il file è stato aggiornato per l’ultima volta.
Cosa NON inserire
- Ogni pagina del tuo sito. Per quello c’è sitemap.xml. llms.txt è il sottoinsieme curato.
- Testo di marketing. I motori che leggono llms.txt non sono utenti finali che stai cercando di persuadere. Sii diretto, descrittivo, fattuale.
- Pagine obsolete. Peggio che non avere llms.txt è averne uno datato. Se non riesci a tenerlo aggiornato, non pubblicarlo.
- Raccolte piene di affiliati come tue principali pagine pilastro. I motori penalizzano i contenuti che sembrano prevalentemente commerciali.
Il pattern a due file: llms.txt + llms-full.txt
Una convenzione emersa è l’uso di due file, non uno. llms.txt è la versione curata breve (le 8–15 pagine pilastro più la struttura del sito). llms-full.txt è la versione più lunga con ogni pagina del sito, impaginata per sezione, con snippet e date dell’ultima modifica.
Entrambi servono comportamenti diversi dei crawler LLM. Il breve viene letto al livello di scoperta; il lungo viene letto quando il motore vuole enumerare i tuoi contenuti per una query più approfondita. Se hai tempo, pubblica entrambi — ma quello curato breve è la priorità.
Passo dopo passo: configurare llms.txt in meno di 30 minuti
- Scegli le tue 8–15 pagine pilastro. Le pagine che vuoi citare di più nei motori IA — di solito i tuoi post evergreen con più traffico, più eventuali casi studio o ricerche originali.
- Scrivi un riepilogo di 2–4 frasi del tuo sito. Chi sei, quali argomenti tratti, quali convenzioni strutturali seguono i tuoi post pilastro.
- Formatta come markdown. H1 nome del sito, blocco di citazione per il riepilogo, sezione H2 “Pilastri” con l’elenco puntato, sezione H2 “Adiacenti” se pertinente, sezione H2 “Chi sono”.
- Salva come testo semplice con il nome file
llms.txt(ollms-full.txtper la versione più lunga). - Carica nella radice del tuo sito via SFTP, File Manager di cPanel o la tua pipeline di deployment. Il file va accanto a
index.html/index.phperobots.txt. - Verifica con
curl -I https://tuosito.com/llms.txt— dovresti vedereHTTP/2 200concontent-type: text/plain. - Aggiungi una regola MIME type al tuo
.htaccessse necessario:<FilesMatch "^llms(-full)?\.txt$">ForceType text/plain</FilesMatch>. - Aggiorna trimestralmente. Aggiungi nuovi post pilastro, rimuovi quelli che non si adattano più. Un llms.txt di 6 mesi va bene; uno di 2 anni è peggio di nessuno.
Esempio: la struttura del llms.txt di questo sito
Per riferimento, il llms.txt che pubblico su alejandrorioja.com segue la struttura sopra:
- H1: Alejandro Rioja
- Riepilogo: Sito personale di Alejandro Rioja, un operatore focalizzato su AI SEO e GEO. Il sito pubblica casi studio lunghi, playbook passo dopo passo e analisi con dati originali su come posizionarsi sia nella ricerca classica di Google che nei motori generativi (ChatGPT, Perplexity, Google AI Overviews, Claude). Ogni post di punta è strutturato per l’ingestione da parte di IA/LLM: TL;DR in cima, blocchi numerati passo dopo passo, FAQ in fondo, citazioni di fonti primarie.
- Sezione: AI SEO + GEO (post pilastro) — 10 pagine pilastro con descrizioni di una riga.
- Sezione: Post SEO e strumenti adiacenti — 8 pagine di supporto.
- Sezione: Chi sono — profilo autore e riferimenti vocali.
- Sezione: Politica di citazione — preferenza di attribuzione + data dell’ultimo aggiornamento.
Puoi verificare il file live su https://alejandrorioja.com/llms.txt. La struttura è la stessa che consiglierei per qualsiasi sito di brand personale in stile operatore o sito di contenuti B2B.
Errori comuni in llms.txt che vedo
- Trattarlo come una sitemap. Un llms.txt da 5.000 righe con ogni URL del sito è quasi inutile. Cura il contenuto.
- Scrivere il riepilogo in tono marketing. I motori non sono clienti; descriviti come farebbe una voce di directory.
- Dimenticare di aggiornarlo. Imposta un promemoria nel calendario per aggiornarlo trimestralmente. Le voci obsolete fanno più danni di quelle mancanti.
- Omettere le descrizioni. La descrizione di una riga dopo ogni link è ciò che aiuta il motore a decidere se citare la pagina per una determinata query. Non ometterla.
- Mettere llms.txt in una sottodirectory. Deve essere nella directory radice del documento. I motori non cercano altrove.
llms.txt — FAQ 2026
Tutti i motori IA leggono llms.txt?
No — e vale la pena essere onesti a riguardo. All’inizio del 2026, Perplexity e ChatGPT (modalità navigazione) sono i lettori più coerenti. Claude e Gemini hanno segnalato consapevolezza del formato ma l’applicazione è meno prevedibile. Il comportamento di Google AI Overviews riguardo a llms.txt non è chiaro. Trattalo come valore atteso positivo con basso rischio al ribasso, non come una leva di posizionamento garantita.
llms.txt aiuterà il mio posizionamento classico su Google?
Indirettamente, al massimo. Il posizionamento classico di Google è guidato da sitemap.xml, link interni e il resto dello stack on-page/off-page. llms.txt è specificamente per la scoperta dei motori IA. Non aspettarti un miglioramento del posizionamento su Google pubblicandolo.
Con quale frequenza dovrei aggiornare llms.txt?
Trimestralmente è il ritmo giusto per la maggior parte dei siti. Più spesso se pubblichi frequentemente contenuti pilastro; meno spesso se le tue 10 pagine principali sono stabili. Aggiorna sempre quando lanci un nuovo importante post pilastro o ne ritiri uno vecchio.
Posso usare un plugin WordPress per gestire llms.txt?
Esistono diversi plugin — cerca nella directory plugin WP “llms.txt”. La maggior parte genera automaticamente il file dal tuo contenuto pubblicato. Utile se non hai accesso SFTP o una pipeline di deployment, ma la versione generata automaticamente di solito necessita di editing manuale per essere genuinamente curata invece che un dump di tutto. Se riesci a scriverlo a mano in 20 minuti, fallo prima.
Cosa fare se il mio host non consente upload di file nella radice?
Due soluzioni: (1) un piccolo plugin must-use che registra una route virtuale /llms.txt che serve il contenuto dal database; (2) Cloudflare Workers se il tuo sito è dietro Cloudflare — servi il file dal worker senza toccare l’host. L’approccio mu-plugin è più semplice per la maggior parte delle configurazioni WordPress.
Letture correlate: Consigli AI SEO e playbook GEO · Come apparire in AI Overviews · GEO vs SEO: cosa cambia davvero
Vuoi aiuto per implementarlo sul tuo sito? Leggi il playbook completo SEO + GEO o mettiti in contatto — gestisco progetti di consulenza AI SEO + GEO per team di operatori che vogliono aumentare la visibilità sia su Google classico che sui motori IA.
Aggiornato per maggio 2026
Il panorama degli strumenti IA del 2026 è evoluto rapidamente — questa sezione è il quadro dal lato dell’operatore:
- OpenAI ha rilasciato GPT-5 a metà 2025; ChatGPT più le API sono ora sistemi ibridi (GPT-5 + modelli veloci più piccoli instradati automaticamente). Sora è completamente rilasciato per i video. DALL·E 3 genera ancora immagini all’interno di ChatGPT.
- Anthropic sta lanciando la famiglia Claude 4.x (4.5 → 4.6 → 4.7 a fine 2025 / inizio 2026). La finestra di contesto da 1M consente il ragionamento su un’intera codebase o su un libro intero. Claude Code è l’agente CLI predefinito per molti team di ingegneria.
- Google è su Gemini 2.5 Pro con la famiglia 2.5 Flash per la velocità; Gemini è il modello in Google Workspace, Android e i Google Search AI Overviews rinominati.
- Grok di xAI ha superato Grok 3 a fine 2024 ed è il modello predefinito all’interno di X Premium.
- Strumenti di miglioramento immagini: la maggior parte è ora ospitata nativamente dai tre grandi fornitori di modelli (
Image UpscaleeGenerative Fillin ChatGPT e Gemini). Strumenti autonomi come Topaz Photo AI, Magnific e Krea AI mantengono vantaggi qualitativi ma il livello base è salito notevolmente.
Se il post che stai leggendo consiglia un tool IA specifico, verifica il modello attuale — la maggior parte lancia una nuova versione principale ogni 4–6 mesi nel 2026.
Ogni mercoledì. 28.400+ operatori. Zero riempitivo.
✓ Controlla la tua casella — clicca sul link di conferma per completare l'iscrizione.
✓ Iscrizione completata!
✓ Sei già nella lista.
Ricevi il manuale dell'IA nella tua casella di posta
Ogni mercoledì. 28.400+ operatori. Zero riempitivo.
Controlla la tua casella di posta.
Ti abbiamo inviato un'email di conferma — clicca sul link per completare l'iscrizione. Controlla lo spam se non la vedi entro un minuto.
Sei iscritto.
Benvenuto — la prossima edizione arriverà presto nella tua casella.
Sei già nella lista — cercala ogni mercoledì.