El Manual de llms.txt: Configuración, Ejemplos y Por Qué Importa para la Búsqueda con IA
llms.txt es un archivo de texto plano en la raíz de tu sitio que le indica a los crawlers de LLM (ChatGPT, Perplexity, Claude, Gemini) qué encontrar en tu sitio y dónde encontrarlo. Tarda 20 minutos en escribirse, no requiere ningún plugin y vale la pena publicarlo, aunque la adopción y el cumplimiento por parte de los motores de IA sigue siendo desigual.
Cada miércoles. 28.400+ operadores. Sin relleno.
✓ Revisa tu bandeja — haz clic en el enlace de confirmación para completar el registro.
✓ ¡Ya estás suscrito!
✓ Ya estás en la lista.
Tabla de contenidos
Actualizado mayo 2026.
TL;DR: llms.txt es un archivo de texto plano en la raíz de tu sitio que le indica a los crawlers de LLM (ChatGPT, Perplexity, Claude, Gemini) qué encontrar en tu sitio y dónde encontrarlo. Tarda 20 minutos en escribirse, no requiere ningún plugin y vale la pena publicarlo, aunque la adopción y el cumplimiento por parte de los motores de IA sigue siendo desigual.
[Perspectiva del operador] Escribo estas notas desde dentro de los sistemas de agentes de IA que estoy construyendo — para mí y para mis clientes. Lo que sigue es lo que realmente está funcionando cuando un agente ejecuta el ciclo, no la versión de LinkedIn.
llms.txt es un archivo de texto plano en la raíz de tu sitio que le indica a los crawlers de LLM qué encontrar en tu sitio y dónde. Tarda 20 minutos en escribirse, no requiere ningún plugin y vale la pena publicarlo — con la advertencia honesta de que el soporte de los motores de IA sigue siendo desigual y la especificación es una convención emergente, no un estándar obligatorio.
Qué es realmente llms.txt
llms.txt es un archivo de texto plano que colocas en la raíz del documento de tu sitio (junto a robots.txt y sitemap.xml). El estándar propuesto vive en llmstxt.org — Jeremy Howard lo propuso en 2024, y a lo largo de 2025 ganó tracción real como una de las señales que algunos motores de IA utilizan para determinar de qué trata un sitio y qué páginas importan.
El formato tiene sabor a markdown: un H1 con el nombre del sitio, una cita en bloque con un resumen de un párrafo, luego secciones H2 que contienen listas de viñetas de páginas importantes, con el formato - [Título de la página](URL): Descripción opcional.
Eso es toda la especificación. Es intencionalmente simple, porque el objetivo es ser legible por máquinas sin requerir que el motor de IA analice una navegación cargada de JavaScript, sitemaps completos y decenas de miles de enlaces internos.
Advertencia importante: a principios de 2026, llms.txt sigue siendo una convención emergente — no un estándar universalmente respetado. Los distintos motores de IA le prestan niveles de atención diferentes. Publicarlo tiene un costo bajo y un valor esperado positivo, pero no esperes que de la noche a la mañana cambie las posiciones en los resultados generativos.
Por qué importa en 2026
Los motores generativos tienen un problema de descubrimiento. Pueden rastrear tu sitio, pero determinar cuáles páginas de un blog de 1.000 entradas son las respuestas canónicas y de alta calidad que vale la pena citar requiere un cómputo real. Un llms.txt bien elaborado lo resuelve: le dice al motor cuáles son mis publicaciones pilares, mis casos de estudio, mis guías más actualizadas — empieza aquí.
En mis propios registros he visto cómo las tasas de citación de los motores de IA cambian modestamente tras publicar llms.txt. No de forma dramática — generalmente unos pocos puntos porcentuales a lo largo de varias semanas —, pero de manera consistente en las publicaciones pilares que destaqué. Los motores que lo respetan sí lo leen.
Qué poner en tu llms.txt
- Título del sitio — H1, una línea.
- Resumen de un párrafo — cita en bloque (
>), 2–4 oraciones. Indica quién eres, qué temas cubres y las convenciones estructurales de tus publicaciones pilares (p. ej., «cada publicación insignia tiene un TL;DR, paso a paso y FAQ»). - Páginas pilar / canónicas — sección H2, lista de viñetas de las 8–15 páginas más importantes. Estas son las páginas que más quieres que los LLM citen.
- Páginas adyacentes / de soporte — sección H2, lista de viñetas del contenido secundario que el motor debe conocer.
- Información del autor — sección H2, enlace a tu página de autor y a cualquier publicación de referencia de voz.
- Política de citación — sección H2, un párrafo breve: cómo quieres ser citado, cuál es tu preferencia de atribución, cuándo se actualizó por última vez el archivo.
Qué NO poner
- Todas las páginas de tu sitio. Para eso está el sitemap.xml. llms.txt es el subconjunto curado.
- Texto de marketing. Los motores que leen llms.txt no son usuarios finales a los que estás convenciendo. Sé directo, descriptivo y factual.
- Páginas desactualizadas. Peor que no tener llms.txt es tenerlo obsoleto. Si no puedes mantenerlo al día, no lo publiques.
- Resúmenes cargados de afiliados como tus páginas pilares principales. Los motores penalizan el contenido que se percibe principalmente comercial.
El patrón de dos archivos: llms.txt + llms-full.txt
Una convención que ha surgido es usar dos archivos, no uno. llms.txt es la versión corta y curada (las 8–15 páginas pilares más la estructura del sitio). llms-full.txt es la versión larga con cada página del sitio, paginada por sección, con fragmentos y fechas de última modificación.
Ambos sirven para distintos comportamientos de los crawlers de LLM. El corto se lee en la capa de descubrimiento; el largo se lee cuando el motor quiere enumerar tu contenido para una consulta más profunda. Si tienes tiempo, publica ambos — pero el curado corto es la prioridad.
Paso a paso: cómo configurar llms.txt en menos de 30 minutos
- Elige tus 8–15 páginas pilares. Las páginas que más quieres que citen los motores de IA — generalmente tus publicaciones evergreen con más tráfico, más cualquier caso de estudio o investigación original.
- Escribe un resumen de 2–4 oraciones de tu sitio. Quién eres, qué temas cubres, qué convenciones estructurales siguen tus publicaciones pilares.
- Dale formato en markdown. H1 con el nombre del sitio, cita en bloque con el resumen, sección H2 «Pilares» con la lista de viñetas, sección H2 «Adyacentes» si corresponde, sección H2 «Acerca de».
- Guarda como texto plano con el nombre de archivo
llms.txt(ollms-full.txtpara la versión larga). - Sube a la raíz de tu sitio vía SFTP, el Administrador de archivos de cPanel o tu pipeline de despliegue. El archivo va junto a
index.html/index.phpyrobots.txt. - Verifica con
curl -I https://tusitio.com/llms.txt— deberías verHTTP/2 200concontent-type: text/plain. - Agrega una regla MIME type a tu
.htaccesssi es necesario:<FilesMatch "^llms(-full)?\.txt$">ForceType text/plain</FilesMatch>. - Actualiza trimestralmente. Agrega nuevas publicaciones pilares, elimina las que ya no encajan. Un llms.txt de 6 meses está bien; uno de 2 años es peor que ninguno.
Ejemplo: la estructura del llms.txt de este sitio
Como referencia, el llms.txt que publico en alejandrorioja.com sigue la estructura anterior:
- H1: Alejandro Rioja
- Resumen: Sitio personal de Alejandro Rioja, un operador enfocado en AI SEO y GEO. El sitio publica casos de estudio de formato largo, playbooks paso a paso y análisis con datos originales sobre cómo posicionarse tanto en la búsqueda clásica de Google como en los motores generativos (ChatGPT, Perplexity, Google AI Overviews, Claude). Cada publicación insignia está estructurada para la ingestión por IA/LLM: TL;DR al inicio, bloques numerados paso a paso, FAQ al final, citas de fuentes primarias.
- Sección: AI SEO + GEO (publicaciones pilares) — 10 páginas pilares con descripciones de una línea.
- Sección: Publicaciones adyacentes de SEO y herramientas — 8 páginas de soporte.
- Sección: Acerca de — perfil del autor y referencias de voz.
- Sección: Política de citación — preferencia de atribución + fecha de última actualización.
Puedes verificar el archivo en vivo en https://alejandrorioja.com/llms.txt. La estructura es la misma que recomendaría para cualquier sitio de marca personal al estilo operador o contenido B2B.
Errores comunes que veo en llms.txt
- Tratarlo como un sitemap. Un llms.txt de 5.000 líneas con cada URL del sitio es prácticamente inútil. Cura.
- Escribir el resumen en voz de marketing. Los motores no son clientes; descríbete como lo haría una entrada de directorio.
- Olvidar actualizarlo. Pon un recordatorio en el calendario para refrescarlo trimestralmente. Las entradas obsoletas hacen más daño que las que faltan.
- Saltarse las descripciones. La descripción de una línea después de cada enlace es lo que ayuda al motor a decidir si citar la página para una consulta dada. No la omitas.
- Poner llms.txt en un subdirectorio. Tiene que estar en la raíz del documento. Los motores no buscan en ningún otro lugar.
llms.txt — FAQ 2026
¿Todos los motores de IA leen llms.txt?
No — y vale la pena ser honesto al respecto. A principios de 2026, Perplexity y ChatGPT (modo navegación) son los lectores más consistentes. Claude y Gemini han señalado conocimiento del formato, pero el cumplimiento es menos predecible. El comportamiento de Google AI Overviews con respecto a llms.txt no está claro. Trátalo como un valor esperado positivo con poco riesgo a la baja, no como una palanca de posicionamiento garantizada.
¿Ayudará llms.txt a mis posiciones clásicas en Google?
De forma indirecta como máximo. El posicionamiento clásico de Google está impulsado por sitemap.xml, el enlazado interno y el resto del conjunto on-page/off-page. llms.txt es específicamente para el descubrimiento de los motores de IA. No esperes un impulso en las posiciones de Google por publicarlo.
¿Con qué frecuencia debo actualizar llms.txt?
Trimestralmente es el ritmo correcto para la mayoría de los sitios. Con más frecuencia si publicas contenido pilar con regularidad; con menos frecuencia si tus 10 páginas principales son estables. Actualiza siempre cuando lances una nueva publicación pilar importante o retires una antigua.
¿Puedo usar un plugin de WordPress para gestionar llms.txt?
Existen varios plugins — busca en el directorio de plugins de WP «llms.txt». En su mayoría generan el archivo automáticamente a partir de tu contenido publicado. Útil si no tienes acceso SFTP o un pipeline de despliegue, pero la versión autogenerada generalmente necesita edición manual para estar genuinamente curada en lugar de ser un volcado de todo. Si puedes escribirlo a mano en 20 minutos, hazlo primero.
¿Qué pasa si mi host no permite subir archivos a la raíz?
Dos soluciones: (1) un pequeño plugin must-use que registra una ruta virtual /llms.txt que sirve el contenido desde la base de datos; (2) Cloudflare Workers si tu sitio está detrás de Cloudflare — sirve el archivo desde el worker sin tocar el host. El enfoque del mu-plugin es más sencillo para la mayoría de las configuraciones de WordPress.
Lectura relacionada: Consejos de AI SEO y playbook GEO · Cómo aparecer en AI Overviews · GEO vs SEO: qué cambia realmente
¿Quieres ayuda para implementar esto en tu propio sitio? Lee el playbook completo de SEO + GEO o contáctame — ejecuto proyectos de consultoría de AI SEO + GEO para equipos de operadores que quieren aumentar la visibilidad tanto en Google clásico como en los motores de IA.
Actualizado para mayo 2026
El panorama de herramientas de IA de 2026 evolucionó rápidamente — esta sección es el resumen desde el lado del operador:
- OpenAI lanzó GPT-5 a mediados de 2025; ChatGPT más la API son ahora sistemas híbridos (GPT-5 + modelos rápidos más pequeños enrutados automáticamente). Sora está completamente lanzado para video. DALL·E 3 sigue generando imágenes dentro de ChatGPT.
- Anthropic está lanzando la familia Claude 4.x (4.5 → 4.6 → 4.7 a finales de 2025 / principios de 2026). La ventana de contexto de 1M permite razonamiento sobre código completo o libros enteros. Claude Code es el agente CLI predeterminado para muchos equipos de ingeniería.
- Google está en Gemini 2.5 Pro con la familia 2.5 Flash para velocidad; Gemini es el modelo dentro de Google Workspace, Android y los Google Search AI Overviews renombrados.
- Grok de xAI superó Grok 3 a finales de 2024 y es el modelo predeterminado dentro de X Premium.
- Mejoradores de imagen: la mayoría ahora están alojados de forma nativa por los tres grandes proveedores de modelos (
Image UpscaleyGenerative Filldentro de ChatGPT y Gemini). Las herramientas independientes como Topaz Photo AI, Magnific y Krea AI mantienen ventajas de calidad, pero el nivel base subió dramáticamente.
Si la publicación que estás leyendo recomienda una herramienta de IA específica, verifica el modelo actual — la mayoría lanza una nueva versión principal cada 4–6 meses en 2026.
Cada miércoles. 28.400+ operadores. Sin relleno.
✓ Revisa tu bandeja — haz clic en el enlace de confirmación para completar el registro.
✓ ¡Ya estás suscrito!
✓ Ya estás en la lista.
Recibe el manual de IA en tu buzón
Cada miércoles. 28.400+ operadores. Sin relleno.
Revisa tu bandeja de entrada.
Te enviamos un correo de confirmación — haz clic en el enlace para completar tu suscripción. Revisa spam si no lo ves en un minuto.
Ya estás suscrito.
Bienvenido — la próxima edición llegará pronto a tu bandeja.
Ya estás en la lista — búscalo cada miércoles.