O Manual do llms.txt: Configuração, Exemplos e Por Que Importa para a Busca com IA
llms.txt é um arquivo de texto simples na raiz do seu site que informa aos crawlers de LLM (ChatGPT, Perplexity, Claude, Gemini) o que encontrar no seu site e onde encontrar. Leva 20 minutos para escrever, não requer nenhum plugin e vale a pena publicar — embora a adoção e a aplicação pelos motores de IA ainda seja irregular.
Toda quarta-feira. 28.400+ operadores. Zero enrolação.
✓ Verifique sua caixa de entrada — clique no link de confirmação para concluir o cadastro.
✓ Inscrição concluída!
✓ Você já está na lista.
Índice
Atualizado em maio de 2026.
TL;DR: llms.txt é um arquivo de texto simples na raiz do seu site que informa aos crawlers de LLM (ChatGPT, Perplexity, Claude, Gemini) o que encontrar no seu site e onde encontrar. Leva 20 minutos para escrever, não requer nenhum plugin e vale a pena publicar — embora a adoção e a aplicação pelos motores de IA ainda seja irregular.
[Perspectiva do operador] Escrevo essas notas de dentro dos sistemas de agentes de IA que estou construindo — para mim mesmo e para clientes. O que segue é o que realmente está funcionando quando um agente executa o loop, não a versão do LinkedIn.
llms.txt é um arquivo de texto simples na raiz do seu site que informa aos crawlers de LLM o que encontrar no seu site e onde. Leva 20 minutos para escrever, não requer nenhum plugin e vale a pena publicar — com a ressalva honesta de que o suporte dos motores de IA ainda é irregular e a especificação é uma convenção emergente, não um padrão imposto.
O que llms.txt realmente é
llms.txt é um arquivo de texto simples que você coloca na raiz do documento do seu site (ao lado de robots.txt e sitemap.xml). O padrão proposto está em llmstxt.org — Jeremy Howard o propôs em 2024, e ao longo de 2025 ganhou tração real como um dos sinais que alguns motores de IA usam para descobrir do que um site trata e quais páginas são importantes.
O formato tem estilo markdown: um H1 com o nome do site, uma citação em bloco com um resumo de um parágrafo, depois seções H2 contendo listas com marcadores de páginas importantes, formatadas como - [Título da Página](URL): Descrição opcional.
Essa é toda a especificação. É intencionalmente simples, porque o objetivo é ser legível por máquinas sem exigir que o motor de IA analise navegação pesada em JavaScript, sitemaps completos e dezenas de milhares de links internos.
Ressalva importante: no início de 2026, llms.txt ainda é uma convenção emergente — não um padrão universalmente respeitado. Diferentes motores de IA prestam diferentes níveis de atenção a ele. Publicá-lo tem baixo custo e valor esperado positivo, mas não espere que vire rankings da noite para o dia nos resultados generativos.
Por que importa em 2026
Os motores generativos têm um problema de descoberta. Eles podem rastrear seu site, mas descobrir quais páginas de um blog com 1.000 postagens são as respostas canônicas e de alta qualidade que vale a pena citar custa computação real. Um llms.txt bem feito resolve isso: ele informa ao motor quais são meus posts pilares, meus estudos de caso, meus guias mais atualizados — comece por aqui.
Nos meus próprios registros, observei as taxas de citação dos motores de IA mudarem modestamente após publicar llms.txt. Não de forma dramática — geralmente alguns pontos percentuais ao longo de várias semanas — mas de forma consistente nos posts pilares que destaquei. Os motores que respeitam o arquivo realmente o leem.
O que colocar no seu llms.txt
- Título do site — H1, uma linha.
- Resumo de um parágrafo — citação em bloco (
>), 2–4 frases. Diga quem você é, quais tópicos cobre e as convenções estruturais dos seus posts pilares (p. ex., “cada post principal tem um TL;DR, passo a passo e FAQ”). - Páginas pilares / canônicas — seção H2, lista com marcadores das 8–15 páginas mais importantes. São as páginas que você mais quer que os LLMs citem.
- Páginas adjacentes / de suporte — seção H2, lista com marcadores de conteúdo secundário que o motor deve conhecer.
- Sobre / informações do autor — seção H2, link para sua página de autor e eventuais posts de referência de voz.
- Política de citação — seção H2, um parágrafo curto: como você quer ser citado, qual é sua preferência de atribuição, quando o arquivo foi atualizado pela última vez.
O que NÃO colocar
- Todas as páginas do seu site. Para isso existe o sitemap.xml. llms.txt é o subconjunto curado.
- Texto de marketing. Os motores que leem llms.txt não são usuários finais que você está persuadindo. Seja direto, descritivo, factual.
- Páginas desatualizadas. Pior do que não ter llms.txt é ter um desatualizado. Se você não consegue mantê-lo atualizado, não publique.
- Roundups cheios de afiliados como suas principais páginas pilares. Os motores desvalorizam conteúdo que parece predominantemente comercial.
O padrão de dois arquivos: llms.txt + llms-full.txt
Uma convenção que surgiu é usar dois arquivos, não um. llms.txt é a versão curada e curta (as 8–15 páginas pilares mais a estrutura do site). llms-full.txt é a versão mais longa com todas as páginas do site, paginadas por seção, com trechos e datas de última modificação.
Ambos servem a diferentes comportamentos dos crawlers de LLM. O curto é lido na camada de descoberta; o longo é lido quando o motor quer enumerar seu conteúdo para uma consulta mais profunda. Se tiver tempo, publique ambos — mas o curado curto é a prioridade.
Passo a passo: configurando llms.txt em menos de 30 minutos
- Escolha suas 8–15 páginas pilares. As páginas que você mais quer que sejam citadas nos motores de IA — geralmente seus posts evergreen de maior tráfego, além de eventuais estudos de caso ou pesquisas originais.
- Escreva um resumo de 2–4 frases do seu site. Quem você é, quais tópicos cobre, quais convenções estruturais seus posts pilares seguem.
- Formate como markdown. H1 nome do site, citação em bloco do resumo, seção H2 “Pilares” com a lista de marcadores, seção H2 “Adjacentes” se relevante, seção H2 “Sobre”.
- Salve como texto simples com o nome de arquivo
llms.txt(oullms-full.txtpara a versão mais longa). - Faça upload para a raiz do seu site via SFTP, Gerenciador de Arquivos do cPanel ou sua pipeline de deploy. O arquivo vai ao lado de
index.html/index.phperobots.txt. - Verifique com
curl -I https://seusite.com/llms.txt— você deve verHTTP/2 200comcontent-type: text/plain. - Adicione uma regra de tipo MIME ao seu
.htaccessse necessário:<FilesMatch "^llms(-full)?\.txt$">ForceType text/plain</FilesMatch>. - Atualize trimestralmente. Adicione novos posts pilares, remova os que não se encaixam mais. Um llms.txt de 6 meses está bom; um de 2 anos é pior do que nenhum.
Exemplo: a estrutura do llms.txt deste site
Para referência, o llms.txt que publico em alejandrorioja.com segue a estrutura acima:
- H1: Alejandro Rioja
- Resumo: Site pessoal de Alejandro Rioja, um operador focado em AI SEO e GEO. O site publica estudos de caso longos, playbooks passo a passo e análises com dados originais sobre como ranquear tanto na busca clássica do Google quanto em motores generativos (ChatGPT, Perplexity, Google AI Overviews, Claude). Cada post principal é estruturado para ingestão por IA/LLM: TL;DR no topo, blocos numerados passo a passo, FAQ na parte inferior, citações de fontes primárias.
- Seção: AI SEO + GEO (posts pilares) — 10 páginas pilares com descrições de uma linha.
- Seção: Posts adjacentes de SEO e ferramentas — 8 páginas de suporte.
- Seção: Sobre — perfil do autor e referências de voz.
- Seção: Política de citação — preferência de atribuição + data da última atualização.
Você pode verificar o arquivo ao vivo em https://alejandrorioja.com/llms.txt. A estrutura é a mesma que eu recomendaria para qualquer site de marca pessoal no estilo operador ou site de conteúdo B2B.
Erros comuns que vejo em llms.txt
- Tratá-lo como um sitemap. Um llms.txt com 5.000 linhas contendo cada URL do site é praticamente inútil. Curate.
- Escrever o resumo em voz de marketing. Motores não são clientes; descreva-se como faria uma entrada de diretório.
- Esquecer de atualizar. Defina um lembrete no calendário para atualizar trimestralmente. Entradas obsoletas prejudicam mais do que entradas ausentes.
- Pular as descrições. A descrição de uma linha após cada link é o que ajuda o motor a decidir se cita a página para uma determinada consulta. Não a omita.
- Colocar llms.txt em um subdiretório. Precisa estar na raiz do documento. Os motores não procuram em nenhum outro lugar.
llms.txt — FAQ 2026
Todos os motores de IA leem llms.txt?
Não — e vale a pena ser honesto sobre isso. No início de 2026, Perplexity e ChatGPT (modo de navegação) são os leitores mais consistentes. Claude e Gemini sinalizaram conhecimento do formato, mas a aplicação é menos previsível. O comportamento do Google AI Overviews em relação ao llms.txt não está claro. Trate-o como valor esperado positivo com baixa desvantagem, não como uma alavanca de ranking garantida.
O llms.txt vai ajudar meus rankings clássicos no Google?
Indiretamente, no máximo. O ranking clássico do Google é impulsionado por sitemap.xml, links internos e o restante do conjunto on-page/off-page. llms.txt é especificamente para descoberta pelos motores de IA. Não espere um aumento nos rankings do Google ao publicá-lo.
Com que frequência devo atualizar llms.txt?
Trimestralmente é o ritmo certo para a maioria dos sites. Com mais frequência se você publica conteúdo pilar com regularidade; com menos frequência se suas 10 melhores páginas são estáveis. Atualize sempre ao lançar um novo post pilar importante ou desativar um antigo.
Posso usar um plugin do WordPress para gerenciar llms.txt?
Existem vários plugins — procure no diretório de plugins do WP por “llms.txt”. A maioria gera automaticamente o arquivo a partir do seu conteúdo publicado. Útil se você não tem acesso SFTP ou uma pipeline de deploy, mas a versão gerada automaticamente geralmente precisa de edição manual para ser genuinamente curada em vez de um dump de tudo. Se você consegue escrever à mão em 20 minutos, faça isso primeiro.
E se meu host não permitir uploads de arquivos na raiz?
Duas soluções alternativas: (1) um pequeno plugin must-use que registra uma rota virtual /llms.txt servindo o conteúdo do banco de dados; (2) Cloudflare Workers se seu site estiver atrás do Cloudflare — sirva o arquivo pelo worker sem tocar no host. A abordagem do mu-plugin é mais simples para a maioria das configurações WordPress.
Leitura relacionada: Dicas de AI SEO e playbook GEO · Como aparecer em AI Overviews · GEO vs SEO: o que realmente muda
Quer ajuda para implementar isso no seu próprio site? Leia o playbook completo de SEO + GEO ou entre em contato — executo projetos de consultoria em AI SEO + GEO para equipes de operadores que querem ampliar a visibilidade tanto no Google clássico quanto nos motores de IA.
Atualizado para maio de 2026
O cenário de ferramentas de IA de 2026 evoluiu rapidamente — esta seção é o instantâneo do lado do operador:
- OpenAI lançou o GPT-5 em meados de 2025; ChatGPT mais a API são agora sistemas híbridos (GPT-5 + modelos rápidos menores roteados automaticamente). Sora está totalmente lançado para vídeo. DALL·E 3 ainda gera imagens dentro do ChatGPT.
- Anthropic está lançando a família Claude 4.x (4.5 → 4.6 → 4.7 no final de 2025 / início de 2026). A janela de contexto de 1M permite raciocínio sobre base de código completa ou livro inteiro. Claude Code é o agente CLI padrão para muitas equipes de engenharia.
- Google está no Gemini 2.5 Pro com a família 2.5 Flash para velocidade; Gemini é o modelo dentro do Google Workspace, Android e os Google Search AI Overviews renomeados.
- Grok da xAI ultrapassou Grok 3 no final de 2024 e é o modelo padrão dentro do X Premium.
- Aprimoradores de imagem: a maioria agora é hospedada nativamente pelos três grandes provedores de modelos (
Image UpscaleeGenerative Filldentro do ChatGPT e Gemini). Ferramentas independentes como Topaz Photo AI, Magnific e Krea AI mantêm vantagens de qualidade, mas o nível base subiu dramaticamente.
Se o post que você está lendo recomenda uma ferramenta de IA específica, verifique o modelo atual — a maioria lança uma nova versão principal a cada 4–6 meses em 2026.
Toda quarta-feira. 28.400+ operadores. Zero enrolação.
✓ Verifique sua caixa de entrada — clique no link de confirmação para concluir o cadastro.
✓ Inscrição concluída!
✓ Você já está na lista.
Receba o manual de IA na sua caixa de entrada
Toda quarta-feira. 28.400+ operadores. Zero enrolação.
Verifique sua caixa de entrada.
Enviamos um e-mail de confirmação — clique no link para concluir sua inscrição. Verifique o spam se não o vir em um minuto.
Você está inscrito.
Bem-vindo — a próxima edição chega em breve à sua caixa de entrada.
Você já está na lista — fique de olho toda quarta-feira.