Alejandro Rioja.
GEO SEO

llms.txt Объяснён: Реально ли Он Влияет на Цитирования ИИ?

Alejandro Rioja
Alejandro Rioja
6 мин чтения
TL;DR

llms.txt — это текстовый файл на yoursite.com/llms.txt, который сообщает AI-краулерам, какие страницы приоритизировать. Perplexity активно его читает; ChatGPT и Bing Copilot, вероятно, пока нет. Внедрение занимает 20 минут и ничего не стоит — сделайте это, но не ждите скачка цитирований на следующей неделе.

Бесплатная рассылка

Каждую среду. 28 400+ читателей. Никакой воды.

Содержание

Обновлено май 2026.

TL;DR: llms.txt — это текстовый файл на yoursite.com/llms.txt, который сообщает AI-краулерам, какие страницы приоритизировать. Perplexity активно его читает; ChatGPT и Bing Copilot, вероятно, пока нет. Внедрение занимает 20 минут и ничего не стоит — сделайте это, но не ждите скачка цитирований на следующей неделе.

[Взгляд оператора] Я управляю AI-агентами, которые отслеживают, как мои сайты цитируются в Perplexity, ChatGPT и Google SGE. llms.txt — первый сигнальный слой, который действительно принадлежит вам — вот что показывают данные на сегодняшний день.

Что такое llms.txt на самом деле

Думайте об этом как о robots.txt для AI-краулеров, но инвертированном. robots.txt говорит «не сканировать это». llms.txt говорит «когда ты строишь контекст о моём сайте, вот что важнее всего».

Спецификацию предложил в конце 2024 года Джереми Ховард (из fast.ai). Идея: разместить файл на yoursite.com/llms.txt, который перечисляет ваши самые важные страницы в обычном Markdown. AI-краулер, сканирующий ваш сайт для получения контекста, может прочитать этот файл и сразу знать, что приоритизировать — вместо того чтобы угадывать по PageRank или глубине сканирования.

Существует также опциональный вариант llms-full.txt, который включает полный текст ваших ключевых страниц, объединённых в один документ. Некоторые краулеры предпочитают этот формат, потому что он сокращает количество обращений.

Ни один из файлов пока не является стандартом W3C. Это общественное предложение с растущим принятием среди технических основателей и контент-команд.

Как выглядит файл

Вот llms.txt, который я использую для alejandrorioja.com:

markdown
# Alejandro Rioja

> Оператор, AI-консультант и основатель Pickleland. Пишу о GEO, AI-агентах и росте для основателей.

## Основные страницы

- [Обо мне](https://alejandrorioja.com/about/): Биография, консалтинговые услуги и как со мной работать.
- [Блог](https://alejandrorioja.com/blog/): Все публикации о GEO, SEO, AI-агентах и росте для основателей.
- [Консультация](https://alejandrorioja.com/consultation/30/): Запись на платную 30-минутную сессию.

## Лучшие публикации

- [Как попасть в ответы ChatGPT](https://alejandrorioja.com/blog/how-to-get-cited-in-chatgpt-answers/): GEO-плейбук, который я использую на сайтах клиентов.
- [Архитектура AI-агентов для основателей](https://alejandrorioja.com/blog/ai-agent-architecture-for-founders/): Как проектировать мультиагентные системы без полной инженерной команды.
- [GEO vs SEO](https://alejandrorioja.com/blog/geo-vs-seo/): Что меняется, когда Google — не единственная поисковая система, которая имеет значение.

## Опционально: игнорировать

- /drafts/
- /admin/

Несколько вещей, на которые стоит обратить внимание:

Какие AI-движки действительно читают его

Здесь я должен быть честен: ситуация фрагментирована и частично не задокументирована.

Perplexity — Да, подтверждено. Краулер Perplexity (PerplexityBot) читает llms.txt при индексировании сайтов. Их инженерная команда публично ссылалась на спецификацию. Если Perplexity является для вас значимым источником трафика, внедрение llms.txt имеет чёткий путь к воздействию.

ChatGPT / OpenAI — Не подтверждено. Краулер OpenAI (GPTBot), по всей видимости, не читает llms.txt по состоянию на середину 2026 года. Его поведение при сканировании определяется robots.txt и собственной внутренней приоритизацией OpenAI. Нет публичного заявления OpenAI, признающего эту спецификацию.

Bing Copilot / Microsoft — Не подтверждено. Аналогичная ситуация с OpenAI. AI-краулер Bing (BingBot) следует robots.txt, но нет сигналов, что он читает llms.txt.

Google AI Overviews / Gemini — Не подтверждено. У Google есть собственная экосистема структурированных данных (schema.org, sitemaps), и они не указывали на готовность принять сторонние спецификации.

Anthropic — Краулер Anthropic (ClaudeBot) сканирует сеть для обучающих данных. Нет публичной документации о том, что он читает llms.txt, но несколько практиков GEO сообщают о лучших цитированиях от Claude после внедрения. Корреляция, не причинность — но стоит отметить.

Меньшие AI-поисковые движки — You.com, Phind и несколько вертикальных AI-инструментов заявили или намекнули, что читают llms.txt. Спецификацию легче принять небольшим командам, потому что им не нужно рефакторить годами накопленную инфраструктуру сканирования.

Честное резюме: сейчас llms.txt — это оптимизация для Perplexity с некоторым спекулятивным преимуществом в других местах. Это соотношение, вероятно, изменится по мере зрелости спецификации.

Как внедрить за 20 минут

Если вы используете статический сайт (Astro, Next.js со статическим экспортом, Hugo и т.д.), создайте файл в public/llms.txt. Он будет доступен в корне.

Для сайта Next.js с app router вы можете генерировать его динамически:

ts
// app/llms.txt/route.ts
import { allPosts } from "@/lib/content";

export async function GET() {
  const topPosts = allPosts
    .filter((p) => p.featured || p.views > 1000)
    .slice(0, 10);

  const lines = [
    "# Alejandro Rioja",
    "",
    "> Оператор, AI-консультант, основатель Pickleland. Пишу о GEO, AI-агентах и росте для основателей.",
    "",
    "## Лучшие публикации",
    "",
    ...topPosts.map(
      (p) => `- [${p.title}](https://alejandrorioja.com/blog/${p.slug}/): ${p.description}`
    ),
    "",
    "## Основные страницы",
    "",
    "- [Обо мне](https://alejandrorioja.com/about/): Услуги и биография.",
    "- [Консультация](https://alejandrorioja.com/consultation/30/): Записаться на сессию.",
  ];

  return new Response(lines.join("\n"), {
    headers: { "Content-Type": "text/plain; charset=utf-8" },
  });
}

Для сайта Astro эквивалентом является endpoint .txt.ts в src/pages/:

ts
// src/pages/llms.txt.ts
import type { APIRoute } from "astro";
import { getCollection } from "astro:content";

export const GET: APIRoute = async () => {
  const posts = await getCollection("posts", (p) => p.data.lang === "en");
  const top = posts
    .sort((a, b) => b.data.pubDate.valueOf() - a.data.pubDate.valueOf())
    .slice(0, 10);

  const body = [
    "# Alejandro Rioja",
    "",
    "> AI-консультант и оператор. Пишу о GEO, AI-агентах и росте для основателей.",
    "",
    "## Последние публикации",
    "",
    ...top.map(
      (p) =>
        `- [${p.data.title}](https://alejandrorioja.com/blog/${p.slug}/): ${p.data.description}`
    ),
  ].join("\n");

  return new Response(body, {
    headers: { "Content-Type": "text/plain; charset=utf-8" },
  });
};

После деплоя проверьте с помощью curl -s https://yoursite.com/llms.txt. Если видите Markdown — готово.

Стоит ли также создавать llms-full.txt?

Возможно. llms-full.txt — это конкатенированный дамп ваших ключевых страниц: заголовок, URL и полный текст тела, страница за страницей, разделённые ---. Идея в том, что краулер может получить всё за один запрос и иметь достаточно контекста для ответа на вопросы о вашем сайте без сканирования отдельных страниц.

Компромисс: это большой файл. Мой составляет около 400KB для топ-30 публикаций. Некоторые краулеры могут превысить таймаут или обрезать его. Другие могут взвесить его более значительно, потому что контент предварительно обработан.

Мой текущий подход: я генерирую llms-full.txt, но ограничиваю его 15 лучшими публикациями по трафику. Держу ниже 250KB. Регенерирую при каждом деплое.

Что на самом деле показывают данные

Я отслеживаю цитирования Perplexity для этого сайта и трёх сайтов клиентов с января 2026 года. Вот что я наблюдал:

Честная интерпретация: llms.txt, вероятно, помогает с Perplexity. Механизм ясен — Perplexity его читает. Вызван ли рост конкретно llms.txt или общими улучшениями GEO, которые обычно его сопровождают, — пока сказать не могу.

Что написать в блок-цитате

Однострочное описание в блок-цитате — это часть, на которую я бы потратил больше всего времени. Это текст, который LLM использует для вашего краткого изложения в контексте RAG. Он должен быть:

Плохо: > Помогаю бизнесам расти с ИИ.

Лучше: > Алехандро Риоха — AI-консультант в Остине, Техас, основатель Pickleland, пишет о GEO, AI-агентах и росте для основателей с 2019 года.

Итог оператора

llms.txt занимает 20 минут для внедрения, ничего не стоит в обслуживании и имеет подтверждённый путь чтения в Perplexity. Сделайте это. Спецификация либо станет реальным стандартом (в этом случае ранние последователи выигрывают), либо исчезнет (в этом случае вы потеряли 20 минут). Асимметрия очевидна. Только не позволяйте этому отвлекать от GEO-работы с более высоким ROI: структурированные данные, чёткие сигналы сущностей и ответы, отформатированные для извлечения сниппетов. Они двигают каждый AI-движок. llms.txt в данный момент двигает один.

Читать дальше

Получайте ИИ-руководство на почту

Каждую среду. 28 400+ читателей. Никакой воды.

↵ — все результаты esc esc — закрыть