GEO SEO

llms.txt Объяснён: Реально ли Он Влияет на Цитирования ИИ?

Alejandro Rioja

20 июля 2026 г. 6 мин чтения

TL;DR

llms.txt — это текстовый файл на yoursite.com/llms.txt, который сообщает AI-краулерам, какие страницы приоритизировать. Perplexity активно его читает; ChatGPT и Bing Copilot, вероятно, пока нет. Внедрение занимает 20 минут и ничего не стоит — сделайте это, но не ждите скачка цитирований на следующей неделе.

Бесплатная рассылка

Каждую среду. 28 400+ читателей. Никакой воды.

Содержание

Обновлено май 2026.

TL;DR: llms.txt — это текстовый файл на yoursite.com/llms.txt, который сообщает AI-краулерам, какие страницы приоритизировать. Perplexity активно его читает; ChatGPT и Bing Copilot, вероятно, пока нет. Внедрение занимает 20 минут и ничего не стоит — сделайте это, но не ждите скачка цитирований на следующей неделе.

[Взгляд оператора] Я управляю AI-агентами, которые отслеживают, как мои сайты цитируются в Perplexity, ChatGPT и Google SGE. llms.txt — первый сигнальный слой, который действительно принадлежит вам — вот что показывают данные на сегодняшний день.

Что такое llms.txt на самом деле

Думайте об этом как о robots.txt для AI-краулеров, но инвертированном. robots.txt говорит «не сканировать это». llms.txt говорит «когда ты строишь контекст о моём сайте, вот что важнее всего».

Спецификацию предложил в конце 2024 года Джереми Ховард (из fast.ai). Идея: разместить файл на yoursite.com/llms.txt, который перечисляет ваши самые важные страницы в обычном Markdown. AI-краулер, сканирующий ваш сайт для получения контекста, может прочитать этот файл и сразу знать, что приоритизировать — вместо того чтобы угадывать по PageRank или глубине сканирования.

Существует также опциональный вариант llms-full.txt, который включает полный текст ваших ключевых страниц, объединённых в один документ. Некоторые краулеры предпочитают этот формат, потому что он сокращает количество обращений.

Ни один из файлов пока не является стандартом W3C. Это общественное предложение с растущим принятием среди технических основателей и контент-команд.

Как выглядит файл

Вот llms.txt, который я использую для alejandrorioja.com:

markdown

# Alejandro Rioja

> Оператор, AI-консультант и основатель Pickleland. Пишу о GEO, AI-агентах и росте для основателей.

## Основные страницы

- [Обо мне](https://alejandrorioja.com/about/): Биография, консалтинговые услуги и как со мной работать.
- [Блог](https://alejandrorioja.com/blog/): Все публикации о GEO, SEO, AI-агентах и росте для основателей.
- [Консультация](https://alejandrorioja.com/consultation/30/): Запись на платную 30-минутную сессию.

## Лучшие публикации

- [Как попасть в ответы ChatGPT](https://alejandrorioja.com/blog/how-to-get-cited-in-chatgpt-answers/): GEO-плейбук, который я использую на сайтах клиентов.
- [Архитектура AI-агентов для основателей](https://alejandrorioja.com/blog/ai-agent-architecture-for-founders/): Как проектировать мультиагентные системы без полной инженерной команды.
- [GEO vs SEO](https://alejandrorioja.com/blog/geo-vs-seo/): Что меняется, когда Google — не единственная поисковая система, которая имеет значение.

## Опционально: игнорировать

- /drafts/
- /admin/

Несколько вещей, на которые стоит обратить внимание:

H1 — это название вашего бренда.
Блок-цитата — это описание из 1-2 предложений о том, кто вы. Это самая важная строка — именно её LLM использует для построения быстрой ментальной модели вашего сайта.
Секции группируют страницы по назначению.
URL-адреса абсолютные. Некоторые краулеры не разрешают относительные пути.
Секция ## Опционально: игнорировать не является частью официальной спецификации, но некоторые реализации читают её как строки Disallow в robots.txt.

Какие AI-движки действительно читают его

Здесь я должен быть честен: ситуация фрагментирована и частично не задокументирована.

Perplexity — Да, подтверждено. Краулер Perplexity (PerplexityBot) читает llms.txt при индексировании сайтов. Их инженерная команда публично ссылалась на спецификацию. Если Perplexity является для вас значимым источником трафика, внедрение llms.txt имеет чёткий путь к воздействию.

ChatGPT / OpenAI — Не подтверждено. Краулер OpenAI (GPTBot), по всей видимости, не читает llms.txt по состоянию на середину 2026 года. Его поведение при сканировании определяется robots.txt и собственной внутренней приоритизацией OpenAI. Нет публичного заявления OpenAI, признающего эту спецификацию.

Bing Copilot / Microsoft — Не подтверждено. Аналогичная ситуация с OpenAI. AI-краулер Bing (BingBot) следует robots.txt, но нет сигналов, что он читает llms.txt.

Google AI Overviews / Gemini — Не подтверждено. У Google есть собственная экосистема структурированных данных (schema.org, sitemaps), и они не указывали на готовность принять сторонние спецификации.

Anthropic — Краулер Anthropic (ClaudeBot) сканирует сеть для обучающих данных. Нет публичной документации о том, что он читает llms.txt, но несколько практиков GEO сообщают о лучших цитированиях от Claude после внедрения. Корреляция, не причинность — но стоит отметить.

Меньшие AI-поисковые движки — You.com, Phind и несколько вертикальных AI-инструментов заявили или намекнули, что читают llms.txt. Спецификацию легче принять небольшим командам, потому что им не нужно рефакторить годами накопленную инфраструктуру сканирования.

Честное резюме: сейчас llms.txt — это оптимизация для Perplexity с некоторым спекулятивным преимуществом в других местах. Это соотношение, вероятно, изменится по мере зрелости спецификации.

Как внедрить за 20 минут

Если вы используете статический сайт (Astro, Next.js со статическим экспортом, Hugo и т.д.), создайте файл в public/llms.txt. Он будет доступен в корне.

Для сайта Next.js с app router вы можете генерировать его динамически:

// app/llms.txt/route.ts
import { allPosts } from "@/lib/content";

export async function GET() {
  const topPosts = allPosts
    .filter((p) => p.featured || p.views > 1000)
    .slice(0, 10);

  const lines = [
    "# Alejandro Rioja",
    "",
    "> Оператор, AI-консультант, основатель Pickleland. Пишу о GEO, AI-агентах и росте для основателей.",
    "",
    "## Лучшие публикации",
    "",
    ...topPosts.map(
      (p) => `- [${p.title}](https://alejandrorioja.com/blog/${p.slug}/): ${p.description}`
    ),
    "",
    "## Основные страницы",
    "",
    "- [Обо мне](https://alejandrorioja.com/about/): Услуги и биография.",
    "- [Консультация](https://alejandrorioja.com/consultation/30/): Записаться на сессию.",
  ];

  return new Response(lines.join("\n"), {
    headers: { "Content-Type": "text/plain; charset=utf-8" },
  });
}

Для сайта Astro эквивалентом является endpoint .txt.ts в src/pages/:

// src/pages/llms.txt.ts
import type { APIRoute } from "astro";
import { getCollection } from "astro:content";

export const GET: APIRoute = async () => {
  const posts = await getCollection("posts", (p) => p.data.lang === "en");
  const top = posts
    .sort((a, b) => b.data.pubDate.valueOf() - a.data.pubDate.valueOf())
    .slice(0, 10);

  const body = [
    "# Alejandro Rioja",
    "",
    "> AI-консультант и оператор. Пишу о GEO, AI-агентах и росте для основателей.",
    "",
    "## Последние публикации",
    "",
    ...top.map(
      (p) =>
        `- [${p.data.title}](https://alejandrorioja.com/blog/${p.slug}/): ${p.data.description}`
    ),
  ].join("\n");

  return new Response(body, {
    headers: { "Content-Type": "text/plain; charset=utf-8" },
  });
};

После деплоя проверьте с помощью curl -s https://yoursite.com/llms.txt. Если видите Markdown — готово.

Стоит ли также создавать llms-full.txt?

Возможно. llms-full.txt — это конкатенированный дамп ваших ключевых страниц: заголовок, URL и полный текст тела, страница за страницей, разделённые ---. Идея в том, что краулер может получить всё за один запрос и иметь достаточно контекста для ответа на вопросы о вашем сайте без сканирования отдельных страниц.

Компромисс: это большой файл. Мой составляет около 400KB для топ-30 публикаций. Некоторые краулеры могут превысить таймаут или обрезать его. Другие могут взвесить его более значительно, потому что контент предварительно обработан.

Мой текущий подход: я генерирую llms-full.txt, но ограничиваю его 15 лучшими публикациями по трафику. Держу ниже 250KB. Регенерирую при каждом деплое.

Что на самом деле показывают данные

Я отслеживаю цитирования Perplexity для этого сайта и трёх сайтов клиентов с января 2026 года. Вот что я наблюдал:

Сайты с llms.txt: В среднем в 2,3 раза больше цитирований Perplexity в месяц по сравнению с базовым уровнем до внедрения. Размер выборки: 4 сайта, 4 месяца данных. Это статистически незначимо при любом разумном доверительном интервале.
Смешивающий фактор: Каждый сайт, добавивший llms.txt, также одновременно проводил другую GEO-работу (лучшие структурированные данные, более чистые заголовки, более конкретное форматирование ответов). Атрибуция невозможна.
Цитирования ChatGPT: Нет измеримой разницы ни на одном сайте после добавления llms.txt. Соответствует отсутствию подтверждённой поддержки.

Честная интерпретация: llms.txt, вероятно, помогает с Perplexity. Механизм ясен — Perplexity его читает. Вызван ли рост конкретно llms.txt или общими улучшениями GEO, которые обычно его сопровождают, — пока сказать не могу.

Что написать в блок-цитате

Однострочное описание в блок-цитате — это часть, на которую я бы потратил больше всего времени. Это текст, который LLM использует для вашего краткого изложения в контексте RAG. Он должен быть:

Конкретным: «AI-консультант, управляющий производственными агентами для МСП» превосходит «предприниматель и консультант».
Ключевых слов: Включите термины, по которым хотите быть процитированы. Если хотите цитирования по «GEO», поставьте «GEO» в эту строку.
Привязанным к сущностям: Упомяните собственные имена, которые помогают LLM вас идентифицировать. Ваше имя + ваша компания + ваш город превосходит просто ваше имя.

Плохо: > Помогаю бизнесам расти с ИИ.

Лучше: > Алехандро Риоха — AI-консультант в Остине, Техас, основатель Pickleland, пишет о GEO, AI-агентах и росте для основателей с 2019 года.

Итог оператора

llms.txt занимает 20 минут для внедрения, ничего не стоит в обслуживании и имеет подтверждённый путь чтения в Perplexity. Сделайте это. Спецификация либо станет реальным стандартом (в этом случае ранние последователи выигрывают), либо исчезнет (в этом случае вы потеряли 20 минут). Асимметрия очевидна. Только не позволяйте этому отвлекать от GEO-работы с более высоким ROI: структурированные данные, чёткие сигналы сущностей и ответы, отформатированные для извлечения сниппетов. Они двигают каждый AI-движок. llms.txt в данный момент двигает один.

SEO

Как Поисковые Системы На Самом Деле Оценивают Качество Контента в 2026 Году

Реальные цифры с 384 постов на 13 языках: что на самом деле означают глубина покрытия темы на уровне сайта, сигналы доверия и постоянство, если перестать считать качество вопросом отдельной страницы.

GEO

Как Выйти в Топ ИИ-поиска без Написания Ни Одной Новой Статьи

Обновлено для 2026 года. Вероятно, у вас уже есть контент, который хотят цитировать ИИ-движки. Работа состоит в реструктуризации, а не в написании. Вот точный процесс, который я использую, чтобы мои существующие статьи цитировались ChatGPT и Perplexity.

GEO

Как Заставить ChatGPT Цитировать Ваш Бренд в 2026 году

Обновлено для 2026 года. Цитаты ChatGPT не случайны — они следуют паттернам. Операторский плейбук по продвижению бренда в AI-генерируемых ответах.