llms.txt 实操手册:配置、示例及其对 AI 搜索的重要性
llms.txt 是网站根目录下的一个纯文本文件,用于告知 LLM 爬虫(ChatGPT、Perplexity、Claude、Gemini)在你的网站上能找到什么以及在哪里找到。只需 20 分钟即可完成编写,无需任何插件,值得发布——尽管各 AI 引擎的采纳程度和执行力度仍参差不齐。
每周三。28,400+ 读者。纯干货。
✓ 请查收邮箱 — 点击确认链接以完成订阅。
✓ 订阅成功!
✓ 您已在订阅列表中。
目录
2026 年 5 月更新。
TL;DR: llms.txt 是网站根目录下的一个纯文本文件,用于告知 LLM 爬虫(ChatGPT、Perplexity、Claude、Gemini)在你的网站上能找到什么以及在哪里找到。只需 20 分钟即可完成编写,无需任何插件,值得发布——尽管各 AI 引擎的采纳程度和执行力度仍参差不齐。
[运营者视角] 这些内容是我从自己正在构建的 AI 智能体系统内部写出来的——为我自己,也为客户。以下是智能体实际运行时真正有效的方法,而非 LinkedIn 风格的包装版本。
llms.txt 是网站根目录下的一个纯文本文件,用于告知 LLM 爬虫在你的网站上能找到什么以及在哪里找到。只需 20 分钟即可完成编写,无需任何插件,值得发布——需要坦诚说明的是:AI 引擎的支持程度仍参差不齐,该规范是一种新兴惯例,并非强制执行的标准。
llms.txt 究竟是什么
llms.txt 是一个纯文本文件,放置在网站的文档根目录(与 robots.txt 和 sitemap.xml 并列)。该提案标准托管于 llmstxt.org——Jeremy Howard 于 2024 年提出,并在 2025 年间获得了真正的关注,成为部分 AI 引擎用于判断网站主题及页面重要性的信号之一。
其格式带有 Markdown 风格:H1 标题为网站名称,块引用为一段摘要,随后是多个 H2 小节,每节包含重要页面的项目符号列表,格式为 - [页面标题](URL): 可选描述。
这就是全部规范。它刻意保持简洁,目的在于让机器可读,而无需 AI 引擎去解析 JavaScript 密集的导航结构、完整的站点地图以及数万条内部链接。
重要说明: 截至 2026 年初,llms.txt 仍是一种新兴惯例,并非被普遍认可的标准。不同的 AI 引擎对其重视程度各异。发布它成本低、预期价值为正,但不要指望它能一夜之间改变你在生成式搜索结果中的排名。
为什么它在 2026 年如此重要
生成式引擎面临一个发现难题。它们可以爬取你的网站,但要从一个有 1000 篇文章的博客中找出哪些页面是值得引用的权威性高质量答案,需要耗费大量算力。一个整洁的 llms.txt 能解决这个问题:它直接告诉引擎哪些是我的支柱文章、案例研究、最新的权威指南——从这里开始。
在我自己的日志中,我观察到发布 llms.txt 后 AI 引擎的引用率发生了适度变化。并不戏剧化——通常是几周内几个百分点的提升——但在我重点标注的支柱文章上表现一致。支持该格式的引擎确实会读取它。
llms.txt 中应该写什么
- 网站标题 — H1,一行。
- 一段摘要 — 块引用(
>),2—4 句话。说明你是谁、涵盖哪些主题,以及支柱文章的结构规范(如”每篇旗舰文章包含 TL;DR、分步骤说明和 FAQ”)。 - 支柱/权威页面 — H2 小节,列出 8—15 个最重要页面的项目符号列表。这些是你最希望 LLM 引用的页面。
- 相关/辅助页面 — H2 小节,引擎应了解的次要内容项目符号列表。
- 关于/作者信息 — H2 小节,链接到作者页面及任何声音参考文章。
- 引用政策 — H2 小节,一段简短文字:你希望如何被引用、署名偏好,以及文件的最近更新时间。
不该写什么
- 网站的每一个页面。 那是 sitemap.xml 的职责。llms.txt 是经过筛选的子集。
- 营销文案。 读取 llms.txt 的引擎不是你要说服的终端用户。保持直接、描述性、客观。
- 过时的页面。 比没有 llms.txt 更糟糕的是有一个陈旧的。如果无法保持更新,就不要发布。
- 以联盟推广为主的汇总页面 作为核心支柱页面。引擎会对看起来以商业推广为主的内容降权。
双文件模式:llms.txt + llms-full.txt
一种已经形成的惯例是使用两个文件,而不是一个。llms.txt 是经过筛选的简版(8—15 个支柱页面加网站结构)。llms-full.txt 是包含网站所有页面的完整版,按章节分页,附带摘要和最后修改日期。
两者服务于 LLM 爬虫的不同行为模式。简版在发现阶段被读取;完整版在引擎需要枚举你的内容以回应更深层查询时被读取。如果时间允许,两者都发布——但经过筛选的简版是优先级更高的那个。
分步操作:30 分钟内完成 llms.txt 配置
- 选择 8—15 个支柱页面。 你最希望在 AI 引擎中被引用的页面——通常是流量最高的常青内容,以及案例研究或原创研究。
- 用 2—4 句话写出网站摘要。 你是谁、涵盖哪些主题、支柱文章遵循哪些结构规范。
- 以 Markdown 格式排版。 H1 网站名称,块引用摘要,H2「支柱」节附项目符号列表,H2「相关」节(如适用),H2「关于」节。
- 保存为纯文本文件,文件名为
llms.txt(完整版则为llms-full.txt)。 - 上传至网站根目录,通过 SFTP、cPanel 文件管理器或部署流水线。该文件应与
index.html/index.php及robots.txt并列放置。 - 验证:运行
curl -I https://yoursite.com/llms.txt— 应看到HTTP/2 200,且content-type: text/plain。 - 必要时在
.htaccess添加 MIME 类型规则:<FilesMatch "^llms(-full)?\.txt$">ForceType text/plain</FilesMatch>。 - 每季度刷新一次。 添加新的支柱文章,移除不再适用的内容。6 个月前的 llms.txt 是可接受的;2 年前的比什么都没有更糟。
示例:本站的 llms.txt 结构
作为参考,我在 alejandrorioja.com 发布的 llms.txt 遵循以下结构:
- H1: Alejandro Rioja
- 摘要: Alejandro Rioja 的个人网站,专注于 AI SEO 和 GEO 的运营者。网站发布深度案例研究、分步骤实操手册,以及基于原始数据的分析——研究如何在传统 Google 搜索和生成式引擎(ChatGPT、Perplexity、Google AI Overviews、Claude)中双线排名。每篇旗舰文章均针对 AI/LLM 摄取进行了结构化设计:顶部有 TL;DR,正文为编号分步模块,底部有 FAQ,并附一手来源引用。
- 章节:AI SEO + GEO(支柱文章) — 10 个支柱页面,每个附一行描述。
- 章节:相关 SEO 及工具文章 — 8 个辅助页面。
- 章节:关于 — 作者简介及声音参考资料。
- 章节:引用政策 — 署名偏好 + 最近刷新日期。
你可以在 https://alejandrorioja.com/llms.txt 查看实时文件。这套结构同样适用于任何运营者风格的个人品牌站或 B2B 内容网站。
我常见的 llms.txt 错误
- 把它当站点地图用。 一个包含网站所有 URL 的 5000 行 llms.txt 几乎没有价值。精心筛选。
- 用营销语气写摘要。 引擎不是客户;用目录条目的方式描述自己。
- 忘记更新。 在日历上设置提醒,每季度刷新。过时条目的危害比缺失条目更大。
- 省略描述。 每个链接后面的一行描述,正是引擎判断是否应针对特定查询引用该页面的依据。不要省略。
- 把 llms.txt 放在子目录中。 必须放在文档根目录。引擎不会在其他地方查找。
llms.txt — 2026 年常见问题
所有 AI 引擎都会读取 llms.txt 吗?
不会——值得坦诚面对这一点。截至 2026 年初,Perplexity 和 ChatGPT(浏览模式)是最稳定的读取方。Claude 和 Gemini 已表示知晓该格式,但执行程度不太可预测。Google AI Overviews 对 llms.txt 的处理方式尚不明确。将其视为下行风险低的正期望值操作,而非有保证的排名杠杆。
llms.txt 会帮助我在传统 Google 中的排名吗?
最多是间接作用。传统 Google 排名由 sitemap.xml、内部链接以及其余的站内/站外优化体系驱动。llms.txt 专门用于 AI 引擎的发现。不要期望发布它能提升 Google 排名。
应该多久更新一次 llms.txt?
对大多数网站而言,每季度更新一次是合适的节奏。如果你频繁发布支柱内容,则更频繁;如果你的前 10 页面保持稳定,则可以少一些。每当发布重要的新支柱文章或撤除旧文章时,务必及时更新。
可以使用 WordPress 插件来管理 llms.txt 吗?
确实存在一些插件——在 WP 插件目录中搜索「llms.txt」。它们大多会从已发布内容自动生成文件。如果你没有 SFTP 访问权限或部署流水线,这很有用,但自动生成的版本通常需要手动编辑,才能做到真正的筛选而非一股脑倾倒所有内容。如果能在 20 分钟内手写,优先手写。
如果托管服务商不允许上传根目录文件怎么办?
两种解决方案:(1)一个小型 must-use 插件,注册一个虚拟 /llms.txt 路由,从数据库提供内容;(2)如果网站在 Cloudflare 后面,使用 Cloudflare Workers——从 Worker 提供文件,无需修改托管服务。对大多数 WordPress 配置而言,mu-plugin 方案更简单。
相关阅读: AI SEO 技巧与 GEO 实操手册 · 如何出现在 AI Overviews 中 · GEO vs SEO:究竟什么在变
想在自己的网站上实施? 阅读完整的 SEO + GEO 实操手册 或 联系我 — 我为希望在传统 Google 和 AI 引擎双线积累曝光的运营团队提供 AI SEO + GEO 咨询项目。
2026 年 5 月更新内容
2026 年 AI 工具格局演变迅速——以下是运营者视角的快照:
- OpenAI 于 2025 年中发布了 GPT-5;ChatGPT 及 API 现已是混合系统(GPT-5 + 自动路由的小型快速模型)。Sora 视频功能已全面发布。DALL·E 3 仍在 ChatGPT 内部提供图像生成。
- Anthropic 正在推出 Claude 4.x 系列(4.5 → 4.6 → 4.7,2025 年底至 2026 年初)。100 万 token 上下文窗口支持对整个代码库或完整书籍进行推理。Claude Code 已成为众多工程团队的默认 CLI 智能体。
- Google 正在使用 Gemini 2.5 Pro,以 2.5 Flash 系列提供高速服务;Gemini 是 Google Workspace、Android 以及更名后的 Google Search AI Overviews 的底层模型。
- xAI 的 Grok 于 2024 年底跨越 Grok 3,是 X Premium 的默认模型。
- 图像增强工具:大多数现已由三大模型提供商原生托管(ChatGPT 和 Gemini 内置
Image Upscale和Generative Fill)。Topaz Photo AI、Magnific 和 Krea AI 等独立工具仍保持质量优势,但整体基准线已大幅提升。
如果你正在阅读的文章推荐了某款特定 AI 工具,请核实当前版本——2026 年大多数工具每 4—6 个月就会发布一个新的主要版本。
每周三。28,400+ 读者。纯干货。
✓ 请查收邮箱 — 点击确认链接以完成订阅。
✓ 订阅成功!
✓ 您已在订阅列表中。
将AI实战手册发送到您的邮箱
每周三。28,400+ 读者。纯干货。
请查收邮箱。
我们已向您发送确认邮件 — 点击其中的链接以完成订阅。如果一分钟内没收到,请检查垃圾邮件。
订阅成功。
欢迎 — 下一期很快就会送达您的邮箱。
您已在订阅列表中 — 每周三留意查收。