Alejandro Rioja.
SEO

如何在2026年进行技术SEO审计:分步指南

Alejandro Rioja
Alejandro Rioja
3 分钟阅读
TL;DR

技术SEO审计——可抓取性、网站速度、Schema结构化数据、索引、移动端可用性——在2026年依然必不可少。审计清单现在包括AI引擎可访问性:哪些AI爬虫可以访问你的网站、你的llms。

免费新闻通讯

每周三。28,400+ 读者。纯干货。

目录

针对AI搜索更新(2026年5月)

TL;DR: 技术SEO审计——可抓取性、网站速度、Schema结构化数据、索引、移动端可用性——在2026年依然必不可少。审计清单现在包括AI引擎可访问性:哪些AI爬虫可以访问你的网站、你的llms.txt是否就位、结构化数据是否能干净地暴露内容。下面的文章涵盖经典的技术SEO;GEO章节补充了AI搜索的审计层。

本次更新有哪些新内容:一节关于这一策略在AI搜索引擎(ChatGPT、Perplexity、Google AI Overviews、Claude)中如何发挥作用的内容、一个4块GEO框架以及一份全新的FAQ。

核心结论

在执行SEO审计之前,网站可能受到三个层面常见问题的影响。第一个是可抓取性和站点结构,决定每个页面的可访问程度。第二个是页面级SEO,聚焦于特定网站中每个页面的错误。

最后一个是技术SEO,关注你的网站在每种设备(包括PC、笔记本电脑、智能手机和平板电脑)上加载的速度。开展技术SEO审计意味着探查你网站的每个角落,在维持加载速度的同时提升搜索可见性。

当我正一鼓作气不断更新自己网站上的博客时,我对网站访客数量没有增加感到困惑。从WishThe Outline等各种网站每天都获得稳定的访客数量,而它们的更新频率和我差不多。

我查看了自己网站的数据,发现我的搜索排名也没有上升。

我研究了为什么这种情况会发生在我身上,然后偶然看到了这段视频:

在更多地了解了SEO审计并应用所学之后,这帮助我的网站在搜索引擎中变得更可见,访客数量按分钟级地增加!

注意这一点:如果你拥有自己的网站,并注意到搜索排名和访客数量没有变化或正在减少,你应该每月进行一次技术SEO审计。

在学习如何执行SEO审计之前,让我们看看会被提出的最常见问题,以及它们会对你的网站造成多大影响。它们由三个层面组成:

  1. 可抓取性和站点结构
  2. 页面级SEO
  3. 技术SEO

觉得这不适合你?让我来做

可抓取性和站点结构

这与你网站中每个页面的可访问程度有关。如果Googlebot无法抓取并索引你的整个站点,从长远看会严重损害你的搜索结果排名、观众和收入。

以下是你应避免的主要错误:

页面级SEO

上一层讨论的是整个网站,本节聚焦于你在自己网站每个页面上可能犯的错误。修正在此层发现的错误不仅会改善你网站的搜索排名,还会提升每个页面的站外表现。

以下是此层中你应警惕的关键错误清单:

相关:在此了解所有关于页面级SEO的内容

技术SEO

在本节中,看看你的网站不仅在PC和笔记本电脑等设备上的加载速度,还要看看在智能手机和平板电脑上的加载速度。亚马逊的一项研究表明,销售下降1%可能与额外100毫秒的加载时间相关联,避免此层中的任何错误将对你网站的增长产生积极影响。

以下是此层中需要警惕的关键错误清单:

网页上的以下元素可能影响此标准:

  1. 网站主机
  2. 大型图片
  3. 嵌入式视频
  4. 插件
  5. 广告
  6. 主题
  7. 小部件
  8. 重复脚本或密集代码。
  9. 旧技术

此方面指网站的制作方式。例如,如果一个网站使用PHP 4而不是当前的PHP 7,这被称为旧技术。

这一代网站需要多种元素,包括Google AnalyticsGoogle Tag Manager、Schema标记和robots.txt。Flash和iframe等元素需要立即移除,以便也提升加载时间。

除了Schema标记和robots.txt,你应确保它不被后者阻止。之后,通过不时检查使其在服务器上保持运行。

由于人手智能手机的增长呈指数级上升,你的网站必须制作得可在更小的设备(如智能手机、平板电脑和智能手表)上访问。这也归因于2018年12月宣布的Google移动优先索引服务。

除此趋势之外,已显示智能手机流量早已超过桌面端搜索很长时间了。

这意味着,无法使自己的网站适应这些趋势将一次性遭受点击率、搜索排名和潜在流量的重大损失。

了解了哪些SEO错误需要立即修复后,让我们现在深入了解如何执行你自己的技术SEO审计。

你也会想阅读我关于2021年20大SEO工具的指南

第1步:识别抓取错误

第一步是让你的网站接受审计并获取抓取报告。获取一份报告将帮助你了解上述错误中哪些需要立即缓解。

强烈建议你每月做一次,以保持网站没有SEO错误并尽可能优化。

在根据报告做任何更改之前,确保先创建网站的备份。

备份后,通过将大部分404错误重定向并将其转为301重定向来开始修复任何抓取错误。

然后,将更新后的网站交给开发团队,以确定原因,无论他们是否必须添加新的.html访问文件或增加服务器的内存限制。

此外,移除sitemap、内部链接和外部链接中的任何永久重定向。

第2步:检查HTTPS状态码

确保你的所有网站都使用HTTPS而非HTTP是必须的。除此之外,还应使用Google Search Console检查其他错误。

以下是你的网站可能存在的一些响应码:

  1. 301 — 常见的重定向
  2. 302 — 一种通常发生在电子商务网站上、当产品缺货时出现的错误代码
  3. 400 — 用户无法访问该页面
  4. 403 — 用户未被授权访问该页面
  5. 404 — 找不到页面,这可能是因为你删除了页面但没有添加301重定向
  6. 500 — 内部服务器错误,需要由Web开发团队修复

这样做将帮助移除任何4xx和5xx响应码,从而改善网站可抓取性和用户体验。

最后,检查所有SSL证书。这样做不仅会避免可抓取性错误,还会同时确保你与访客之间所有数据的安全。

关于SSL证书,你应优先尽快为你的域名和子域获取一个。访问没有该证书的网站的用户会在浏览器上收到”不安全”警告,从而在过程中减少你的访客数量。

第3步:检查XML sitemap状态

如上节所述,拥有sitemap将帮助你获得更高的搜索排名。这样做也将帮助搜索引擎爬虫找到你的网页。

编辑XML sitemap时需要注意

第4步:检查站点加载时间

让过去、现在和未来的访客能够访问你网站上的任何页面,是保持流量高的必要条件。

要做这一步,你可以使用Google的PageSpeed Insights或其他网站加载工具进行检查。理想情况下,应小于3秒。

解决这个问题可以通过整理出网站的哪些元素应进行优化以获得更快的加载时间和更好的用户体验来完成。

除此之外,检查服务器是否宕机或运行比平时慢。如果多个用户同时尝试访问服务器,这种情况可能发生,可能的应对方式是尽快升级。

然后,检查是否有任何子域被重定向到主网站。这样做将帮助避免在过程中你任何网站的任何页面完全不可见。

隐藏伪装(Cloaking)

如果你的网站出现在搜索结果中,但不包含用户所需的信息,这则被称为隐藏伪装(cloaking)。

这种现象的一个例子是,当爬虫从你的网站了解HTML文本,而向访客展示视觉内容。另一个是,如果你设计的网站文本颜色与背景相似。

如果你的网站存在此问题,强烈建议你立即通过重新组织每个网页的制作方式将其移除。这样做将防止过程中对你的整体排名造成任何负面伤害。

第5步:确保你的站点对移动端友好

在此步,可以使用Google移动端友好测试。只需在工具中输入你的网站,它就会生成一份关于你的网站在移动端如何工作以及需要改进什么的报告。

如何让网站对移动端友好的解决方案

第6步:审计关键词蚕食

此审计检查任何共享相同关键词的文章。拥有这些会让Google对应该优先考虑哪个页面感到困惑,因为它在搜索结果中可被查找到。

拥有这些重复站点将对你的点击率、权威性和转化率产生负面影响。

使用Google Search Console的性能报告检查哪些页面竞争相同的关键词,然后筛选出哪些页面在URL中使用相同的关键词,以及多少页面对相同的关键词进行排名。

重复站点也包括子域。子域的一个例子是有blog.yourwebsite.com,而yourwebsite.com作为你的主要域。

另一种优化所有页面上关键词使用的方法如下:

  1. 对顶级标题使用H1标签
  2. 对主要类别应用H2标签
  3. 对子类别和重要链接包括H3至H6
  4. 避免在多个标题中重复相同关键词
  5. 在一个H标签中编写整个页面内容
  6. 不要在标题中使用H标签
  7. 反转H标签的顺序
  8. 在单个页面上对所有标题使用H1,除非在一个页面上突出同等重要的主题
  9. 在你的主域和子域上都涵盖类似主题或针对相同关键词

第7步:检查你网站的robots.txt文件

对于此步,看看你的robots.txt文件,并查找其中的任何”Disallow”行。

拥有这些意味着你的一个或多个链接被阻止访问搜索引擎,并且无法在未来的搜索结果中显示。

通过禁止哪些网站被抓取并允许那些应该被抓取的网站,这不仅有助于提升你网站的可见性,也有助于提升你的搜索排名。

除此之外,确保将所有不允许的链接更新为小写。

然后,如果你拥有多个子域网站,请花时间为每个子域单独制作一个robots.txt。

接下来,移除任何带参数的URL、不可索引的页面,并为sitemap添加rel=“alternate”标签。

最后,在维护网站时始终正确使用robots.txt。有两个时间点需要检查它:开发期间和发布后。

开发期间,始终养成阻止robots.txt的习惯。这将防止任何页面索引不完整、未优化的内容,并将你网页的早期版本视为重复。

发布后,尽可能经常地检查其内容。这将防止任何页面被错误地排名,而修复此问题就像为搜索引擎设置抓取指令一样简单。

第8步:执行Google站内搜索

确保你的网站没有被Google处罚或被阻止索引的一种方法是简单地在Google上搜索它。

只需在Google搜索栏中输入”site:“,然后在冒号后添加你的网站,并检查哪些页面被引擎索引。这样做将帮助你返回到前面的步骤,并在那里执行任何错误检查作为改进。

例如,如果其他品牌出现在结果中,请立即解决,因为这可能是你网站中存在更大问题的原因。解决此问题需要深入研究其分析。

然后,如果主页没有显示为第一个结果,手动检查它以查看缺少什么。务必弄清楚它是否有处罚或在站点架构不佳之内。

最后,与Google提供的搜索结果交叉对比有机着陆页的数量。这样做将帮助了解这些引擎认为有价值的是什么。

另外,在这里阅读如何让你的网站登上Google顶端

第9步:检查重复元数据

在第六步,我们讨论了你可以通过纠正在URL中具有相同关键词或在相同关键词上排名的站点来移除关键词蚕食。在此步中,我将向你介绍另一个避免此问题的解决方案。

它由两个字命名:meta描述。

根据研究,54%在不同站点上有重复meta描述,而63%缺失。

要发现它们,首先获取详细的SEO审计或抓取报告。然后,可以继续修改你的具有高排名和价值的网站,记住要使所有meta描述在页面之间唯一。

第10步:meta描述长度

延续上一步,关于meta描述可能遇到的另一个问题是它太长。

最近,其长度从160变更为320字符。利用大部分或所有可用字符添加产品规格和位置等关键元素可以帮助提高点击率。

第11步:检查站点范围内的重复内容

除了在第9步中提到的重复meta描述外,你还应处理网站内的其他重复内容。

整个网站内可能重复的其他内容包括以下内容:

发现这些错误的一种方法是使用诸如Copyscape、Screaming Frog、Sitebulb或SEMrush等工具。

了解关注区域后,修复它们将包括以下一个或全部步骤:

  1. 为所有页面添加canonical标签,以让Google知道每个页面的首选URL是什么。
  2. 添加no-follow链接,以防止将页面的SEO传递给另一个网站。
  3. 在robots.txt中禁止不正确的URL。
  4. 重写所有内容,包括正文文本和元数据。
  5. 手动审查并修复任何分页错误。

第12步:检查损坏的链接

技术SEO报告中要检查的最后一项是是否有不良链接。这种错误的任何类型都会将你的网站引入一系列其他问题,例如浪费抓取预算、糟糕的用户体验和较低的搜索排名。

了解具体在哪里这些错误后的第一步是移除所有将用户重定向到旧404页面的页面的所有出现,并使用它们各自的内部链接更新它们。下一步是移除页面之间的中间重定向。

这样做将帮助降低你网站的抓取预算。这意味着所有网站页面都能正确呈现,同时使主机的加载高效。

简而言之,这将有助于在长期保持用户体验积极。你可以为此使用诸如Broken Link Checker等插件。

核心结论

总结来说,执行技术SEO审计意味着探查你网站的每个角落,以保持其加载快速,同时改善搜索排名。从内容到XML sitemap,确保备有工具用于检查任何错误并立即解决它们。

仍感到困惑或不知所措?没问题,我可以处理审计,并给你一份带有优先级修复的可执行计划。如果你感兴趣,请查看此产品:

准备好将这些技巧应用到你自己的网站以帮助它成长了吗?如果准备好,你可以通过查看以下文章了解更多:

技术SEO审计在AI搜索引擎(ChatGPT、Perplexity、Google AI Overviews、Claude)中如何运作

AI引擎拥有自己的爬虫——GPTBot(OpenAI)、PerplexityBot、ClaudeBot(Anthropic)、Google-Extended(Google的AI训练爬虫)、CCBot(Common Crawl)。每个对robots.txt指令的尊重(或忽视)方式不同,每个在JS渲染和速率限制方面也有自己的注意事项。2026年的技术审计应包括逐爬虫检查。

2026年实用审计补充:验证你的robots.txt允许你希望被索引的AI爬虫(或阻止你不希望的爬虫);验证llms.txt存在于根目录并保持最新;验证JSON-LD schema在主要页面模板上正确渲染;测试AI引擎能否实际访问JS渲染的内容(对几个页面进行抽样查询,看看引用了什么)。

用于技术SEO审计的4块GEO框架

  1. 以TL;DR开头。 在文章顶部用2-4个句子直接回答头部查询。AI Overviews和Perplexity优先引用此块。
  2. 添加分步编号章节。 生成式引擎比散文更可靠地将干净的有序列表提取到其答案中。
  3. 以FAQ收尾。 使用人们在你的细分领域实际提出的问题的字面措辞;用FAQPage schema标记。
  4. 引用一手来源。 链接到Google自己的AI Overviews文档、OpenAI的结构化数据指南以及Anthropic的内容质量文章。LLM信任那些引用模型提供商本身的页面。

AI SEO + GEO的内部阅读

如果你正将其纳入你的技术栈,也请阅读:完整的2026年SEO指南schema标记教程

FAQ — AI搜索时代的技术SEO审计

我应该在2026年阻止GPTBot吗?

按站点逐一决定。阻止它会将你从ChatGPT的训练池中移除,但不会阻止ChatGPT浏览模式在实时查询中引用你。2026年大多数出版商允许GPTBot;一些细分/IP敏感的出版商会阻止它。

llms.txt现在是标准技术SEO审计的一部分吗?

是的——审计应检查llms.txt存在于根目录、列出当前的支柱内容并与实际站点结构匹配。过时的llms.txt比没有更糟。

2026年损害AI搜索的最常见技术SEO错误是什么?

仅通过JavaScript渲染的关键内容。一些AI爬虫可靠地处理JS,其他则不能。TL;DR + FAQ + schema的服务端渲染覆盖所有爬虫。


我接下来会把这个带向何方

如果你在上面的任何循环中运作,我会构建定制化AI智能体 系统来自动化它们。你正在阅读的整个网站 就是一个——这是技术栈

2026年5月更新

2026年的SEO相比2020年代的剧本已经面目全非。对于2024年中期之前写的任何内容,有三个重要变化:

  1. AI Overviews是SERP新的第零位置。 Google的AI Overviews默认出现在大约60%的美国信息查询中,蚕食了大部分”什么是”/“如何做”的CTR。优化以在AI Overview内被引用现在与排名第1同等重要。
  2. GEO(生成式引擎优化)是跨引擎优化的工作术语——在ChatGPT、Perplexity、Claude和Gemini的答案中被引用。~12%的高意图商业查询在2025年底的样本研究中显示来自这些引擎的直接引用流(对比2023年前为零)。
  3. **E-E-A-T(现在是E^3-A-T,Experience + Expertise + Establishment + Authoritativeness + Trustworthiness)**继续是Google内部使用的框架——“Establishment”是2024年的新增项,强调品牌级别的信号。

工具格局(2026年5月):Ahrefs和Semrush都推出了生成式引擎跟踪。Surfer SEO + Topical Authority阵营添加了GEO评分。Screaming Frog仍是标准爬虫。AlsoAsked、Keyword Insights和Frase大力转向AI Overview片段工程。

如果此文写于2024年5月之前,将其核心建议视为Google搜索基线,并在其上叠加GEO剧本。

继续阅读

将AI实战手册发送到您的邮箱

每周三。28,400+ 读者。纯干货。

↵ 查看全部结果 esc esc 关闭