ChatGPT Search 与 Google:50 个头部词的并排测试
我在 ChatGPT search 和 Google(开启 AI Overviews)中运行了同样的 50 个头部词,记录了每个引擎引用了哪些来源。来源重叠约为 40%——其余时间里,两个引擎呈现的是完全不同的来源。
每周三。28,400+ 读者。纯干货。
✓ 请查收邮箱 — 点击确认链接以完成订阅。
✓ 订阅成功!
✓ 您已在订阅列表中。
目录
[操盘者视角] 我是在自己正在构建的 AI 智能体系统内部写下这些内容的——既为自己,也为客户。下面写的是当一个 agent 真正跑通循环时实际有效的做法,而不是 LinkedIn 上的版本。
TL;DR
我在 ChatGPT search 和 Google(开启 AI Overviews)中运行了同样的 50 个头部词,记录了每个引擎引用了哪些来源。来源重叠约为 40%——其余时间里,两个引擎呈现的是完全不同的来源。本文涵盖方法论、它们出现分歧的模式,以及结果对于为两者优化内容意味着什么。
并排对比电子表格 alejandrorioja.com — AI SEO + GEO
同样的 50 个头部词,两个引擎,并排比较。被引用来源的重叠度比我预期的更低——大约 40%。另外 60% 完全是不同的来源。
设置
2026 年中,我挑选了 50 个头部词,涵盖 SEO、营销以及面向操盘者的内容话题。对每个词,我用同一查询分别通过 ChatGPT search(已登录、开启 browse 模式、美式英语)和开启 AI Overviews 的 Google(无痕、美式英语、桌面端)运行。对每个引擎,我都记录了被引用的来源。
事前的假设:会有相当大的重叠。两个引擎都从开放网络中抓取;针对同一查询,它们想必会汇聚到同样的权威来源。结果是,重叠比我预期的要少。
主要结论
在 50 个头部词上,ChatGPT 与 Google 在被引用来源上的平均重叠率为 41%。翻译一下:在同一查询中,被任一引擎引用的来源里,大约 10 个里有 4 个会出现在另一个引擎的引用列表中。另外 60% 完全是不同的来源。
这是一个比我设想的宽得多的分歧。它改变了优化的算盘——被一个引擎引用并不能可靠地让你被另一个引擎引用。
引擎达成一致的地方
这 41% 的重叠集中在两类来源:
- 已确立的细分领域权威站点。 Backlinko、Ahrefs 博客、Moz、SEMrush 博客、Search Engine Journal——两个引擎在 SEO 类查询中都会一贯引用这些。Domain authority 是共同信号。
- Wikipedia 与一手资料文档。 在定义类查询上,两个引擎都会去找同样的规范性参考。
在这些类型的来源上,引擎是收敛的。如果你是一个具有 domain authority 的站点,或者你提供的是规范性参考内容,那两边都会引用你。
引擎出现分歧的地方
那 60% 的分歧可拆解为几个清晰的模式:
- ChatGPT 比 Google AI Overviews 更频繁地引用 Reddit、Hacker News 和 Stack Overflow。 ChatGPT 引用中大约有 22% 来自论坛式来源;Google AI Overview 引用中大约 7%。论坛在 ChatGPT 的引用池中占据更大的比重。
- Google AI Overviews 比 ChatGPT search 更频繁地引用 YouTube 视频。 特别是在”如何做”类查询上。约 18% 的 Google AI Overview 引用包含视频;ChatGPT 引用中约 6%。
- 对时间敏感的查询,ChatGPT 更偏好近期发布的来源。 Google AI Overviews 更保守——即使在新鲜度本应重要的查询上,它也优先引用较老的已确立来源。
- 对产品类查询,Google AI Overviews 优先引用电商和聚合站。 ChatGPT 更均匀地把引用分布在卖家站点、评测站点和 Reddit 帖之间。
这对优化意味着什么
三个值得据此行动的启示:
- 显式地为两个引擎做优化。 单引擎优化会因为引擎之间的分歧而把引用机会丢在桌上。两边都跟踪引用份额;分别补齐缺口。
- 为了 ChatGPT 的可见度,建立论坛存在感。 在你的细分领域里放置几条优质的 Reddit 帖或 Stack Overflow 回答,能带来纯博客 SEO 拿不到的 ChatGPT 引用。
- 为了 Google AI Overview 在”如何做”类查询上的可见度,投入视频。 一段 YouTube 视频配一篇博客文章——两者标题和主题聚焦一致——其综合被引用率高于仅有博客的内容。
方法论细节
- 50 个头部词,覆盖 SEO、营销策略、内容营销、AI 工具以及面向操盘者的话题。词的挑选偏向有商业意图或调研意图的查询。
- 3 轮测量 — 第 1 周、第 2 周、第 3 周 — 用来平滑掉引擎个性化带来的噪声。
- 引用按二值记录 — 来源被引用即记 1,未引用即记 0。我没有尝试去量化它在回答中的位置或权重。
- 两个引擎都采用默认设置 — 没有自定义 system prompt,没有高级运算符。尽量贴合典型用户会看到的状态。
- 一个细分领域,一个测试者。 是否能推广到其他领域和其他测试者还不确定。
按来源类型的分布
在 50 条查询上被两个引擎引用过的去重来源中:
- 已确立的博客/权威站点:占引用 47%
- 论坛/社区(Reddit、HN、SO):占引用 14%
- YouTube 与视频来源:占引用 12%
- Wikipedia 与一手文档:占引用 8%
- 新闻站点:占引用 6%
- 卖家/产品站点:占引用 5%
- 个人博客/细分站点:占引用 5%
- 其他/聚合器/工具:占引用 3%
已确立的博客/权威站点仍然占主导,但不到引用总量的一半。论坛、视频和个人博客组成的长尾比我预期的要大。
我自己的站点出现在哪些地方
在 50 个头部词中,alejandrorioja.com 在 ChatGPT search 上被 8 条查询引用,在 Google AI Overviews 上被 11 条查询引用。重叠:5 条被两边都引用。
模式是:Google AI Overviews 偏向引用更像 pillar、听起来更权威的文章。ChatGPT 引用的组合略有不同,包含了几篇更具观点、第一人称写作的文章。品牌语调文件里强调的那种”操盘者声音”在 ChatGPT 上能获得 Google AI Overviews 给不到的牵引力。
这是个有用的信号——同样的话题上,不同的语调寄存器会被不同的引擎奖励。
接下来我会测试什么
- 用 Perplexity 与 Claude 跑同样的测试。 四方对比能更完整地刻画引用版图。
- 6 个月之后再跑同样的 50 个词。 引用池会迁移;跟踪变化的节奏,对于保持优化很重要。
- 针对引擎分歧最大的查询做逐词的根因分析。 大概率背后有一个驱动分歧的内容类型信号;识别出来能让优化建议更锐利。
- 在非 SEO 细分领域里复现 — 金融、健康、B2B SaaS — 看重叠率能否一般化,还是与细分领域强相关。
FAQ
2026 年 ChatGPT search 比 Google 更大吗?
不,按总查询量看不是——Google 处理的搜索量仍然远多于 ChatGPT。但在调研驱动的查询(用户要的是综述而非链接)上,ChatGPT search 的份额已经相当可观,而且在 2025–2026 年间显著增长。
在 AI SEO 工作中,我应该优先考虑哪一个引擎?
两个都要优化。结构性动作(TL;DR、FAQ、schema)对两边都有效。引擎分歧主要体现在来源类型偏好(论坛之于 ChatGPT,视频之于 Google),所以问题更多是该往哪些内容类型投入。
对于给定查询,引用池多久变化一次?
比我想的要慢——对稳定的头部词,同样的 4–5 个来源会周复一周地出现。新入场者要花几周才能挤进去;已确立的来源除非内容过时,否则很少掉出。
同时被两个引擎引用,最容易的方法是什么?
构建一篇高权威的 pillar 文章,叠加 GEO 结构层(TL;DR + 分步说明 + FAQ + 一手来源引用 + schema),同时配套一段 YouTube 视频,再配套一个 Reddit 帖或 HN 讨论。这种组合把两个引擎对来源类型的偏好都覆盖到了。
这些结果一年后还会成立吗?
方法论会成立;具体数字会变。AI 引擎在 2026 年的演进很快。如果你依赖这些数据,请按季度重测;可以认为方向性的发现比具体的百分比更持久。
想在自己站点上把这一套搭起来? 阅读完整的 SEO + GEO playbook 或者 与我联系 — 我为想在经典 Google 和 AI 引擎两边同时累积可见度的操盘者团队提供 AI SEO + GEO 咨询项目。
2026 年 5 月更新
2026 年的 AI 工具版图演化很快——这一节是操盘者视角的快照:
- OpenAI 在 2025 年中发布了 GPT-5;ChatGPT 与 API 现在都是混合系统(GPT-5 加上更小的快速模型,自动路由)。Sora 在视频侧已经完整上线。DALL·E 3 仍在 ChatGPT 内部产出图像。
- Anthropic 在持续发布 Claude 4.x 家族(2025 年末到 2026 年初是 4.5 → 4.6 → 4.7)。1M 上下文窗口让对整个代码库或整本书的推理成为可能。Claude Code 是许多工程团队默认的 CLI agent。
- Google 当前主力是 Gemini 2.5 Pro,加上面向速度的 2.5 Flash 家族;Gemini 是 Google Workspace、Android 以及更名后的 Google Search AI Overviews 内部的模型。
- xAI 的 Grok 在 2024 年末越过 Grok 3,是 X Premium 内部的默认模型。
- 图像增强:大多数现在由三大模型厂商原生托管(
Image Upscale和Generative Fill内置于 ChatGPT 与 Gemini)。Topaz Photo AI、Magnific 和 Krea AI 这类独立工具仍在质量上领先,但下限被显著抬高。
如果你正在读的文章推荐了某个具体的 AI 工具,请核对当前模型——在 2026 年,大多数工具每 4–6 个月就会发布一次主要新版本。
每周三。28,400+ 读者。纯干货。
✓ 请查收邮箱 — 点击确认链接以完成订阅。
✓ 订阅成功!
✓ 您已在订阅列表中。
将AI实战手册发送到您的邮箱
每周三。28,400+ 读者。纯干货。
请查收邮箱。
我们已向您发送确认邮件 — 点击其中的链接以完成订阅。如果一分钟内没收到,请检查垃圾邮件。
订阅成功。
欢迎 — 下一期很快就会送达您的邮箱。
您已在订阅列表中 — 每周三留意查收。