Google Top 3 页面也在互相复读？我读完这篇 Information Gain 研究后的几点判断

大罗本罗

Posted on 2026-06-16

Eric Lancheres 最近在 On-Page.ai 发了一篇研究，我觉得所有还在用 AI 批量写 SEO 内容的人，都应该认真看一下。

这篇文章不是那种泛泛而谈的「AI 内容未来趋势」。

它做了一件很具体的事：

扫描 50 个关键词、10 个行业、150 个 Google Top 3 页面，然后给每个页面打一个 Information Gain Score。

用人话说就是：

一个页面排在 Google 前 3，它到底有没有讲出同一个搜索结果里其他页面没讲过的东西？

这个问题非常关键。

因为过去几年，很多 SEO 内容团队的工作流其实特别粗暴：

把 Top 10 抓下来
把目录合并一下
让 AI 补长一点
标题里塞关键词
最后生成一篇看起来更完整的文章

这套东西以前能跑，是因为 Google 很多时候确实奖励「覆盖足够完整」。

但这篇研究提醒我们一件事：

完整，已经越来越不稀缺了。

新信息，才稀缺。

Information Gain 概念图 — 图源：Eric Lancheres / On-Page.ai Research, “Information Gain in Google’s Top-Ranking Results: A Measurement of 150 Pages”

1 – 这篇研究到底测的是什么？

Information Gain 这个词，很多人会翻译成「信息增益」。

听起来有点学术，其实特别好理解。

假设用户搜一个关键词，Google 第一页已经有 10 篇文章了。

这 10 篇文章共同覆盖了一堆定义、优缺点、购买建议、常见问题。

这些东西就叫 SERP baseline，也就是搜索结果里的基础信息池。

那你的页面如果只是把这些东西换个顺序、换个说法、写得更长一点，本质上没有增加多少新信息。

Eric 在原文里用了一个公式：

G = P ∖ B

翻译成人话就是：

你的页面 P，减掉这个 SERP 里大家都已经讲过的基础内容 B，剩下来的部分，才是你的信息增益 G。

这个视角很有意思。

因为它不是问「你有没有写得全面」。

它问的是：

你有没有给这个搜索结果增加新的东西。

这个判断会逼我们重新看 AI 内容。

很多 AI SEO 内容看起来很完整，其实只是把 baseline 重新包装了一遍。

2 – 最打脸的数据：Top 3 页面也没那么原创

这篇研究里最重要的数据是：

150 个 Google Top 3 页面，Information Gain Score 的中位数只有 52/100。

也就是说，一个排名非常靠前的页面，大概一半内容都能在同一个 SERP 的其他页面里找到语义相近的版本。

更具体一点：

21% 的 Top 3 页面属于 highly original，信息增益 70 分以上
55% 属于 moderately original，40-69 分
24% 属于 mostly shared，低于 40 分

这个结果说明什么？

说明 Google Top 3 里面，也有不少页面其实没贡献太多新东西。

很多人看到这里可能会问：

那是不是说明 Information Gain 根本不是排名因素？

别急。

Eric 原文里也讲得很谨慎：Google 有相关专利，但专利不等于确认的排名系统。

这点要给原作者 credit，他没有硬吹「我发现了 Google 新排名因子」。

他更像是在说：

排名靠前的页面里，原创信息并没有我们想象中那么多，所以这里还有很大的内容机会。

我比较认同这个判断。

SEO 很多时候不是改一个点，然后排名马上暴涨。

更多时候是先找出某个 SERP 里现有内容没讲清楚的地方，然后持续把这些地方补扎实。

这比追一个所谓的新排名因子靠谱得多。

3 – 排名第 1，并不代表信息增益最高

这篇文章还有一个挺反直觉的数据：

Top 1、Top 2、Top 3 的信息增益中位数几乎一样。

Position 1：52
Position 2：51.5
Position 3：52

也就是说，在前三名里面，谁排第一，跟谁更原创没有明显关系。

这点很重要。

因为 SEO 排名从来不是单变量游戏。

一个页面能排第一，可能是因为：

域名权重更强
外链更多
站点主题权威更高
页面体验更好
品牌点击更强
历史表现更稳定
内容刚好更匹配这个 query 的主意图

所以不要把 Information Gain 理解成「只要我加原创数据，就一定冲第一」。

这就太天真了。

我的理解是：

Information Gain 更像内容竞争力的一部分。

它不一定决定你今天排第 1 还是第 3。

但如果你的页面长期只是重复别人，Google 和 AI 答案引擎都没有太多理由反复引用你。

尤其是 AI Overviews、ChatGPT、Perplexity 这些答案引擎开始吃内容之后，重复信息的价值会进一步下降。

因为机器根本不缺第 11 个同义改写版本。

机器缺的是可引用的新事实、新案例、新判断。

Unique data points 与 Information Gain Score — 图源：Eric Lancheres / On-Page.ai Research, “Information Gain in Google’s Top-Ranking Results: A Measurement of 150 Pages”

4 – 真正值钱的是 unique data points

整篇文章里，我最看重的是这个数据：

页面里有 15 个以上 unique data points 的，平均 Information Gain Score 是 62.1。

页面里只有 0-1 个 unique data points 的，平均只有 40.2。

差了 20 多分。

这背后其实就是一句老话：

内容不要只写观点，要写证据。

什么叫 unique data points？

不是那种随便引用别人报告里的「80% 的用户认为 xxx」。

而是这个页面自己贡献的具体信息。

比如：

SaaS 产品真实 onboarding 完成率
某个功能上线后 30 天的激活变化
外贸询盘从点击到成交的平均周期
某类 B2B 产品的 MOQ、交期、认证成本
跨境电商某个品类的退货率、广告 CPA、履约时间
你自己跑过 50 个页面之后总结出的标题改写结果

这些东西是 AI 很难凭空生成的。

就算 AI 能编，它也没有可信度。

而且这类信息有一个特别大的好处：

它会让你的内容和别人不一样。

因为别人可以抄你的 H2，可以抄你的结构，可以抄你的观点。

但别人很难抄你的真实数据和真实经历。

这也是为什么我一直说，SEO 内容以后不能只靠写手整理资料。

纯写手型内容会越来越难。

因为写手可以整理信息，但很难生产事实。

SERP 未回答问题分布 — 图源：Eric Lancheres / On-Page.ai Research, “Information Gain in Google’s Top-Ranking Results: A Measurement of 150 Pages”

5 – 90% 的 SERP 都还有没被回答的问题

这篇研究还有一个很有意思的发现：

在 90% 的 SERP 里，Top 3 页面至少漏掉了一个常见主题问题。

60% 的 SERP 里，有 3 个以上没被 Top 3 回答的问题。

这句话对内容团队很有用。

以前我们做内容 brief，经常会看：

Top 10 都有哪些 H2
他们用了什么标题
他们覆盖了哪些 FAQ
他们内容长度是多少

但我觉得以后更应该加一个动作：

找 Top 3 没回答的问题。

这个动作比单纯「补 FAQ」有用。

FAQ 很容易写成垃圾扩写。

真正有价值的是找到用户做决策时还卡住的那一块。

举个栗子。

如果你做一个 B2B SaaS 的「best CRM for manufacturers」页面，大家可能都在讲功能对比、价格、集成、评分。

但用户真正关心的可能是：

从 Excel 迁移到 CRM 要多久？
销售团队不愿意填数据怎么办？
制造业报价周期长，CRM pipeline 应该怎么设？
ERP 和 CRM 数据冲突时，以哪个为准？
老板想看预测，销售只想少填表，这个矛盾怎么解决？

这些问题如果 Top 3 都没讲，你讲了，而且讲得具体，页面就开始有自己的价值。

这就是 Information Gain 最实用的地方：它逼你从「别人写了什么」转向「用户还缺什么」。

不同行业 Information Gain 中位数 — 图源：Eric Lancheres / On-Page.ai Research, “Information Gain in Google’s Top-Ranking Results: A Measurement of 150 Pages”

6 – 为什么健康类内容信息增益最低，法律类最高？

原文里还有一个行业差异：

Legal 法律类的中位数最高，62。

Health 健康类最低，42。

这个结果我觉得挺合理。

健康类内容为什么低？

因为它受到很多限制。

大家都要引用权威医学信息，都要写症状、原因、治疗方式、什么时候看医生。

你不能乱讲，也不应该乱讲。

所以内容很容易长得像。

法律类为什么更高？

因为法律内容更容易出现地区差异、案例差异、流程差异、费用差异。

比如同样是 personal injury lawyer，不同州的时效、赔偿、诉讼流程、保险沟通方式都可能不一样。

这些细节本身就会让内容和别人不一样。

这个对外贸和 B2B 网站也有启发。

如果你的行业本身很容易写成标准答案，那你就更要主动制造差异。

不要只写「什么是 injection molding」。

你要写：

不同材料的模具寿命差异
小批量打样和量产报价为什么差这么多
美国客户最常卡在哪些认证
从图纸到样品通常要几轮修改
什么情况下中国供应商会拒绝接单

这些才是采购真正想知道，但搜索结果里经常没人讲透的东西。

7 – 对 SEO 内容团队来说，接下来应该怎么改工作流？

如果我是一个内容团队，我不会把这篇研究理解成「以后每篇文章都要做原创研究」。

那不现实。

尤其是中小企业、外贸站、SaaS startup，不可能每篇文章都搞一份大报告。

但你可以把内容 brief 改掉。

以前的 brief 可能是：

关键词
搜索意图
Top 10 结构
推荐字数
必须覆盖的实体词
FAQ

现在应该加 4 个栏目：

1 – SERP baseline

这个关键词下，大家都已经讲了什么？

把这些内容列出来，但不要把它当成「我要照抄的目录」。

它只是基础盘。

2 – Missing questions

Top 3 没回答什么？

哪些问题用户会问，但现有内容没讲清楚？

尤其关注价格、时间、风险、失败、取舍、实施细节。

3 – Unique evidence

这篇文章能不能放进 3-10 个自己的证据？

比如客户案例、后台截图、报价区间、测试结果、项目经验、真实流程。

数量不用一上来就 15 个。

先从 3 个开始。

4 – Point of view

这篇文章有没有一个明确判断？

如果整篇文章只是「A 有好处，B 也有好处，大家根据情况选择」，读者看完也不会记住你。

读者不是来听你端水的。

读者是来找判断的。

8 – 我对这篇文章的最终解读

Eric 这篇研究真正有价值的地方，不是告诉我们一个新的「排名因子」。

它更像是把 SEO 内容的一个老问题量化了：

大量排名页面其实是在互相复述。

而且哪怕是 Top 3，也没那么神。

这反而说明后来者还有机会。

如果你的网站权重不强、预算不大、外链也没那么多，那你更不能继续写那种「更完整但没新东西」的文章。

你打不过大站的权重，就别继续在「谁写得更全」这件事上硬拼。

你要拼它们没有的东西：

真实案例
真实数据
真实成本
真实失败
真实判断

说白了，未来 SEO 内容的门槛会从「会不会写」变成「你有没有东西可写」。

AI 可以把一句话扩成 2000 字。

但它不能替你跑客户项目，不能替你看真实后台，不能替你踩坑，也不能替你形成判断。

所以这篇文章我建议大家收藏。

不是因为它给了一个万能公式。

而是因为它提醒我们：

别再只做搜索结果的复读机了。

你要给 Google，也给用户，贡献一点真的东西。

原文 credit：Eric Lancheres / On-Page.ai Research

原文标题：Information Gain in Google’s Top-Ranking Results: A Measurement of 150 Pages

原文链接：https://api.on-page.ai/research/information-gain-study

发布日期：2026 年 6 月 12 日

Published by

大罗本罗

精通SEO和摸鱼

All stories by 大罗本罗

Google Top 3 页面也在互相复读？我读完这篇 Information Gain 研究后的几点判断

大罗本罗

1 – 这篇研究到底测的是什么？

2 – 最打脸的数据：Top 3 页面也没那么原创

3 – 排名第 1，并不代表信息增益最高

4 – 真正值钱的是 unique data points

5 – 90% 的 SERP 都还有没被回答的问题

6 – 为什么健康类内容信息增益最低，法律类最高？

7 – 对 SEO 内容团队来说，接下来应该怎么改工作流？

1 – SERP baseline

2 – Missing questions

3 – Unique evidence

4 – Point of view

8 – 我对这篇文章的最终解读

Published by

大罗本罗

Keep Reading...

AI搜索来了之后，博客到底还值不值得做？

用竞品 Alternative 页面，截走对手的搜索流量

如何免费获取DR90的高权重外链