Google Top 3 页面也在互相复读?我读完这篇 Information Gain 研究后的几点判断

 

Eric Lancheres 最近在 On-Page.ai 发了一篇研究,我觉得所有还在用 AI 批量写 SEO 内容的人,都应该认真看一下。

这篇文章不是那种泛泛而谈的「AI 内容未来趋势」。

它做了一件很具体的事:

扫描 50 个关键词、10 个行业、150 个 Google Top 3 页面,然后给每个页面打一个 Information Gain Score。

用人话说就是:

一个页面排在 Google 前 3,它到底有没有讲出同一个搜索结果里其他页面没讲过的东西?

这个问题非常关键。

因为过去几年,很多 SEO 内容团队的工作流其实特别粗暴:

  • 把 Top 10 抓下来
  • 把目录合并一下
  • 让 AI 补长一点
  • 标题里塞关键词
  • 最后生成一篇看起来更完整的文章

这套东西以前能跑,是因为 Google 很多时候确实奖励「覆盖足够完整」。

但这篇研究提醒我们一件事:

完整,已经越来越不稀缺了。

新信息,才稀缺。

Information Gain 概念图
图源:Eric Lancheres / On-Page.ai Research, “Information Gain in Google’s Top-Ranking Results: A Measurement of 150 Pages”

1 – 这篇研究到底测的是什么?

Information Gain 这个词,很多人会翻译成「信息增益」。

听起来有点学术,其实特别好理解。

假设用户搜一个关键词,Google 第一页已经有 10 篇文章了。

这 10 篇文章共同覆盖了一堆定义、优缺点、购买建议、常见问题。

这些东西就叫 SERP baseline,也就是搜索结果里的基础信息池。

那你的页面如果只是把这些东西换个顺序、换个说法、写得更长一点,本质上没有增加多少新信息。

Eric 在原文里用了一个公式:

G = P ∖ B

翻译成人话就是:

你的页面 P,减掉这个 SERP 里大家都已经讲过的基础内容 B,剩下来的部分,才是你的信息增益 G。

这个视角很有意思。

因为它不是问「你有没有写得全面」。

它问的是:

你有没有给这个搜索结果增加新的东西。

这个判断会逼我们重新看 AI 内容。

很多 AI SEO 内容看起来很完整,其实只是把 baseline 重新包装了一遍。

2 – 最打脸的数据:Top 3 页面也没那么原创

这篇研究里最重要的数据是:

150 个 Google Top 3 页面,Information Gain Score 的中位数只有 52/100。

也就是说,一个排名非常靠前的页面,大概一半内容都能在同一个 SERP 的其他页面里找到语义相近的版本。

更具体一点:

  • 21% 的 Top 3 页面属于 highly original,信息增益 70 分以上
  • 55% 属于 moderately original,40-69 分
  • 24% 属于 mostly shared,低于 40 分

这个结果说明什么?

说明 Google Top 3 里面,也有不少页面其实没贡献太多新东西。

很多人看到这里可能会问:

那是不是说明 Information Gain 根本不是排名因素?

别急。

Eric 原文里也讲得很谨慎:Google 有相关专利,但专利不等于确认的排名系统。

这点要给原作者 credit,他没有硬吹「我发现了 Google 新排名因子」。

他更像是在说:

排名靠前的页面里,原创信息并没有我们想象中那么多,所以这里还有很大的内容机会。

我比较认同这个判断。

SEO 很多时候不是改一个点,然后排名马上暴涨。

更多时候是先找出某个 SERP 里现有内容没讲清楚的地方,然后持续把这些地方补扎实。

这比追一个所谓的新排名因子靠谱得多。

3 – 排名第 1,并不代表信息增益最高

这篇文章还有一个挺反直觉的数据:

Top 1、Top 2、Top 3 的信息增益中位数几乎一样。

  • Position 1:52
  • Position 2:51.5
  • Position 3:52

也就是说,在前三名里面,谁排第一,跟谁更原创没有明显关系。

这点很重要。

因为 SEO 排名从来不是单变量游戏。

一个页面能排第一,可能是因为:

  • 域名权重更强
  • 外链更多
  • 站点主题权威更高
  • 页面体验更好
  • 品牌点击更强
  • 历史表现更稳定
  • 内容刚好更匹配这个 query 的主意图

所以不要把 Information Gain 理解成「只要我加原创数据,就一定冲第一」。

这就太天真了。

我的理解是:

Information Gain 更像内容竞争力的一部分。

它不一定决定你今天排第 1 还是第 3。

但如果你的页面长期只是重复别人,Google 和 AI 答案引擎都没有太多理由反复引用你。

尤其是 AI Overviews、ChatGPT、Perplexity 这些答案引擎开始吃内容之后,重复信息的价值会进一步下降。

因为机器根本不缺第 11 个同义改写版本。

机器缺的是可引用的新事实、新案例、新判断。

Unique data points 与 Information Gain Score
图源:Eric Lancheres / On-Page.ai Research, “Information Gain in Google’s Top-Ranking Results: A Measurement of 150 Pages”

4 – 真正值钱的是 unique data points

整篇文章里,我最看重的是这个数据:

页面里有 15 个以上 unique data points 的,平均 Information Gain Score 是 62.1。

页面里只有 0-1 个 unique data points 的,平均只有 40.2。

差了 20 多分。

这背后其实就是一句老话:

内容不要只写观点,要写证据。

什么叫 unique data points?

不是那种随便引用别人报告里的「80% 的用户认为 xxx」。

而是这个页面自己贡献的具体信息。

比如:

  • SaaS 产品真实 onboarding 完成率
  • 某个功能上线后 30 天的激活变化
  • 外贸询盘从点击到成交的平均周期
  • 某类 B2B 产品的 MOQ、交期、认证成本
  • 跨境电商某个品类的退货率、广告 CPA、履约时间
  • 你自己跑过 50 个页面之后总结出的标题改写结果

这些东西是 AI 很难凭空生成的。

就算 AI 能编,它也没有可信度。

而且这类信息有一个特别大的好处:

它会让你的内容和别人不一样。

因为别人可以抄你的 H2,可以抄你的结构,可以抄你的观点。

但别人很难抄你的真实数据和真实经历。

这也是为什么我一直说,SEO 内容以后不能只靠写手整理资料。

纯写手型内容会越来越难。

因为写手可以整理信息,但很难生产事实。

SERP 未回答问题分布
图源:Eric Lancheres / On-Page.ai Research, “Information Gain in Google’s Top-Ranking Results: A Measurement of 150 Pages”

5 – 90% 的 SERP 都还有没被回答的问题

这篇研究还有一个很有意思的发现:

在 90% 的 SERP 里,Top 3 页面至少漏掉了一个常见主题问题。

60% 的 SERP 里,有 3 个以上没被 Top 3 回答的问题。

这句话对内容团队很有用。

以前我们做内容 brief,经常会看:

  • Top 10 都有哪些 H2
  • 他们用了什么标题
  • 他们覆盖了哪些 FAQ
  • 他们内容长度是多少

但我觉得以后更应该加一个动作:

找 Top 3 没回答的问题。

这个动作比单纯「补 FAQ」有用。

FAQ 很容易写成垃圾扩写。

真正有价值的是找到用户做决策时还卡住的那一块。

举个栗子。

如果你做一个 B2B SaaS 的「best CRM for manufacturers」页面,大家可能都在讲功能对比、价格、集成、评分。

但用户真正关心的可能是:

  • 从 Excel 迁移到 CRM 要多久?
  • 销售团队不愿意填数据怎么办?
  • 制造业报价周期长,CRM pipeline 应该怎么设?
  • ERP 和 CRM 数据冲突时,以哪个为准?
  • 老板想看预测,销售只想少填表,这个矛盾怎么解决?

这些问题如果 Top 3 都没讲,你讲了,而且讲得具体,页面就开始有自己的价值。

这就是 Information Gain 最实用的地方:它逼你从「别人写了什么」转向「用户还缺什么」。

不同行业 Information Gain 中位数
图源:Eric Lancheres / On-Page.ai Research, “Information Gain in Google’s Top-Ranking Results: A Measurement of 150 Pages”

6 – 为什么健康类内容信息增益最低,法律类最高?

原文里还有一个行业差异:

Legal 法律类的中位数最高,62。

Health 健康类最低,42。

这个结果我觉得挺合理。

健康类内容为什么低?

因为它受到很多限制。

大家都要引用权威医学信息,都要写症状、原因、治疗方式、什么时候看医生。

你不能乱讲,也不应该乱讲。

所以内容很容易长得像。

法律类为什么更高?

因为法律内容更容易出现地区差异、案例差异、流程差异、费用差异。

比如同样是 personal injury lawyer,不同州的时效、赔偿、诉讼流程、保险沟通方式都可能不一样。

这些细节本身就会让内容和别人不一样。

这个对外贸和 B2B 网站也有启发。

如果你的行业本身很容易写成标准答案,那你就更要主动制造差异。

不要只写「什么是 injection molding」。

你要写:

  • 不同材料的模具寿命差异
  • 小批量打样和量产报价为什么差这么多
  • 美国客户最常卡在哪些认证
  • 从图纸到样品通常要几轮修改
  • 什么情况下中国供应商会拒绝接单

这些才是采购真正想知道,但搜索结果里经常没人讲透的东西。

7 – 对 SEO 内容团队来说,接下来应该怎么改工作流?

如果我是一个内容团队,我不会把这篇研究理解成「以后每篇文章都要做原创研究」。

那不现实。

尤其是中小企业、外贸站、SaaS startup,不可能每篇文章都搞一份大报告。

但你可以把内容 brief 改掉。

以前的 brief 可能是:

  • 关键词
  • 搜索意图
  • Top 10 结构
  • 推荐字数
  • 必须覆盖的实体词
  • FAQ

现在应该加 4 个栏目:

1 – SERP baseline

这个关键词下,大家都已经讲了什么?

把这些内容列出来,但不要把它当成「我要照抄的目录」。

它只是基础盘。

2 – Missing questions

Top 3 没回答什么?

哪些问题用户会问,但现有内容没讲清楚?

尤其关注价格、时间、风险、失败、取舍、实施细节。

3 – Unique evidence

这篇文章能不能放进 3-10 个自己的证据?

比如客户案例、后台截图、报价区间、测试结果、项目经验、真实流程。

数量不用一上来就 15 个。

先从 3 个开始。

4 – Point of view

这篇文章有没有一个明确判断?

如果整篇文章只是「A 有好处,B 也有好处,大家根据情况选择」,读者看完也不会记住你。

读者不是来听你端水的。

读者是来找判断的。

8 – 我对这篇文章的最终解读

Eric 这篇研究真正有价值的地方,不是告诉我们一个新的「排名因子」。

它更像是把 SEO 内容的一个老问题量化了:

大量排名页面其实是在互相复述。

而且哪怕是 Top 3,也没那么神。

这反而说明后来者还有机会。

如果你的网站权重不强、预算不大、外链也没那么多,那你更不能继续写那种「更完整但没新东西」的文章。

你打不过大站的权重,就别继续在「谁写得更全」这件事上硬拼。

你要拼它们没有的东西:

  • 真实案例
  • 真实数据
  • 真实成本
  • 真实失败
  • 真实判断

说白了,未来 SEO 内容的门槛会从「会不会写」变成「你有没有东西可写」。

AI 可以把一句话扩成 2000 字。

但它不能替你跑客户项目,不能替你看真实后台,不能替你踩坑,也不能替你形成判断。

所以这篇文章我建议大家收藏。

不是因为它给了一个万能公式。

而是因为它提醒我们:

别再只做搜索结果的复读机了。

你要给 Google,也给用户,贡献一点真的东西。

原文 credit:Eric Lancheres / On-Page.ai Research

原文标题:Information Gain in Google’s Top-Ranking Results: A Measurement of 150 Pages

原文链接:https://api.on-page.ai/research/information-gain-study

发布日期:2026 年 6 月 12 日