Eric Lancheres 最近在 On-Page.ai 发了一篇研究,我觉得所有还在用 AI 批量写 SEO 内容的人,都应该认真看一下。
这篇文章不是那种泛泛而谈的「AI 内容未来趋势」。
它做了一件很具体的事:
扫描 50 个关键词、10 个行业、150 个 Google Top 3 页面,然后给每个页面打一个 Information Gain Score。
用人话说就是:
一个页面排在 Google 前 3,它到底有没有讲出同一个搜索结果里其他页面没讲过的东西?
这个问题非常关键。
因为过去几年,很多 SEO 内容团队的工作流其实特别粗暴:
- 把 Top 10 抓下来
- 把目录合并一下
- 让 AI 补长一点
- 标题里塞关键词
- 最后生成一篇看起来更完整的文章
这套东西以前能跑,是因为 Google 很多时候确实奖励「覆盖足够完整」。
但这篇研究提醒我们一件事:
完整,已经越来越不稀缺了。
新信息,才稀缺。

1 – 这篇研究到底测的是什么?
Information Gain 这个词,很多人会翻译成「信息增益」。
听起来有点学术,其实特别好理解。
假设用户搜一个关键词,Google 第一页已经有 10 篇文章了。
这 10 篇文章共同覆盖了一堆定义、优缺点、购买建议、常见问题。
这些东西就叫 SERP baseline,也就是搜索结果里的基础信息池。
那你的页面如果只是把这些东西换个顺序、换个说法、写得更长一点,本质上没有增加多少新信息。
Eric 在原文里用了一个公式:
G = P ∖ B
翻译成人话就是:
你的页面 P,减掉这个 SERP 里大家都已经讲过的基础内容 B,剩下来的部分,才是你的信息增益 G。
这个视角很有意思。
因为它不是问「你有没有写得全面」。
它问的是:
你有没有给这个搜索结果增加新的东西。
这个判断会逼我们重新看 AI 内容。
很多 AI SEO 内容看起来很完整,其实只是把 baseline 重新包装了一遍。
2 – 最打脸的数据:Top 3 页面也没那么原创
这篇研究里最重要的数据是:
150 个 Google Top 3 页面,Information Gain Score 的中位数只有 52/100。
也就是说,一个排名非常靠前的页面,大概一半内容都能在同一个 SERP 的其他页面里找到语义相近的版本。
更具体一点:
- 21% 的 Top 3 页面属于 highly original,信息增益 70 分以上
- 55% 属于 moderately original,40-69 分
- 24% 属于 mostly shared,低于 40 分
这个结果说明什么?
说明 Google Top 3 里面,也有不少页面其实没贡献太多新东西。
很多人看到这里可能会问:
那是不是说明 Information Gain 根本不是排名因素?
别急。
Eric 原文里也讲得很谨慎:Google 有相关专利,但专利不等于确认的排名系统。
这点要给原作者 credit,他没有硬吹「我发现了 Google 新排名因子」。
他更像是在说:
排名靠前的页面里,原创信息并没有我们想象中那么多,所以这里还有很大的内容机会。
我比较认同这个判断。
SEO 很多时候不是改一个点,然后排名马上暴涨。
更多时候是先找出某个 SERP 里现有内容没讲清楚的地方,然后持续把这些地方补扎实。
这比追一个所谓的新排名因子靠谱得多。
3 – 排名第 1,并不代表信息增益最高
这篇文章还有一个挺反直觉的数据:
Top 1、Top 2、Top 3 的信息增益中位数几乎一样。
- Position 1:52
- Position 2:51.5
- Position 3:52
也就是说,在前三名里面,谁排第一,跟谁更原创没有明显关系。
这点很重要。
因为 SEO 排名从来不是单变量游戏。
一个页面能排第一,可能是因为:
- 域名权重更强
- 外链更多
- 站点主题权威更高
- 页面体验更好
- 品牌点击更强
- 历史表现更稳定
- 内容刚好更匹配这个 query 的主意图
所以不要把 Information Gain 理解成「只要我加原创数据,就一定冲第一」。
这就太天真了。
我的理解是:
Information Gain 更像内容竞争力的一部分。
它不一定决定你今天排第 1 还是第 3。
但如果你的页面长期只是重复别人,Google 和 AI 答案引擎都没有太多理由反复引用你。
尤其是 AI Overviews、ChatGPT、Perplexity 这些答案引擎开始吃内容之后,重复信息的价值会进一步下降。
因为机器根本不缺第 11 个同义改写版本。
机器缺的是可引用的新事实、新案例、新判断。

4 – 真正值钱的是 unique data points
整篇文章里,我最看重的是这个数据:
页面里有 15 个以上 unique data points 的,平均 Information Gain Score 是 62.1。
页面里只有 0-1 个 unique data points 的,平均只有 40.2。
差了 20 多分。
这背后其实就是一句老话:
内容不要只写观点,要写证据。
什么叫 unique data points?
不是那种随便引用别人报告里的「80% 的用户认为 xxx」。
而是这个页面自己贡献的具体信息。
比如:
- SaaS 产品真实 onboarding 完成率
- 某个功能上线后 30 天的激活变化
- 外贸询盘从点击到成交的平均周期
- 某类 B2B 产品的 MOQ、交期、认证成本
- 跨境电商某个品类的退货率、广告 CPA、履约时间
- 你自己跑过 50 个页面之后总结出的标题改写结果
这些东西是 AI 很难凭空生成的。
就算 AI 能编,它也没有可信度。
而且这类信息有一个特别大的好处:
它会让你的内容和别人不一样。
因为别人可以抄你的 H2,可以抄你的结构,可以抄你的观点。
但别人很难抄你的真实数据和真实经历。
这也是为什么我一直说,SEO 内容以后不能只靠写手整理资料。
纯写手型内容会越来越难。
因为写手可以整理信息,但很难生产事实。

5 – 90% 的 SERP 都还有没被回答的问题
这篇研究还有一个很有意思的发现:
在 90% 的 SERP 里,Top 3 页面至少漏掉了一个常见主题问题。
60% 的 SERP 里,有 3 个以上没被 Top 3 回答的问题。
这句话对内容团队很有用。
以前我们做内容 brief,经常会看:
- Top 10 都有哪些 H2
- 他们用了什么标题
- 他们覆盖了哪些 FAQ
- 他们内容长度是多少
但我觉得以后更应该加一个动作:
找 Top 3 没回答的问题。
这个动作比单纯「补 FAQ」有用。
FAQ 很容易写成垃圾扩写。
真正有价值的是找到用户做决策时还卡住的那一块。
举个栗子。
如果你做一个 B2B SaaS 的「best CRM for manufacturers」页面,大家可能都在讲功能对比、价格、集成、评分。
但用户真正关心的可能是:
- 从 Excel 迁移到 CRM 要多久?
- 销售团队不愿意填数据怎么办?
- 制造业报价周期长,CRM pipeline 应该怎么设?
- ERP 和 CRM 数据冲突时,以哪个为准?
- 老板想看预测,销售只想少填表,这个矛盾怎么解决?
这些问题如果 Top 3 都没讲,你讲了,而且讲得具体,页面就开始有自己的价值。
这就是 Information Gain 最实用的地方:它逼你从「别人写了什么」转向「用户还缺什么」。

6 – 为什么健康类内容信息增益最低,法律类最高?
原文里还有一个行业差异:
Legal 法律类的中位数最高,62。
Health 健康类最低,42。
这个结果我觉得挺合理。
健康类内容为什么低?
因为它受到很多限制。
大家都要引用权威医学信息,都要写症状、原因、治疗方式、什么时候看医生。
你不能乱讲,也不应该乱讲。
所以内容很容易长得像。
法律类为什么更高?
因为法律内容更容易出现地区差异、案例差异、流程差异、费用差异。
比如同样是 personal injury lawyer,不同州的时效、赔偿、诉讼流程、保险沟通方式都可能不一样。
这些细节本身就会让内容和别人不一样。
这个对外贸和 B2B 网站也有启发。
如果你的行业本身很容易写成标准答案,那你就更要主动制造差异。
不要只写「什么是 injection molding」。
你要写:
- 不同材料的模具寿命差异
- 小批量打样和量产报价为什么差这么多
- 美国客户最常卡在哪些认证
- 从图纸到样品通常要几轮修改
- 什么情况下中国供应商会拒绝接单
这些才是采购真正想知道,但搜索结果里经常没人讲透的东西。
7 – 对 SEO 内容团队来说,接下来应该怎么改工作流?
如果我是一个内容团队,我不会把这篇研究理解成「以后每篇文章都要做原创研究」。
那不现实。
尤其是中小企业、外贸站、SaaS startup,不可能每篇文章都搞一份大报告。
但你可以把内容 brief 改掉。
以前的 brief 可能是:
- 关键词
- 搜索意图
- Top 10 结构
- 推荐字数
- 必须覆盖的实体词
- FAQ
现在应该加 4 个栏目:
1 – SERP baseline
这个关键词下,大家都已经讲了什么?
把这些内容列出来,但不要把它当成「我要照抄的目录」。
它只是基础盘。
2 – Missing questions
Top 3 没回答什么?
哪些问题用户会问,但现有内容没讲清楚?
尤其关注价格、时间、风险、失败、取舍、实施细节。
3 – Unique evidence
这篇文章能不能放进 3-10 个自己的证据?
比如客户案例、后台截图、报价区间、测试结果、项目经验、真实流程。
数量不用一上来就 15 个。
先从 3 个开始。
4 – Point of view
这篇文章有没有一个明确判断?
如果整篇文章只是「A 有好处,B 也有好处,大家根据情况选择」,读者看完也不会记住你。
读者不是来听你端水的。
读者是来找判断的。
8 – 我对这篇文章的最终解读
Eric 这篇研究真正有价值的地方,不是告诉我们一个新的「排名因子」。
它更像是把 SEO 内容的一个老问题量化了:
大量排名页面其实是在互相复述。
而且哪怕是 Top 3,也没那么神。
这反而说明后来者还有机会。
如果你的网站权重不强、预算不大、外链也没那么多,那你更不能继续写那种「更完整但没新东西」的文章。
你打不过大站的权重,就别继续在「谁写得更全」这件事上硬拼。
你要拼它们没有的东西:
- 真实案例
- 真实数据
- 真实成本
- 真实失败
- 真实判断
说白了,未来 SEO 内容的门槛会从「会不会写」变成「你有没有东西可写」。
AI 可以把一句话扩成 2000 字。
但它不能替你跑客户项目,不能替你看真实后台,不能替你踩坑,也不能替你形成判断。
所以这篇文章我建议大家收藏。
不是因为它给了一个万能公式。
而是因为它提醒我们:
别再只做搜索结果的复读机了。
你要给 Google,也给用户,贡献一点真的东西。
原文 credit:Eric Lancheres / On-Page.ai Research
原文标题:Information Gain in Google’s Top-Ranking Results: A Measurement of 150 Pages
原文链接:https://api.on-page.ai/research/information-gain-study
发布日期:2026 年 6 月 12 日



