GitHub

摘要

Citation analysis（引用源分析）指追踪并优化 ChatGPT、Perplexity 等 AI 引擎生成答案时引用的第三方信源——正是这些引用决定了品牌能否进入 AI 答案。

Citation analysis（引用源分析）指识别、监控并优化 AI 引擎——ChatGPT、Perplexity、Gemini、Google AI Overviews——在生成答案时所引用的第三方信源的一整套方法。传统 SEO 审计的是 backlink，即在页面之间传递权重的超链接；citation analysis 审计的则是 AI 真实的阅读清单：引擎检索了哪些域名、在答案里引用了哪些页面、你的品牌是否出现在其中。如果说 AI citations 是生成式搜索的脚注，citation analysis 就是让品牌进入这份参考文献的学问。

核心要点

AI 引擎不是凭记忆作答，而是通过 RAG 与实时搜索检索信源，且每个引擎的信源偏好不同——Perplexity 重度依赖 Reddit 等社区，Google AI Overviews 则偏好已在 Google 排名的页面。
引用是 AI 可见度的计分项。在 AIGVR 评分中，引用信号占 25% 权重，与答案位置（40%）、提及频率（25%）并列。
普林斯顿主导的 GEO 研究测得：为页面补充引文、统计数据与参考来源，可让其在生成式答案中的可见度相对提升最高 40%。
一次有效的 citation analysis 包含三步：盘点品类的引用信源生态、与竞品做 gap 分析、评估被引页面内部的情感倾向。
自有域名只是一个节点，真正复利的增长来自第三方引用节点：评测平台、社区与高权威媒体。

Citation analysis 如何运作

当用户问 ChatGPT 哪款物理防晒霜最好，模型并不只靠训练记忆作答。它会把问题扩展为多条检索查询（这个机制本身值得单独理解，见 grounding queries），抓取一批候选页面，再合成带引用的答案。Citation analysis 做的就是逆向还原这条管线：哪些页面进入了候选名单、来自哪些域名、为什么是它们。

实践中，被引信源大致分三个层级。

权威信源：Wikipedia、主流媒体、分析师报告，以及 G2、Wirecutter 这类成熟评测平台。它们提到某品牌时，引擎倾向于当作既定事实。
社区信源：Reddit、Quora、垂直论坛。它们决定引擎如何总结用户共识与情感倾向，Perplexity 对这类信源的检索频率尤其高。
低信号信源：单薄的联盟营销博客、采集站目录、无人维护的榜单。现代引擎正在越来越多地过滤它们，在这里被引用几乎不产生价值。

不同引擎的层级配比差异很大。Google AI Overviews 从 Google 自有索引取材，偏向已有排名的页面（Google 官方文档对此有说明）；ChatGPT 的联网检索混合自有抓取与授权媒体内容；Perplexity 则以社区内容著称。只分析一个引擎的引用画像，对另外六个几乎没有参考意义。

为什么 2026 年 citation analysis 如此重要

购买决策的调研如今从生成式答案开始，而且大部分在不产生点击的情况下结束——即 zero-click search 描述的格局。在这个格局里，答案就是界面，引用则是答案背后的供应链。供应链里没有你的品牌，站内优化做得再好也无法露出。

引用层可以被正向影响，这一点有实证支撑。普林斯顿与 IIT Delhi 的 GEO 研究在 10,000 条查询上测试了九种优化方法，发现为内容补充引文、统计数据与参考来源，可使其在生成式引擎答案中的可见度相对基线提升最高 40%。引擎会奖励那些读起来像可靠参考文献的页面。

引用不仅决定你是否出现，还决定你被如何描述。如果引擎围绕你的品牌反复引用的是一条两年前抱怨物流的 Reddit 帖子，这条抱怨就会被无限期地改写进答案。露出与口碑走的是同一条管道——这也是 citation analysis 与 AI sentiment analysis 天然配套的原因。

如何执行 citation analysis

第一步：盘点引用信源生态。在你的品类里跑一组有代表性的购买意图 prompt——不是五条，而是五十条以上——收集所有引擎引用过的域名。规律会很快显现：任何一个细分品类里，少数域名通常贡献了大部分引用。在 GEOly AI 的 sources 视图中，七大引擎的引用按域名与信源类型（媒体、评测平台、社区、品牌自有）聚合，一眼就能看出：比如 Reddit 主导了 Perplexity 的护肤类引用，而 AI Overviews 反复调取的是同样三篇榜单文章。