GitHub

摘要

Perplexity 每条回答只引用 3-4 个信源，所以关键不是 Google 排名，而是成为它愿意摘抄的那份事实密集、结构清晰的页面，并有它已信任的域名为你背书。

想被 Perplexity 引用和推荐，主线只有一条：为某个具体问题写出全网最清晰、事实密度最高的那份答案，再让 Reddit、Wikipedia、YouTube 这些它本就信任的高权重域名为你背书。Perplexity 是一个「检索优先」的答案引擎，而不是蓝色链接目录。面对每个问题，它会实时联网搜索，把问题拆成 3-5 个子问题，抓取约 10 个候选页面，最终只引用其中 3-4 个。整场竞争，就是挤进这份短名单。

这一点让它和依赖训练数据的经典 ChatGPT 用法很不一样。它实时读取活网页，因此时效性与结构真正左右排序——前两句就把问题答清楚的页面，会赢过把答案埋在中段的长文。下面拆解它的工作管线，以及你能改动、从而拿下引用的环节。如果你对 GEO 还不熟，先看什么是 GEO 以及它与搜索 SEO 的区别。

Key takeaways

Perplexity 实时检索，把每个问题拆成 3-5 个子问题，抓约 10 个页面，只引用 3-4 个。你的目标是那几个引用位，而不是 Google 排名。
引用的选取大致按这个顺序：语义相关度，其次是你的原句是否出现在草稿答案里，再到时效、结构与域名权威度。写出一句 Perplexity 能原样摘抄的话。
站外信任占了半壁江山。Reddit、Wikipedia、YouTube、行业媒体是 Perplexity 依赖的种子信源，在这些地方被讨论，本身就是 Perplexity 优化。
Perplexity Shopping 与零手续费的「Buy with Pro」把答案引擎变成了结账入口——干净的 Product schema 和商品 feed，决定你的产品能否在对话里直接下单。
别靠猜，按引擎追踪引用份额、位置与情感倾向；一张 citation analysis 视图和一个 AIGVR score，能给 Perplexity 单列一条 KPI。

Perplexity 如何选出那 3-4 个信源

Perplexity 的每条回答，都是一条 RAG（检索增强生成）管线的产物，每一层都在进一步筛掉候选：

解析并扩散。它读懂你问题背后的意图，扩展成 3-5 个子问题，以覆盖一个完整答案的各个侧面。
实时检索。它用混合检索（关键词匹配加上自研 pplx-embed 模型的稠密向量）搜索公开网络，每次回答收集约 10 个候选页面。
重排从严。多层机器学习 reranker 会按相关度、时效、结构与权威度给候选打分，通过者太少时甚至会丢弃整组结果。关于品牌、人物或产品的实体类查询，会触发更严格的过滤。
带脚注合成。它在检索到的证据约束下起草答案，只给真正用到的 3-4 个信源挂上引用。

由此有两点推论。Perplexity 只能引用它检索到的内容，所以你得让那些「子问题」都能找到你，而不只是核心词。而且这些是跑在活网上的 grounding queries，发布与更新的节奏，比在静态索引里更重要。