GitHub

摘要

结构化数据是以 Schema.org 词汇表、JSON-LD 格式书写的机器可读标记，让 AI 引擎能确定性地提取、锚定并引用你的页面事实，而不是靠猜——它是品牌与 AI 引擎之间最接近 API 的通道。

AI 搜索的结构化数据，是一种以机器可读格式声明页面事实的标记——最常用的词汇表是 Schema.org，最推荐的写法是 JSON-LD。它直接告诉机器：这个页面是一个产品、价格是 49 美元、这个问题的答案就是这一段。可见页面写给人看，标记写给爬虫、检索管线和购物 Agent 看。在生成式引擎优化（GEO）中，结构化数据是品牌与 AI 引擎之间最接近 API 的直连通道。

核心要点

Schema.org 是词汇表，JSON-LD 是格式。两者结合，把页面事实变成 AI 系统可以确定性提取、而非概率性推断的数据。
对 GEO 回报最高的 schema 类型是 Organization、Product、FAQPage、HowTo 和 Person。
Google 在 2023 年对多数网站下线了 FAQ 富媒体结果，但 FAQPage 标记依然有价值：它把干净的问答对直接交给检索系统引用。
许多 AI 爬虫几乎不执行 JavaScript，客户端注入的 JSON-LD 可能永远不会被看到——务必服务端渲染。
标记是基础设施，不是魔法。要衡量它是否推动了引用率和产品卡片激活率，而不是只看校验是否通过。

结构化数据是什么，JSON-LD 在哪个位置

Schema.org 是 Google、Microsoft、Yahoo 和 Yandex 于 2011 年共同发起的通用词汇表，定义了数百种实体类型——组织、产品、文章、事件——以及各自可携带的属性。JSON-LD（JavaScript Object Notation for Linked Data）是发布这套词汇表的首选方式：一段放在页面代码里的小脚本块，访客看不见，机器一目了然。Google 官方文档推荐使用 JSON-LD，因为它比老式的 microdata 和 RDFa 更易编写、更易规模化维护。

它的职能在两个时代之间发生了变化。经典 SEO 时代，结构化数据换来的是富媒体摘要——星级评分、菜谱卡片。到了 GEO 时代，同样的标记喂养的是 AI 引擎用来锚定答案的知识图谱与购物图谱，并给抓取页面的 Agent 一层无歧义的机器可读层。

为什么 AI 引擎偏爱「已声明的事实」

语言模型是概率性的。从自由文本里抽取事实成本高、偶尔出错——也就是我们说的幻觉。结构化数据是确定性的：当检索管线读到一个 Product 节点、offers 价格为 49 美元时，它不需要从上下文猜价格。它直接知道。

这种确定性在三个环节兑现。消歧——Organization 标记里指向 Wikipedia、Wikidata 和社交主页的 sameAs 链接，告诉引擎你的「Apple」是那家公司，不是水果。提取——Google AI Overviews 这类系统偏好能干净解析的信源，而带标记的问答和产品数据解析成本最低。锚定——当用户问「这个品牌靠谱吗」，引擎会先拿你声明的身份与知识图谱交叉验证再作答。

GEO 经验法则：一个事实越容易被提取，引擎就越可能使用它——并把它归属给你。

一个诚实的前提：Google 明确表示结构化数据是帮助系统理解内容的方式，不是排名捷径，且标记必须与页面可见内容一致。

对 GEO 回报最高的五种 schema 类型

Organization

品牌的身份证：legalName、logo、foundingDate，以及最重要的、指向权威主页的 sameAs 链接。它回答实体类问题——这是谁做的、这家公司是真的吗——并为你发布的一切内容提供锚点。

Product

生成式电商的主力。带嵌套 Offer（价格、币种、库存）和 AggregateRating 的 Product，是购物 Agent 在用户问「100 美元以内、4 星以上的运动鞋」时读取的数据。它同时喂养 ChatGPT 和 Google AI Mode 在答案里渲染的产品卡片——share of card 的胜负就在这块货架上。