AI 搜索的结构化数据,是一种以机器可读格式声明页面事实的标记——最常用的词汇表是 Schema.org,最推荐的写法是 JSON-LD。它直接告诉机器:这个页面是一个产品、价格是 49 美元、这个问题的答案就是这一段。可见页面写给人看,标记写给爬虫、检索管线和购物 Agent 看。在生成式引擎优化(GEO)中,结构化数据是品牌与 AI 引擎之间最接近 API 的直连通道。
核心要点
- Schema.org 是词汇表,JSON-LD 是格式。两者结合,把页面事实变成 AI 系统可以确定性提取、而非概率性推断的数据。
- 对 GEO 回报最高的 schema 类型是
Organization、Product、FAQPage、HowTo和Person。 - Google 在 2023 年对多数网站下线了 FAQ 富媒体结果,但
FAQPage标记依然有价值:它把干净的问答对直接交给检索系统引用。 - 许多 AI 爬虫几乎不执行 JavaScript,客户端注入的 JSON-LD 可能永远不会被看到——务必服务端渲染。
- 标记是基础设施,不是魔法。要衡量它是否推动了引用率和产品卡片激活率,而不是只看校验是否通过。
结构化数据是什么,JSON-LD 在哪个位置
Schema.org 是 Google、Microsoft、Yahoo 和 Yandex 于 2011 年共同发起的通用词汇表,定义了数百种实体类型——组织、产品、文章、事件——以及各自可携带的属性。JSON-LD(JavaScript Object Notation for Linked Data)是发布这套词汇表的首选方式:一段放在页面代码里的小脚本块,访客看不见,机器一目了然。Google 官方文档推荐使用 JSON-LD,因为它比老式的 microdata 和 RDFa 更易编写、更易规模化维护。
它的职能在两个时代之间发生了变化。经典 SEO 时代,结构化数据换来的是富媒体摘要——星级评分、菜谱卡片。到了 GEO 时代,同样的标记喂养的是 AI 引擎用来锚定答案的知识图谱与购物图谱,并给抓取页面的 Agent 一层无歧义的机器可读层。
为什么 AI 引擎偏爱「已声明的事实」
语言模型是概率性的。从自由文本里抽取事实成本高、偶尔出错——也就是我们说的幻觉。结构化数据是确定性的:当检索管线读到一个 Product 节点、offers 价格为 49 美元时,它不需要从上下文猜价格。它直接知道。
这种确定性在三个环节兑现。消歧——Organization 标记里指向 Wikipedia、Wikidata 和社交主页的 sameAs 链接,告诉引擎你的「Apple」是那家公司,不是水果。提取——Google AI Overviews 这类系统偏好能干净解析的信源,而带标记的问答和产品数据解析成本最低。锚定——当用户问「这个品牌靠谱吗」,引擎会先拿你声明的身份与知识图谱交叉验证再作答。
GEO 经验法则:一个事实越容易被提取,引擎就越可能使用它——并把它归属给你。
一个诚实的前提:Google 明确表示结构化数据是帮助系统理解内容的方式,不是排名捷径,且标记必须与页面可见内容一致。
对 GEO 回报最高的五种 schema 类型
Organization
品牌的身份证:legalName、logo、foundingDate,以及最重要的、指向权威主页的 sameAs 链接。它回答实体类问题——这是谁做的、这家公司是真的吗——并为你发布的一切内容提供锚点。
Product
生成式电商的主力。带嵌套 Offer(价格、币种、库存)和 AggregateRating 的 Product,是购物 Agent 在用户问「100 美元以内、4 星以上的运动鞋」时读取的数据。它同时喂养 ChatGPT 和 Google AI Mode 在答案里渲染的产品卡片——share of card 的胜负就在这块货架上。





