AgentGrade
EnglishEspañol日本語中文
← 知识库

AI 代理实际是如何浏览网页的

假设带来的问题

大多数网站优化都假设:访问者通过 HTTP 获取你的页面、看到响应头、跟随重定向并渲染 HTML。AI 代理打破了这些假设中的每一条。

ChatGPT

ChatGPT 的浏览工具通过 HTTP 实时获取页面,但模型从来看不到原始响应:

这意味着什么: 内容协商在背后会默默生效(由工具层处理),但模型只能看到提取后的文本。提供干净、结构化的文本,你的内容对 ChatGPT 才会更有用。

Perplexity

Perplexity 使用多阶段的检索流水线:

这意味着什么: 你针对 PerplexityBotrobots.txt 规则可能无法阻止它们的隐身爬虫。带有清晰标题的结构化内容有助于其片段抽取找到正确段落。

Gemini

Gemini 最常见的浏览模式根本不会访问你的服务器:

这意味着什么: 你的网站需要被 Googlebot 索引,Gemini 才能看到它。在你的 HTML 中添加 <link rel="alternate" href="/llms.txt"> 可以确保 Google 索引到 llms.txt 关系。JSON-LD 结构化数据也能在索引流水线中保留下来。

该怎么做

操作适用于
提供包含干净 markdown 的 llms.txtChatGPT、Perplexity
添加 <link rel="alternate" href="/llms.txt">Gemini(通过 Google 索引)
添加 JSON-LD 结构化数据Gemini(通过 Google 索引)
不要在 robots.txt 中屏蔽 Google-ExtendedGemini
使用 RFC 9421 签名进行 bot 认证ChatGPT Agent Mode 验证
提供带清晰标题的结构化内容Perplexity 片段抽取

了解更多

相关