AgentGrade
EnglishEspañol日本語中文
← ナレッジベース

AIエージェントは実際にどのようにWebをブラウズするのか

前提を疑う

ほとんどのWebサイト最適化は、訪問者がHTTP経由でページを取得し、ヘッダーを見て、リダイレクトをたどり、HTMLをレンダリングするという前提に立っています。AIエージェントはこれらの前提を一つ残らず崩します。

ChatGPT

ChatGPTのブラウジングツールはHTTP経由でページをライブで取得しますが、モデルは生のレスポンスを一切見ません:

これが意味すること: コンテンツネゴシエーションは内部的に動作しますが(ツールレイヤーが処理します)、モデルは抽出されたテキストのみを見ます。クリーンで構造化されたテキストを配信すれば、コンテンツはChatGPTにとってより有用になります。

Perplexity

Perplexityは多段階の取得パイプラインを使用しています:

これが意味すること: PerplexityBot 向けの robots.txt ルールは、彼らのステルスクローラーを止められない場合があります。明確な見出しを持つ構造化されたコンテンツは、彼らのスパン抽出が正しいパッセージを見つけるのに役立ちます。

Gemini

Geminiの最も一般的なブラウジングモードは、あなたのサーバーに一切到達しません:

これが意味すること: GeminiがあなたのサイトをみるためにはGooglebotでインデックスされている必要があります。HTMLに <link rel="alternate" href="/llms.txt"> を追加すれば、Googleがllms.txtの関係をインデックスすることが保証されます。JSON-LDの構造化データもインデックスパイプラインで生き残ります。

何をすべきか

アクション効果のある対象
クリーンなmarkdownで llms.txt を配信ChatGPT、Perplexity
<link rel="alternate" href="/llms.txt"> を追加Gemini(Googleインデックス経由)
JSON-LD構造化データを追加Gemini(Googleインデックス経由)
robots.txtGoogle-Extended をブロックしないGemini
ボット認証にRFC 9421署名を使用ChatGPT Agent Modeの検証
明確な見出しを持つ構造化コンテンツを配信Perplexityのスパン抽出

詳細情報

関連