AgentGrade
EnglishEspañol日本語中文
← Base de Conocimientos

Cómo navegan realmente la web los agentes de IA

El problema con las suposiciones

La mayoría de la optimización de sitios web asume que un visitante obtiene tu página vía HTTP, ve los encabezados, sigue las redirecciones y renderiza HTML. Los agentes de IA rompen cada una de estas suposiciones.

ChatGPT

La herramienta de navegación de ChatGPT obtiene páginas en vivo vía HTTP, pero el modelo nunca ve la respuesta cruda:

Qué significa esto: la negociación de contenido funciona en silencio (la capa de la herramienta la maneja), pero el modelo solo ve el texto extraído. Sirve texto limpio y estructurado y tu contenido será más útil para ChatGPT.

Perplexity

Perplexity usa una pipeline de recuperación en múltiples etapas:

Qué significa esto: tus reglas de robots.txt para PerplexityBot pueden no detener a sus rastreadores sigilosos. Contenido estructurado con encabezados claros ayuda a que su extracción de spans encuentre los pasajes correctos.

Gemini

El modo de navegación más común de Gemini nunca llega a tu servidor:

Qué significa esto: tu sitio necesita estar indexado por Googlebot para que Gemini lo vea. Agregar <link rel="alternate" href="/llms.txt"> en tu HTML asegura que Google indexe la relación con llms.txt. Los datos estructurados JSON-LD también sobreviven al pipeline de indexación.

Qué hacer al respecto

AcciónAyuda con
Servir llms.txt con markdown limpioChatGPT, Perplexity
Agregar <link rel="alternate" href="/llms.txt">Gemini (vía índice de Google)
Agregar datos estructurados JSON-LDGemini (vía índice de Google)
No bloquear Google-Extended en robots.txtGemini
Usar firmas RFC 9421 para autenticación de botsVerificación del Agent Mode de ChatGPT
Servir contenido estructurado con encabezados clarosExtracción de spans de Perplexity

Más información

Relacionado