¿Qué es llms-full.txt?
llms-full.txt es el archivo compañero de /llms.txt — sigue la misma convención de llmstxt.org, pero en lugar de listar tus páginas importantes, contiene el contenido textual completo concatenado de tu sitio en un único archivo. Una descarga, todo el corpus.
¿Cuándo ayuda?
llms.txt es un directorio. Un agente lo lee, elige una URL relevante, descarga esa página y repite. Eso funciona bien para agentes que pueden navegar.
llms-full.txt es el texto completo. Un agente lo lee una sola vez y ya tiene todo. Eso importa para:
- Pipelines de recuperación sin navegación — sistemas RAG que ingieren texto pero no pueden hacer solicitudes HTTP de seguimiento
- Agentes embebidos — que se ejecutan en entornos sin acceso de red arbitrario
- Contexto de un solo disparo — cuando un LLM necesita toda la base de conocimiento en su ventana de contexto desde el principio
- Ingesta para entrenamiento y fine-tuning — cuando el contenido entra en un pipeline de construcción de modelo en lugar de una descarga en tiempo de ejecución
Para agentes que navegan, llms-full.txt es sobrecarga inofensiva (pueden elegir no descargarlo). Para agentes que no navegan, es la diferencia entre "el agente tiene tus docs" y "el agente no tiene nada sobre ti".
Formato
Texto plano o markdown. La convención estándar es comenzar con el mismo encabezado que llms.txt y luego concatenar cada página de tu directorio llms.txt, separadas por encabezados claros o separadores ---.
Esqueleto de ejemplo:
# Your Service Name
> Brief one-line description.
## Overview
Your Service does X, Y, Z.
---
### /docs/getting-started
(full markdown content of the getting-started page)
---
### /docs/api-reference
(full markdown content of the API reference)
(...continues for every page)
Cómo lo descubren los agentes
Dos formas:
1. <link rel="alternate"> en el head de tu HTML
<link rel="alternate" type="text/plain" href="/llms-full.txt" title="Full content for LLMs">
2. Referenciarlo desde /llms.txt
La mayoría de los archivos llms.txt terminan con una sección "Optional". Añade el compañero ahí para que los agentes que lean el directorio sepan que existe la versión con contenido completo.
## Optional
- [Full content](/llms-full.txt) — entire site text in one file
Cómo generarlo
La mayoría de las plataformas modernas de documentación (Mintlify, Docusaurus con plugins, Hugo con plantillas) pueden generar llms-full.txt automáticamente desde tu fuente. Si mantienes la documentación manualmente, un simple paso de build que concatene tus archivos markdown fuente funciona bien.
Regenéralo cuando el contenido cambie. Un llms-full.txt obsoleto es peor que no tenerlo — da a los agentes información desactualizada sobre tu servicio. Conecta la generación al mismo paso de CI que construye tu documentación.
Compromisos
- Pro — Una sola descarga da a los consumidores todo; no se necesita rastreo
- Pro — Fuerte señal AEO: ChatGPT, Perplexity y Claude valoran la disponibilidad de corpus legible por máquina
- Pro — Funciona para agentes sin capacidad de navegación (pipelines RAG, agentes embebidos)
- Con — Respuesta más grande: decenas de KB a varios MB dependiendo del tamaño de la documentación
- Con — Debe regenerarse cuando el contenido cambia
- Con — Concatena todo, incluyendo contenido que podrías preferir que los agentes descarguen por partes (documentación de pago, contenido restringido)
Qué verifica agentgrade
- llms-full.txt encontrado —
/llms-full.txtresponde 200 con al menos 20 caracteres de contenido no-HTML que no parece un soft-404 - llms-full.txt enlazado desde HTML (opcional) —
<link rel="alternate" type="text/plain" href="/llms-full.txt">está presente en el<head>de tu homepage
La verificación tiene peso 1 — menor que llms.txt en peso 2, reflejando que llms-full es contenido compañero recomendado en lugar de un archivo de directorio principal.
Ejemplos reales
- docs.anthropic.com/llms-full.txt — docs completas de Claude de Anthropic en un archivo
- agentgrade.com/llms-full.txt — nuestra propia versión generada desde esta base de conocimiento
- La especificación original de llmstxt.org describe ambos archivos como el par canónico
Madurez de la especificación
Estándar emergente, creciendo rápido. Definido junto con llms.txt en llmstxt.org. La adopción está aumentando, impulsada por plataformas de documentación AI-first (Mintlify lo genera automáticamente) y la expansión de flujos de trabajo de recuperación sin navegación. Los sitios que envían ambos archivos ahora se posicionan como fuentes autoritativas para motores de respuesta de IA.
Más información
- llmstxt.org — Especificación
- llms.txt — El archivo compañero de directorio