Archivo llms (llms.txt): guía práctica para que la IA entienda tu web

En mi caso, tener un llms.txt “le dice a la IA de qué trata mi web”, y noté más oportunidades de aparecer en respuestas de asistentes cuando curé bien los enlaces clave (menos es más).

1) Qué es llms.txt y qué problema resuelve

llms.txt es un archivo en texto plano (formato Markdown) pensado para que modelos de lenguaje y agentes de IA entiendan la arquitectura y el contenido prioritario de tu sitio, sin tener que pelear con HTML, menús, anuncios o scripts. A diferencia de estándares SEO clásicos, no controla el rastreo, sino que ofrece una guía curada del contenido (títulos, descripciones, enlaces) para mejorar la comprensión de la IA y reducir errores. Mintlify+1

En la práctica, te sirve para:

  • Destacar páginas clave (guías, referencias, tutoriales) y explicar cómo leerlas. Mintlify
  • Ahorrar tokens y fallos de parsing al servir Markdown en lugar de HTML. Mintlify
  • Preparar a agentes/assistants para decidir “qué cargar” primero de tu web. Mintlify

Como tú dices, crearlo puede ser ventajoso porque aumenta tus oportunidades de aparecer en respuestas de IA cuando una herramienta consulta tu sitio.

llms.txt

2) llms.txt vs robots.txt vs sitemap.xml: no hacen lo mismo

  • robots.txt: archivo en la raíz que autoriza o bloquea rastreo/índice de bots de buscadores.
  • sitemap.xml: catálogo de URLs para descubrimiento.
  • llms.txt: en la raíz y también en texto, pero su misión es estructurar y priorizar contenido para LLMs y agentes, con contexto y enlaces descritos en Markdown. Mintlify+1

Una metáfora útil: si sitemap es el catálogo de la biblioteca y robots la estantería restringida, llms.txt es “la lista del bibliotecario” con las obras recomendadas y sus notas. Mintlify

3) Estructura mínima de un llms.txt en Markdown (con plantilla comentada)

Me funcionó describir cada sección con una línea clara; menos es más y los agentes lo agradecen.

Plantilla base (cópiala y adapta):

# {Nombre del sitio o producto}
> {Resumen en 1–2 líneas sobre qué ofrece el sitio y para quién}

## Guías
- [Empezar aquí](/guia/intro) — Primeros pasos y requisitos
- [Instalación](/guia/instalacion) — Setup paso a paso
- [Tutoriales](/tutoriales) — Casos prácticos por nivel

## Referencia
- [API](/api) — Endpoints, autenticación, límites
- [SDK](/sdk) — Paquetes por lenguaje y ejemplos
- [CLI](/cli) — Comandos frecuentes

## Conceptos
- [Modelo de datos](/conceptos/datos) — Esquemas y relaciones
- [Seguridad](/conceptos/seguridad) — Roles, permisos y mejores prácticas

## Opcional
- [Blog](/blog) — Artículos de contexto (baja prioridad)
- [Precios](/precios) — Sujetos a cambios; consultar web

Pautas de la especificación práctica: H1 (título), resumen en blockquote, H2 por áreas y listas de enlaces con descripciones; alojarlo en /llms.txt (accesible en crudo) y, si quieres ampliar, crear /llms-full.txt con texto extendido. Mintlify

4) Políticas y directivas útiles ($trainingAllowed, $chatAllowed, $responseLength, $embargo)

Además de la parte “curatorial” en Markdown, muchos contenidos recomiendan exponer directivas para afinar el uso por parte de LLMs, por ejemplo:

LLM: *
$trainingAllowed: false
$chatAllowed: true
$embedded: allowed
$responseLength: 150
$embargo: 7d

También puedes especializar por modelo o por ruta (p. ej., bloquear /premium/). Estas directivas ayudan a controlar entrenamiento, chat, longitud de respuesta y embargos de contenido reciente. Acumbamail

5) Cómo crearlo paso a paso y dónde alojarlo (incluye checklist de publicación)

  1. Inventario: lista tus secciones clave (Guías, Referencia, Conceptos).
  2. Escribe en Markdown: títulos, breve resumen y listas de enlaces con 6–12 ítems prioritarios por sección. Mintlify
  3. Aloja en raíz: https://tudominio.com/llms.txt con contenido raw accesible; opcional llms-full.txt. Mintlify
  4. Coherencia con robots: evita contradicciones obvias con el crawl de secciones clave. zeo.org
  5. Monitoreo: revisa logs (peticiones a /llms.txt//llms-full.txt) y ajusta prioridades. zeo.org

Checklist de publicación

  • Archivo en /llms.txt accesible sin login. Mintlify
  • H1 + resumen + secciones (H2) + enlaces con descripciones cortas. Mintlify
  • (Opcional) /llms-full.txt con el texto clave consolidado. Mintlify
  • Sin HTML pesado; Markdown limpio. zeo.org
  • Sin contradicciones con robots.txt. zeo.org
  • Validado manualmente (200–400 líneas orientativas; prioriza calidad).
  • Logs y analítica configurados para ver accesos de agentes. zeo.org

6) Buenas prácticas para que los agentes de IA te “lean” mejor

  • Prioriza: empieza por las rutas que más preguntas resuelven (Guías/Referencia).
  • Describe con intención: “qué es y cuándo usarlo” en 1 línea por enlace. Mintlify
  • Límites y advertencias: señala información volátil (precios, límites) para que la IA derive al sitio.
  • Evita ruido: nada de menús, snippets de UI, ni marketing florido; Markdown conciso. zeo.org
  • Dominios/paths alternativos: si tienes docs en subdominios, crea llms.txt específicos (/docs/llms.txt). Mintlify

Noté más “presencia” en respuestas de asistentes cuando curé bien los enlaces clave y añadí una sección Opcional para que los agentes supieran qué podían saltarse.

7) Errores comunes y cómo evitarlos

  • Tratarlo como SEO tradicional: llms.txt no sube posiciones en SERPs por sí mismo; su objetivo es contexto para IA, no ranking. Mintlify
  • Listas kilométricas sin prioridad: pierdes foco y gastas tokens.
  • Olvidar el formato: HTML pegado, tablas complejas o bloques con JS rompen el beneficio. zeo.org
  • Contradicciones con robots: si bloqueas /api en robots pero la recomiendas en llms, confundes a los agentes. zeo.org
  • No monitorear: sin revisar peticiones a /llms.txt no sabrás si los agentes lo usan. zeo.org

La primera vez asumí que esto era “SEO puro”; en realidad es para contexto de IA. Desde que lo entendí así, cuidé más las descripciones y me fue mejor.

8) Casos de uso: docs técnicas, blogs y tiendas online

  • Documentación técnica: empresas de devtools usan llms.txt para que asistentes den ejemplos de API y SDK más certeros, e incluso reducen consumo de tokens al servir Markdown. Mintlify
  • Webs de producto/marketing: guiar a la IA sobre el posicionamiento del mensaje (qué resolver, para quién). Mintlify
  • Medios/blogs: usar $embargo y limitar longitud para no “regalar” contenido completo. Acumbamail
  • E-commerce: permitir mención de producto pero evitar descripciones completas o precios desactualizados. Acumbamail

9) FAQs rápidas sobre archivo llms

¿Qué es un archivo llms y para qué sirve?
Un fichero en Markdown que resume y prioriza el contenido de tu web para LLMs/agentes de IA, con títulos, descripciones y enlaces clave. Mintlify

¿En qué se diferencia de robots.txt y sitemap.xml?
robots controla rastreo, sitemap descubrimiento y llms contexto/estructura para IA. Mintlify

¿Dónde se aloja y en qué formato?
En la raíz (/llms.txt), accesible como texto sin formato; ideal en Markdown. Mintlify

¿Qué es llms-full.txt?
Una versión extendida que compila el texto de tu sitio para cargar contexto desde una única URL. Mintlify

¿Mejora el posicionamiento en IA/SEO?
Aporta sobre todo a usabilidad/contexto para herramientas de IA; no es una palanca directa de ranking SEO. Mintlify


Conclusión

Si creas un llms.txt claro, corto y coherente con tu arquitectura, ayudas a que la IA “te lea” como tú quieres. Empieza con lo esencial (Guías y Referencia), valida que se vea en /llms.txt, y revisa logs para iterar. Como dices, tenerlo creado te da más oportunidades de aparecer en la IA; la clave es calidad y foco.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio