Qué es un llms.txt y por qué cuenta para la visibilidad en IA
El llms.txt es un sencillo archivo de texto en Markdown ubicado en el directorio raíz de tu web, accesible en /llms.txt. Ofrece a los grandes modelos de lenguaje una visión general curada de tus contenidos más importantes: un título, un breve resumen y una lista ordenada de páginas relevantes, cada una con su explicación. Allí donde una web normal está pensada para personas, el llms.txt aporta un mapa legible por máquinas para la IA.
El trasfondo es un cambio en el comportamiento de búsqueda. Gartner pronostica para finales de 2026 una caída del volumen de búsqueda clásico de alrededor del 25 por ciento. En Alemania, las vistas generales de IA (AI Overviews) ya aparecen, según la temática, en un 15 a 25 por ciento estimado de las consultas. Entre el 60 y el 65 por ciento de esas búsquedas terminan sin un clic a una web (zero-click), y los clics orgánicos descienden hasta un 38 por ciento por culpa de las AI Overviews (análisis del sector de 2026). Cerca del 30 por ciento de la investigación B2B se realiza ya a través de asistentes como ChatGPT y Perplexity.
Con ello, la competencia se desplaza de la lista de enlaces a la respuesta de la IA. Quien quiera aparecer en esa respuesta debe ofrecer sus contenidos de modo que las máquinas los encuentren, comprendan y prioricen con fiabilidad. El llms.txt es para eso un estándar joven y propuesto (documentado en llmstxt.org) que asume precisamente esa tarea.
El llms.txt aparece en las listas de comprobación actuales de GEO y SEO para IA, pero todavía no es un estándar mainstream consolidado. El archivo se implementa con poco esfuerzo y es anticipatorio: no hace daño, ordena tus contenidos y queda preparado para cuando más sistemas de IA evalúen el estándar. Para el ámbito hispanohablante existe ahora mismo en GEO una ventana de pionero de unos 12 a 18 meses.
Diferencias entre robots.txt y llms.txt en la era de la IA
Ambos archivos se ubican en el directorio raíz y se dirigen a las máquinas, pero resuelven tareas distintas. El robots.txt regula el acceso: indica a los rastreadores qué pueden recuperar y qué no. El llms.txt regula la orientación: indica a los sistemas de IA qué contenidos son importantes y cómo se relacionan entre sí.
| Aspecto | robots.txt | llms.txt |
|---|---|---|
| Finalidad | Control de acceso (permitir / bloquear) | Curación de contenidos para IA |
| Formato | Directivas (User-agent, Allow, Disallow) | Markdown (título, resumen, enlaces) |
| Destinatarios | Todos los rastreadores y bots | Grandes modelos de lenguaje / rastreadores de IA |
| Madurez | Estándar consolidado | Estándar joven y propuesto |
| Función | Abre la puerta | Entrega el mapa |
Ambos archivos no se sustituyen, se complementan. Primero el robots.txt abre la puerta a los rastreadores de IA permitiendo a GPTBot, PerplexityBot, ClaudeBot y Google-Extended. Después el llms.txt ayuda a encontrar las estancias correctas. Un llms.txt perfectamente estructurado sirve de poco si el robots.txt deja fuera a los rastreadores de IA.
Buenas prácticas: contenidos y estructura de un archivo llms.txt
La estructura propuesta es deliberadamente sencilla: un H1 con el nombre, un breve bloque de resumen y secciones temáticas con enlaces y explicaciones. Markdown se encarga de que el archivo siga siendo legible tanto para personas como para máquinas.
Reducir a lo esencial
Enlaza solo las páginas clave canónicas, no cada subpágina. El llms.txt es una curación, no un sitemap completo. Cuanto más clara sea la selección, mejor será la orientación para la IA.
Dar contexto a cada línea
Detrás de cada enlace debe ir una descripción breve y objetiva. Así la IA sabe de qué trata una página sin necesidad de evaluarla por completo.
Un resumen elocuente al principio
El bloque de cita justo debajo del título resume tu oferta en una o dos frases. Esas líneas suelen ser lo primero que asimila un modelo.
Mantenerlo actualizado
Remite solo a páginas existentes y accesibles. Un llms.txt que apunta a contenidos eliminados envía una señal equivocada. Planifica una revisión periódica.
Ejemplos concretos de llms.txt para tiendas, servicios locales y SaaS
La estructura se mantiene, pero el énfasis cambia según el modelo de negocio.
Tienda online
Proveedor de servicios local
Proveedor SaaS
Combinar llms.txt con Schema.org y sitemaps
El llms.txt despliega su efecto en la combinación. Aporta el mapa, Schema.org aporta los datos legibles por máquinas de cada página y el sitemap aporta el inventario completo de todas las URLs. Solo juntos forman una imagen coherente para los sistemas de IA.
| Archivo | Responde a la pregunta | Nivel de detalle |
|---|---|---|
| llms.txt | ¿Qué es importante aquí? | Curado, compacto |
| Schema.org (JSON-LD) | ¿Qué significa exactamente esta página? | Datos estructurados por página |
| Sitemap (XML) | ¿Qué URLs existen? | Completo, sin valoración |
En la práctica significa lo siguiente: las páginas clave enlazadas en el llms.txt deberían ser justamente las que también llevan el marcado de Schema.org más sólido. Quien remita en el llms.txt a sus páginas de producto debería mantener ahí marcado Product u Offer; los proveedores de servicios locales, en consecuencia, LocalBusiness. Así el mapa apunta a páginas que la IA también puede comprender en detalle. Cómo mantener correcto este marcado a lo largo del tiempo lo describe la guía Mantener Schema.org al día.
Evitar errores: qué no deberías ofrecer a los rastreadores de IA
Un llms.txt también puede perjudicar si está mal mantenido. Estos patrones deberías evitarlos.
Enlaces rotos a páginas eliminadas, remisiones a contenidos pobres o duplicados, acumulación de palabras clave en vez de descripciones claras, páginas sensibles o internas en el archivo público, y confundirlo con el robots.txt. El llms.txt no bloquea nada, solo recomienda. La protección de acceso sigue correspondiendo al robots.txt y a la configuración del servidor.
- No enlaces páginas internas, protegidas o jurídicamente delicadas, el archivo es de acceso público.
- Nada de listas de palabras clave, sino descripciones objetivas que reflejen correctamente el contenido.
- Nada de remisiones a páginas no canónicas, pobres o duplicadas, eso diluye la señal.
- No dejes enlaces obsoletos, cada página eliminada debe salir también del llms.txt.
- No confundas el llms.txt con la protección de acceso, de eso se encarga el robots.txt.
Cómo medir los efectos de tu llms.txt con Feed-AI
Un llms.txt es una medida, no un fin en sí mismo. Lo decisivo es si tu visibilidad en IA mejora de verdad. Eso es precisamente lo que Feed-AI hace medible, comprobando con regularidad cómo responden ChatGPT, Perplexity y Gemini a preguntas de búsqueda realistas.
Fijar el punto de partida
Antes de la implementación se mide una línea base: si te descubren en búsquedas sin marca (descubrimiento), si la IA te conoce por tu nombre (notoriedad) y qué cuota de voz tienes frente a la competencia.
Implementar las medidas
Crear el llms.txt, permitir los rastreadores de IA en el robots.txt, mantener Schema.org en las páginas clave. Estos pasos encajan entre sí.
Comprobar el efecto a lo largo del tiempo
El recorrido antes-después muestra si las tres métricas se mueven. Así una suposición se convierte en un progreso demostrable, en vez de en una corazonada.
Importante y dicho con franqueza: un solo archivo no cambia una respuesta de la IA de la noche a la mañana. La visibilidad nace de la combinación de acceso permitido, estructura clara, contenidos sólidos y tiempo. La medición se encarga de que reconozcas el progreso, en vez de optimizar a ciegas.
Preguntas frecuentes
¿Qué es un archivo llms.txt? +
El llms.txt es un sencillo archivo de texto en Markdown ubicado en el directorio raíz de un sitio web (en /llms.txt). Ofrece a sistemas de IA como ChatGPT, Perplexity y Gemini una visión general curada y legible por máquinas de los contenidos más importantes: título, breve descripción y una lista ordenada de enlaces relevantes con su explicación. Es un estándar joven y propuesto, y complementa a robots.txt y al sitemap.
¿ChatGPT, Perplexity y Gemini leen realmente el llms.txt? +
La compatibilidad está en desarrollo. No hay garantía de que cada sistema de IA evalúe ya el archivo hoy. llms.txt es una señal anticipatoria de bajo esfuerzo: no hace daño, mantiene los contenidos más importantes listos para los rastreadores y queda preparada para cuando más sistemas adopten el estándar. La capacidad de ser encontrado sigue dependiendo de contenidos rastreables y de datos estructurados.
¿Dónde debe ubicarse el llms.txt? +
En el directorio raíz del dominio, es decir, en https://tu-dominio.com/llms.txt. Opcionalmente se puede añadir un llms-full.txt más detallado con contenidos completos. El archivo debe servirse como text/plain o text/markdown.
¿El llms.txt sustituye al robots.txt o al sitemap? +
No. El robots.txt controla el acceso, el sitemap lista todas las URLs de forma completa, y el llms.txt cura los contenidos más importantes con contexto para los sistemas de IA. Los tres archivos se complementan y no se sustituyen entre sí.
¿Con qué frecuencia debo actualizar el llms.txt? +
Siempre que cambien los contenidos más importantes: nuevas páginas clave, productos modificados, nuevos servicios o áreas reestructuradas. Un llms.txt desactualizado que apunta a páginas eliminadas perjudica más de lo que ayuda. Una revisión trimestral es una buena referencia.
¿El llms.txt aporta más visibilidad en IA de inmediato? +
No de forma automática ni de la noche a la mañana. llms.txt es una pieza, no un interruptor. Lo decisivo sigue siendo si la IA encuentra y recomienda tus contenidos. Si tus medidas funcionan se puede medir con el tiempo: si te descubren en búsquedas sin marca, si la IA te conoce por tu nombre y qué cuota de voz tienes frente a la competencia.