Un sitemap es un archivo estructurado – la mayoría de las veces en XML para los motores de búsqueda o en HTML para los visitantes – que enumera las URL que desea que se rastreen, al tiempo que precisa sus relaciones.
Imagínelo como un manifiesto : los robots de rastreo leen la versión XML para encontrar, comprender y jerarquizar sus contenidos. Los internautas, por su parte, pueden consultar una versión HTML que sirve como plan de navegación de respaldo.
¿Quién lo necesita ?
- Sitios e-commerce con miles de fichas de producto
- Medios de noticias que publican artículos muy sensibles al factor tiempo
- Grandes sitios corporativos o bases de conocimiento con una arquitectura profunda
- Sitios con páginas huérfanas o una navegación compleja en JavaScript
- Sitios « one-page » o micrositios escaparate : rara vez es indispensable
Por qué los sitemaps son importantes
Ahora que la definición está clara, veamos por qué este simple archivo puede cambiar la visibilidad de su sitio.
Beneficios SEO
Un archivo XML bien mantenido proporciona a Googlebot y Bingbot una lista de URL seleccionadas, lo que permite optimizar el presupuesto de rastreo y reducir las conjeturas.
Varios estudios de caso muestran que las URL presentes en un sitemap se descubren más rápido que las accesibles únicamente mediante los enlaces internos, especialmente en sitios grandes o que se actualizan con frecuencia.
Accesibilidad y UX
Las Pautas de Accesibilidad para el Contenido Web (WCAG) 2.4.5 exigen « más de una forma » de encontrar una página. Un sitemap HTML cumple este criterio al ofrecer a las tecnologías de asistencia una vista lineal del sitio. También ayuda a los usuarios avanzados que prefieren un índice completo a menús desplegables.
¿Cuándo es crítico ? ¿Cuándo es simplemente útil ?
Se vuelve indispensable en cuanto su sitio supera las 5 000 páginas, se actualiza con frecuencia o contiene contenidos a más de tres clics de la página de inicio. Se mantiene simplemente cómodo para micrositios muy bien enlazados o embudos de landing pages.
Elegir el tipo de sitemap adecuado
Según su contexto, un formato u otro – e incluso varios – resultará más pertinente. Hagamos balance.
XML vs HTML : diferencias clave
El XML está orientado a los robots, acepta metadatos como lastmod (en formato ISO AAAA-MM-DD), priority o changefreq y suele ubicarse en la raíz : /sitemap.xml. El HTML está dirigido a los humanos, se lee visualmente y se comporta como una página web clásica. Los sitemaps XML se recomiendan encarecidamente para sitios grandes, complejos o que se actualizan con frecuencia, mientras que los sitios pequeños y bien estructurados a veces pueden prescindir de ellos. La versión HTML sigue siendo un seguro adicional para la accesibilidad y la navegación.
Sitemaps XML especializados
Añada variantes de imagen, vídeo o news cuando estos medios pesen en sus objetivos o cuando la inclusión en Google News sea un KPI clave. Archivos separados permiten respetar el límite de 50 000 URL y seguir cada tipo de contenido por separado.
Tamaño y límites técnicos a conocer
Cada archivo XML está limitado a 50 000 URL o 50 MB una vez descomprimido. Puede entregarse en Gzip : el tamaño comprimido queda entonces libre, pero la versión descomprimida debe mantenerse por debajo de 50 MB. Más allá, cree varios archivos acompañados de un índice de sitemaps.
Planificar su estrategia de sitemap
Antes de escribir una sola línea de XML, determine qué merece realmente ser indexado y cómo va a mantener el archivo día tras día.
Determinar qué incluir o excluir
Incluya solo las páginas canónicas e indexables. Excluya lo que esté bloqueado por robots.txt, marcado con noindex o devuelva códigos 3xx/4xx/5xx : así indica a los robots dónde invertir en lugar de malgastar su presupuesto de rastreo.
¿Sitemap único o múltiples ?
Divida el conjunto en grupos lógicos – por ejemplo /products/, /blog/, /videos/ – si se acerca al límite de tamaño o desea informes más legibles. Un índice global permitirá, aun así, un envío en una sola vez.
Generación dinámica vs estática
Los sitemaps dinámicos, gestionados por el CMS, se actualizan en cuanto un contenido cambia ; garantizan la exactitud sin esfuerzo manual. Los archivos estáticos, creados a mano, convienen a sitios pequeños que rara vez se modifican, pero exigen un mantenimiento riguroso.
Crear un sitemap : paso a paso
Ya sabe qué incluir ; pasemos a la realización concreta, ya sea artesanal o automatizada.
Método manual (sitios pequeños)
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.example.com/</loc>
<lastmod>2023-09-15</lastmod>
<changefreq>monthly</changefreq>
<priority>1.0</priority>
</url>
</urlset>
Método automatizado (cualquier tamaño de sitio)
En un CMS, active simplemente los módulos integrados como Yoast o Rank Math. Rastreadores de escritorio como Screaming Frog generan los archivos tras el rastreo y los exportan en unos segundos. ¿Necesita una solución SaaS ? XML-Sitemaps.com o Dyno Mapper gestionan inventarios extensos sin instalación local.
Verificar, probar y desplegar
Pase el archivo por un validador XML y luego colóquelo en el directorio raíz o en una subcarpeta indicada mediante robots.txt. Pruebe primero en preproducción para evitar exponer URL de desarrollo.
Optimizar y mantener su sitemap
Un sitemap publicado nunca está « terminado ». Así es como mantenerlo limpio y útil a lo largo del tiempo.
Buenas prácticas técnicas
Mantenga URL limpias, en minúsculas, y únicamente la versión canónica. Actualice lastmod solo cuando haya cambios sustanciales : inflarlo podría interpretarse como una señal de baja fiabilidad. Si su sitio es multilingüe, replique sus clústeres hreflang en los diferentes sitemaps.
Envío a los motores de búsqueda
En Google Search Console, abra Indexación > Sitemaps, pegue la ruta y valide (ver captura a continuación). Bing Webmaster Tools y Yandex ofrecen interfaces similares ; Baidu, por su parte, acepta sobre todo el envío mediante una petición HTTP /ping.
Seguimiento y auditoría continuos
Planifique una revisión mensual. En Search Console, compare el número de URL « Enviadas » con el de « Indexadas » : una brecha creciente suele señalar un problema de rastreo o de calidad.
Herramientas como Semrush Site Audit o Sitebulb detectan los 4xx, los duplicados no canónicos o los archivos demasiado voluminosos.
Solucionar problemas frecuentes
Incluso los sitemaps ejemplares a veces encuentran obstáculos. Aquí le mostramos cómo resolverlos rápidamente.
Errores a nivel de URL
Elimine o actualice las entradas que generen 404, bucles 301/302 o parámetros superfluos, y luego vuelva a lanzar un rastreo para confirmar la corrección.
Errores de formato y compresión
Valide la estructura XML, asegúrese de que las fechas respeten el formato W3C y mantenga los archivos Gzip por debajo de 50 MB una vez descomprimidos.
Trampas de los sitemaps especializados
Los archivos news están limitados a 1 000 URL y solo deben contener artículos publicados en las últimas 48 h ; los sitemaps de imágenes deben incluir <image:loc> (títulos y leyendas siguen siendo opcionales) ; la indexación de vídeo falla si robots.txt bloquea el feed. Respete escrupulosamente cada protocolo.
Armonía entre robots.txt y sitemap
Declare su sitemap en robots.txt y evite bloquear URL que figuren en él : evitará señales contradictorias que malgastan el presupuesto de rastreo y perjudican el posicionamiento.
Herramientas y recursos recomendados
Tanto si está empezando como si busca afinar su práctica, estas soluciones cubren el conjunto de necesidades.
Generación y automatización
- CMS : Yoast SEO (WordPress), Rank Math
- SaaS : Dyno Mapper, XML-Sitemaps.com
- Desktop : Screaming Frog, Sitebulb
Auditoría y monitorización
- Google Search Console, Bing Webmaster Tools
- Semrush, OnCrawl, ContentKing
Lecturas y documentos oficiales
Las Guidelines de Google Search Central, la referencia de marcado Schema.org y la documentación WCAG constituyen fuentes de autoridad.