Guía completa de sitemaps

Un sitemap es un archivo estructurado – la mayoría de las veces en XML para los motores de búsqueda o en HTML para los visitantes – que enumera las URL que desea que se rastreen, al tiempo que precisa sus relaciones.

Imagínelo como un manifiesto : los robots de rastreo leen la versión XML para encontrar, comprender y jerarquizar sus contenidos. Los internautas, por su parte, pueden consultar una versión HTML que sirve como plan de navegación de respaldo.

¿Quién lo necesita ?

  • Sitios e-commerce con miles de fichas de producto
  • Medios de noticias que publican artículos muy sensibles al factor tiempo
  • Grandes sitios corporativos o bases de conocimiento con una arquitectura profunda
  • Sitios con páginas huérfanas o una navegación compleja en JavaScript
  • Sitios « one-page » o micrositios escaparate : rara vez es indispensable

Por qué los sitemaps son importantes

Ahora que la definición está clara, veamos por qué este simple archivo puede cambiar la visibilidad de su sitio.

Beneficios SEO

Un archivo XML bien mantenido proporciona a Googlebot y Bingbot una lista de URL seleccionadas, lo que permite optimizar el presupuesto de rastreo y reducir las conjeturas.

Varios estudios de caso muestran que las URL presentes en un sitemap se descubren más rápido que las accesibles únicamente mediante los enlaces internos, especialmente en sitios grandes o que se actualizan con frecuencia.

Accesibilidad y UX

Las Pautas de Accesibilidad para el Contenido Web (WCAG) 2.4.5 exigen « más de una forma » de encontrar una página. Un sitemap HTML cumple este criterio al ofrecer a las tecnologías de asistencia una vista lineal del sitio. También ayuda a los usuarios avanzados que prefieren un índice completo a menús desplegables.

¿Cuándo es crítico ? ¿Cuándo es simplemente útil ?

Se vuelve indispensable en cuanto su sitio supera las 5 000 páginas, se actualiza con frecuencia o contiene contenidos a más de tres clics de la página de inicio. Se mantiene simplemente cómodo para micrositios muy bien enlazados o embudos de landing pages.

Elegir el tipo de sitemap adecuado

Según su contexto, un formato u otro – e incluso varios – resultará más pertinente. Hagamos balance.

XML vs HTML : diferencias clave

El XML está orientado a los robots, acepta metadatos como lastmod (en formato ISO AAAA-MM-DD), priority o changefreq y suele ubicarse en la raíz : /sitemap.xml. El HTML está dirigido a los humanos, se lee visualmente y se comporta como una página web clásica. Los sitemaps XML se recomiendan encarecidamente para sitios grandes, complejos o que se actualizan con frecuencia, mientras que los sitios pequeños y bien estructurados a veces pueden prescindir de ellos. La versión HTML sigue siendo un seguro adicional para la accesibilidad y la navegación.

Sitemaps XML especializados

Añada variantes de imagen, vídeo o news cuando estos medios pesen en sus objetivos o cuando la inclusión en Google News sea un KPI clave. Archivos separados permiten respetar el límite de 50 000 URL y seguir cada tipo de contenido por separado.

Tamaño y límites técnicos a conocer

Cada archivo XML está limitado a 50 000 URL o 50 MB una vez descomprimido. Puede entregarse en Gzip : el tamaño comprimido queda entonces libre, pero la versión descomprimida debe mantenerse por debajo de 50 MB. Más allá, cree varios archivos acompañados de un índice de sitemaps.

Planificar su estrategia de sitemap

Antes de escribir una sola línea de XML, determine qué merece realmente ser indexado y cómo va a mantener el archivo día tras día.

Determinar qué incluir o excluir

Incluya solo las páginas canónicas e indexables. Excluya lo que esté bloqueado por robots.txt, marcado con noindex o devuelva códigos 3xx/4xx/5xx : así indica a los robots dónde invertir en lugar de malgastar su presupuesto de rastreo.

¿Sitemap único o múltiples ?

Divida el conjunto en grupos lógicos – por ejemplo /products//blog//videos/ – si se acerca al límite de tamaño o desea informes más legibles. Un índice global permitirá, aun así, un envío en una sola vez.

Generación dinámica vs estática

Los sitemaps dinámicos, gestionados por el CMS, se actualizan en cuanto un contenido cambia ; garantizan la exactitud sin esfuerzo manual. Los archivos estáticos, creados a mano, convienen a sitios pequeños que rara vez se modifican, pero exigen un mantenimiento riguroso.

Crear un sitemap : paso a paso

Ya sabe qué incluir ; pasemos a la realización concreta, ya sea artesanal o automatizada.

Método manual (sitios pequeños)

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://www.example.com/</loc>
    <lastmod>2023-09-15</lastmod>
    <changefreq>monthly</changefreq>
    <priority>1.0</priority>
  </url>
</urlset>

Método automatizado (cualquier tamaño de sitio)

En un CMS, active simplemente los módulos integrados como Yoast o Rank Math. Rastreadores de escritorio como Screaming Frog generan los archivos tras el rastreo y los exportan en unos segundos. ¿Necesita una solución SaaS ? XML-Sitemaps.com o Dyno Mapper gestionan inventarios extensos sin instalación local.

Verificar, probar y desplegar

Pase el archivo por un validador XML y luego colóquelo en el directorio raíz o en una subcarpeta indicada mediante robots.txt. Pruebe primero en preproducción para evitar exponer URL de desarrollo.

Optimizar y mantener su sitemap

Un sitemap publicado nunca está « terminado ». Así es como mantenerlo limpio y útil a lo largo del tiempo.

Buenas prácticas técnicas

Mantenga URL limpias, en minúsculas, y únicamente la versión canónica. Actualice lastmod solo cuando haya cambios sustanciales : inflarlo podría interpretarse como una señal de baja fiabilidad. Si su sitio es multilingüe, replique sus clústeres hreflang en los diferentes sitemaps.

Envío a los motores de búsqueda

En Google Search Console, abra Indexación > Sitemaps, pegue la ruta y valide (ver captura a continuación). Bing Webmaster Tools y Yandex ofrecen interfaces similares ; Baidu, por su parte, acepta sobre todo el envío mediante una petición HTTP /ping.

Seguimiento y auditoría continuos

Planifique una revisión mensual. En Search Console, compare el número de URL « Enviadas » con el de « Indexadas » : una brecha creciente suele señalar un problema de rastreo o de calidad.

Herramientas como Semrush Site Audit o Sitebulb detectan los 4xx, los duplicados no canónicos o los archivos demasiado voluminosos.

Solucionar problemas frecuentes

Incluso los sitemaps ejemplares a veces encuentran obstáculos. Aquí le mostramos cómo resolverlos rápidamente.

Errores a nivel de URL

Elimine o actualice las entradas que generen 404, bucles 301/302 o parámetros superfluos, y luego vuelva a lanzar un rastreo para confirmar la corrección.

Errores de formato y compresión

Valide la estructura XML, asegúrese de que las fechas respeten el formato W3C y mantenga los archivos Gzip por debajo de 50 MB una vez descomprimidos.

Trampas de los sitemaps especializados

Los archivos news están limitados a 1 000 URL y solo deben contener artículos publicados en las últimas 48 h ; los sitemaps de imágenes deben incluir <image:loc> (títulos y leyendas siguen siendo opcionales) ; la indexación de vídeo falla si robots.txt bloquea el feed. Respete escrupulosamente cada protocolo.

Armonía entre robots.txt y sitemap

Declare su sitemap en robots.txt y evite bloquear URL que figuren en él : evitará señales contradictorias que malgastan el presupuesto de rastreo y perjudican el posicionamiento.

Herramientas y recursos recomendados

Tanto si está empezando como si busca afinar su práctica, estas soluciones cubren el conjunto de necesidades.

Generación y automatización

  • CMS : Yoast SEO (WordPress), Rank Math
  • SaaS : Dyno Mapper, XML-Sitemaps.com
  • Desktop : Screaming Frog, Sitebulb

Auditoría y monitorización

  • Google Search Console, Bing Webmaster Tools
  • Semrush, OnCrawl, ContentKing

Lecturas y documentos oficiales

Las Guidelines de Google Search Central, la referencia de marcado Schema.org y la documentación WCAG constituyen fuentes de autoridad.

Laisser un commentaire

🇫🇷 Français 🇬🇧 English 🇵🇹 Portuguese