Guia completo de sitemaps

Um sitemap é um ficheiro estruturado – na maioria das vezes em XML para os motores de pesquisa ou em HTML para os visitantes – que lista os URL que pretende que sejam explorados, especificando ao mesmo tempo as suas relações.

Imagine-o como um manifesto : os robots de rastreio leem a versão XML para encontrar, compreender e hierarquizar os seus conteúdos. Os internautas, por sua vez, podem consultar uma versão HTML que serve de plano de navegação de recurso.

Quem precisa ?

  • Sites de e-commerce com milhares de fichas de produto
  • Editores de notícias que publicam artigos muito sensíveis ao fator tempo
  • Grandes sites corporativos ou bases de conhecimento com uma estrutura profunda
  • Sites com páginas órfãs ou navegação complexa em JavaScript
  • Sites « one-page » ou microsites de vitrina : raramente indispensável

Porque os sitemaps são importantes

Agora que a definição está clara, vejamos porque este simples ficheiro pode mudar a visibilidade do seu site.

Benefícios SEO

Um ficheiro XML bem mantido fornece ao Googlebot e ao Bingbot uma lista de URL selecionados a dedo, permitindo otimizar o orçamento de crawl e reduzir as conjecturas.

Vários estudos de caso mostram que os URL presentes num sitemap são descobertos mais rapidamente do que os acessíveis apenas através dos links internos, sobretudo em sites volumosos ou frequentemente atualizados.

Acessibilidade e UX

As Regras de Acessibilidade para Conteúdos Web (WCAG) 2.4.5 exigem « mais de uma forma » de encontrar uma página. Um sitemap HTML responde a este critério ao oferecer às tecnologias de assistência uma visão linear do site. Ajuda também os utilizadores avançados que preferem um índice completo a menus em gaveta.

Quando é crítico ? Quando é simplesmente útil ?

Torna-se indispensável assim que o seu site ultrapassa 5 000 páginas, é atualizado com frequência ou contém conteúdos a mais de três cliques da página inicial. Permanece apenas confortável para microsites muito bem interligados ou funis de landing pages.

Escolher o tipo certo de sitemap

Consoante o seu contexto, um formato ou outro – ou até vários – revelar-se-á mais pertinente. Façamos o ponto.

XML vs HTML : diferenças-chave

O XML visa os robots, aceita metadados como lastmod (no formato ISO AAAA-MM-DD), priority ou changefreq e situa-se geralmente na raiz : /sitemap.xml. O HTML dirige-se aos humanos, lê-se visualmente e comporta-se como uma página Web clássica. Os sitemaps XML são vivamente recomendados para sites volumosos, complexos ou frequentemente atualizados, enquanto os sites pequenos bem estruturados podem por vezes dispensá-los. A versão HTML continua a ser uma garantia adicional para a acessibilidade e a navegação.

Sitemaps XML especializados

Adicione variantes de imagem, vídeo ou news quando esses media pesam nos seus objetivos ou quando a inclusão no Google News constitui um KPI-chave. Ficheiros distintos permitem respeitar o limite de 50 000 URL e acompanhar cada tipo de conteúdo separadamente.

Tamanho e limites técnicos a conhecer

Cada ficheiro XML está limitado a 50 000 URL ou 50 Mo uma vez descomprimido. Pode ser entregue em Gzip : o tamanho comprimido fica então livre, mas a versão descomprimida deve manter-se abaixo de 50 Mo. Para além disso, crie vários ficheiros acompanhados de um índice de sitemaps.

Planear a sua estratégia de sitemap

Antes de escrever a menor linha de XML, determine o que merece realmente ser indexado e a forma como vai manter o ficheiro dia após dia.

Determinar o que incluir ou excluir

Inclua apenas as páginas canónicas e indexáveis. Exclua o que estiver bloqueado por robots.txt, marcado com noindex ou que devolva códigos 3xx/4xx/5xx : assim indica aos robots onde investir em vez de desperdiçar o seu orçamento de rastreio.

Sitemap único ou múltiplos ?

Divida o conjunto em grupos lógicos – por exemplo /products//blog//videos/ – se estiver a aproximar-se do limite de tamanho ou se quiser relatórios mais legíveis. Um índice global permitirá, ainda assim, uma submissão de uma só vez.

Geração dinâmica vs estática

Os sitemaps dinâmicos, controlados pelo CMS, atualizam-se assim que um conteúdo muda ; garantem exatidão sem esforço manual. Os ficheiros estáticos, criados à mão, servem para sites pequenos raramente modificados, mas exigem uma manutenção rigorosa.

Criar um sitemap : passo a passo

Já sabe o que incluir ; passemos à concretização, seja artesanal ou automatizada.

Método manual (sites pequenos)

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://www.example.com/</loc>
    <lastmod>2023-09-15</lastmod>
    <changefreq>monthly</changefreq>
    <priority>1.0</priority>
  </url>
</urlset>

Método automatizado (qualquer tamanho de site)

Num CMS, ative simplesmente módulos integrados como Yoast ou Rank Math. Crawlers de desktop como o Screaming Frog geram os ficheiros após o rastreio e exportam-nos em poucos segundos. Precisa de uma solução SaaS ? XML-Sitemaps.com ou Dyno Mapper gerem grandes inventários sem instalação local.

Verificar, testar e implementar

Passe o ficheiro por um validador XML e depois coloque-o no diretório raiz ou num subdiretório indicado via robots.txt. Teste primeiro em pré-produção para evitar expor URL de desenvolvimento.

Otimizar e manter o seu sitemap

Um sitemap publicado nunca está « terminado ». Eis como o manter limpo e útil a longo prazo.

Boas práticas técnicas

Mantenha os URL limpos, em minúsculas, e apenas a versão canónica. Só atualize lastmod quando houver alterações substanciais : inflacioná-lo pode ser interpretado como um sinal de baixa fiabilidade. Se o seu site for multilingue, replique os seus clusters hreflang  nos diferentes sitemaps.

Submissão aos motores de pesquisa

No Google Search Console, abra Indexação > Sitemaps, cole o caminho e valide (ver captura abaixo). O Bing Webmaster Tools e o Yandex oferecem interfaces semelhantes ; o Baidu, por seu lado, aceita sobretudo a submissão através de um pedido HTTP /ping.

Acompanhamento e auditoria contínuos

Agende uma revisão mensal. No Search Console, compare o número de URL « Submetidos » com o de « Indexados » : um desvio crescente sinaliza frequentemente um problema de crawl ou de qualidade.

Ferramentas como o Semrush Site Audit ou o Sitebulb detetam 4xx, duplicados não canónicos ou ficheiros demasiado volumosos.

Resolver problemas frequentes

Mesmo os sitemaps exemplares encontram por vezes obstáculos. Veja como resolvê-los rapidamente.

Erros ao nível dos URL

Remova ou atualize as entradas que geram 404, loops 301/302 ou parâmetros supérfluos, e depois volte a lançar um crawl para confirmar a correção.

Erros de formato e compressão

Valide a estrutura XML, certifique-se de que as datas respeitam o formato W3C e mantenha os arquivos Gzip abaixo de 50 Mo uma vez descomprimidos.

Armadilhas dos sitemaps especializados

Os ficheiros news estão limitados a 1 000 URL e só devem conter artigos publicados nas últimas 48 h ; os sitemaps de imagens devem incluir <image:loc> (títulos e legendas continuam a ser facultativos) ; a indexação de vídeo falha se o robots.txt bloquear o feed. Respeite escrupulosamente cada protocolo.

Harmonia entre robots.txt e sitemap

Declare o seu sitemap no robots.txt e evite bloquear URL que nele figurem : evitará sinais contraditórios que desperdiçam o orçamento de crawl e prejudicam o ranking.

Ferramentas e recursos recomendados

Quer esteja a começar ou a procurar refinar a sua prática, estas soluções cobrem todas as necessidades.

Geração e automatização

  • CMS : Yoast SEO (WordPress), Rank Math
  • SaaS : Dyno Mapper, XML-Sitemaps.com
  • Desktop : Screaming Frog, Sitebulb

Auditoria e monitoring

  • Google Search Console, Bing Webmaster Tools
  • Semrush, OnCrawl, ContentKing

Leituras e documentos oficiais

As Guidelines do Google Search Central, a referência de marcação Schema.org e a documentação WCAG constituem fontes com autoridade.

Laisser un commentaire

🇫🇷 Français 🇬🇧 English 🇪🇸 Spanish