SitemapScan Blog
Sitemaps .xml.gz : comment les auditer sans deviner
Une sitemap .xml.gz peut être un URL set, un index ou une simple child sitemap. L'extension seule ne dit presque rien. Ce qui compte est le XML réel.
Ce que signifie vraiment .xml.gz
L'extension .gz signifie seulement que le fichier est compressé. Elle ne dit pas si l'intérieur est un index ou un URL set.
Pourquoi on se trompe souvent
Les fichiers compressés sont souvent pris pour des cas secondaires, alors qu'ils peuvent être la couche de coordination principale.
Comment les classer correctement
Il faut récupérer le fichier, le décompresser et regarder l'élément racine : <sitemapindex> coordonne d'autres fichiers, <urlset> liste des URLs.
Related pages
- Sitemap index vs URL set : comment voir la différence et pourquoi elle compte — Un sitemap index et un sitemap URL set ne jouent pas le même rôle. Savoir lequel vous auditez change complètement la lecture de la couverture, des child sitemaps et de la structure du site.
- Erreurs de content-type pour les sitemaps : quand le fichier existe mais que le fetch échoue quand même — Certaines URLs de sitemap existent et s'ouvrent dans un navigateur, mais échouent tout de même aux contrôles de fetch. Les mauvais content-types font partie des causes silencieuses.
- Plusieurs sitemaps dans robots.txt : ce que cela signifie et comment les auditer — Certains sites déclarent un sitemap dans robots.txt, d'autres en déclarent vingt. Voici ce que signifient vraiment plusieurs directives Sitemap et comment analyser cette structure correctement.
- Blog — Conseils, guides et bonnes pratiques pour les sitemaps XML et le SEO technique.