SitemapScan Blog
.xml.gz-sitemaps: hvordan du auditerer dem uden at gætte
En .xml.gz-sitemap kan være et URL-set, et sitemap-index eller en komprimeret child sitemap. Filendelsen alene fortæller næsten ingenting. Sådan vurderer du den korrekt.
Hvad en .xml.gz-sitemap faktisk betyder
.gz-endelsen fortæller kun at filen er komprimeret. Den siger ikke om XML'en indeni er et URL-set eller et index.
Hvorfor komprimerede filer skaber forkerte antagelser
Mange opfatter en komprimeret sitemap som noget sekundært, selv om den i praksis kan være sitets centrale koordinerende index.
Hvordan du klassificerer den korrekt
Hent filen, dekomprimér den og se på rodelementet. <sitemapindex> betyder at filen koordinerer child sitemaps, mens <urlset> er et blad med rigtige URL'er.
Related pages
- Sitemap-index vs URL-set: hvordan du ser forskellen og hvorfor den betyder noget — Et sitemap-index og et sitemap-URL-set har ikke samme rolle. At vide hvad du ser på, ændrer hele tolkningen af dækning og struktur.
- Sitemap content-type-fejl: når filen findes men fetch stadig fejler — Nogle sitemap-URL'er findes og åbner i browseren, men fejler stadig i vigtige kontroller. Forkerte content-types er en af de mere stille årsager.
- Flere sitemaps i robots.txt: hvad det betyder og hvordan du auditerer det — Nogle sites deklarerer én sitemap i robots.txt, andre tyve. Her er hvad flere Sitemap-direktiver faktisk betyder, og hvordan du vurderer strukturen korrekt.
- Blog — Tips, vejledninger og bedste praksis for XML-sitemaps og teknisk SEO.