SitemapScan Blog
Sitemaps i .xml.gz: hur du granskar dem utan att gissa
En .xml.gz-sitemap kan vara ett URL-set, ett sitemap-index eller en komprimerad child sitemap. Filändelsen ensam säger nästan ingenting. Så granskar du den rätt.
Vad en .xml.gz-sitemap egentligen betyder
.gz-tillägget betyder bara att filen är komprimerad. Det säger inte om XML:en inuti är ett URL-set eller ett index.
Varför komprimerade filer leder till feltolkningar
Många behandlar en komprimerad sitemap som något sekundärt, trots att den i praktiken kan vara sajtens huvudsakliga koordinerande index.
Hur du klassificerar den korrekt
Hämta filen, dekomprimera den och inspektera rootelementet. <sitemapindex> betyder att filen samordnar child sitemaps, medan <urlset> betyder ett blad med riktiga URL:er.
Related pages
- Sitemap-index vs URL-set: hur du ser skillnaden och varför den spelar roll — Ett sitemap-index och ett sitemap-URL-set har inte samma roll. Att veta vilket du tittar på förändrar hela tolkningen av täckning och struktur.
- Fel content-type för sitemaps: när filen finns men hämtningen ändå misslyckas — Vissa sitemap-URL:er finns och öppnas i webbläsaren, men fallerar ändå i viktiga kontroller. Fel content-type är en av de tystare orsakerna.
- Flera sitemaps i robots.txt: vad det betyder och hur du granskar det — Vissa sajter deklarerar en sitemap i robots.txt, andra tjugo. Här är vad flera Sitemap-direktiv faktiskt betyder och hur du granskar strukturen korrekt.
- Blogg — Tips, guider och bästa praxis för XML-sitemaps och teknisk SEO.