SitemapScan Blog
.xml.gz-sitemapit: miten auditoit ne ilman arvailua
.xml.gz-sitemap voi olla URL-set, sitemap-index tai pakattu child sitemap. Pelkkä tiedostopääte ei kerro juuri mitään. Näin arvioit sen oikein.
Mitä .xml.gz-sitemap oikeasti tarkoittaa
.gz-pääte kertoo vain, että tiedosto on pakattu. Se ei kerro, onko sisällä oleva XML URL-set vai index.
Miksi pakatut tiedostot johtavat vääriin oletuksiin
Moni pitää pakattua sitemapia toissijaisena tai erikoisena, vaikka se voi käytännössä olla koko sivuston pääindeksi.
Miten luokittelet sen oikein
Hae tiedosto, pura se ja tarkista juurielementti. <sitemapindex> tarkoittaa muita sitemappeja koordinoivaa tiedostoa, kun taas <urlset> on varsinainen URL-inventaario.
Related pages
- Sitemap-index vs URL-set: miten erotat ne ja miksi sillä on merkitystä — Sitemap-index ja sitemap-URL-set eivät ole sama asia. Se, kumman kanssa olet tekemisissä, muuttaa koko tulkinnan kattavuudesta ja rakenteesta.
- Sitemapien content-type-virheet: kun tiedosto on olemassa mutta haku epäonnistuu silti — Jotkin sitemap-URL-osoitteet ovat olemassa ja avautuvat selaimessa, mutta epäonnistuvat silti tärkeissä tarkistuksissa. Väärä content-type on yksi hiljaisimmista syistä.
- Useita sitemap-tiedostoja robots.txt:ssä: mitä se tarkoittaa ja miten se auditoidaan — Jotkin sivustot ilmoittavat yhden sitemapin robots.txt:ssä, toiset kaksikymmentä. Tässä mitä useat Sitemap-direktiivit oikeasti tarkoittavat ja miten rakenne arvioidaan oikein.
- Blogi — Vinkkejä, oppaita ja parhaita käytäntöjä XML-sivustokartoista ja teknisestä SEO:sta.