SitemapScan Blog
Useita sitemap-tiedostoja robots.txt:ssä: mitä se tarkoittaa ja miten se auditoidaan
Jotkin sivustot ilmoittavat yhden sitemapin robots.txt:ssä, toiset kaksikymmentä. Tässä mitä useat Sitemap-direktiivit oikeasti tarkoittavat ja miten rakenne arvioidaan oikein.
Miksi sivusto ilmoittaa useamman kuin yhden sitemapin
Useat sitemap-URL:t robots.txt:ssä ovat täysin sallittuja. Suuret sivustot jakavat sitemappeja usein sisältötyypin, tuoreuden, kielen tai osion mukaan.
Yleinen virhe
Monet checkerit pysähtyvät ensimmäiseen Sitemap-riviin ja käsittelevät sitä pääsitemapina. Todellinen koordinoiva tiedosto voi kuitenkin olla myöhemmin ilmoitettu sitemap-index.
Miten tämä arvioidaan oikein
Kerää ensin kaikki robots.txt:n Sitemap-direktiivit. Testaa sitten jokainen tiedosto: vastaako se, onko se URL set vai index ja näyttääkö se koordinoivalta tiedostolta vai vain yhdeltä osalta?
Related pages
- Sitemap-index vs URL-set: miten erotat ne ja miksi sillä on merkitystä — Sitemap-index ja sitemap-URL-set eivät ole sama asia. Se, kumman kanssa olet tekemisissä, muuttaa koko tulkinnan kattavuudesta ja rakenteesta.
- News-sitemapit ja Google News: mikä niissä pitää olla erilaista — News sitemap ei ole vain tavallinen XML-sitemap tuoreemmilla URL-osoitteilla. Sillä on omat odotuksensa, rajansa ja tyypilliset virheensä. Näin arvioit sen oikein.
- .xml.gz-sitemapit: miten auditoit ne ilman arvailua — .xml.gz-sitemap voi olla URL-set, sitemap-index tai pakattu child sitemap. Pelkkä tiedostopääte ei kerro juuri mitään. Näin arvioit sen oikein.
- Blogi — Vinkkejä, oppaita ja parhaita käytäntöjä XML-sivustokartoista ja teknisestä SEO:sta.