SitemapScan Blog
Sitemapien content-type-virheet: kun tiedosto on olemassa mutta haku epäonnistuu silti
Jotkin sitemap-URL-osoitteet ovat olemassa ja avautuvat selaimessa, mutta epäonnistuvat silti tärkeissä tarkistuksissa. Väärä content-type on yksi hiljaisimmista syistä.
Miksi content-type on yhä tärkeä
Crawlers eivät odota vain mitä tahansa vastausta, vaan oikeanlaista vastausta. Jos sitemap-endpoint palauttaa HTML:ää tai väärän tyypin, tulkinta heikkenee.
Mikä yleensä aiheuttaa virheen
Tyypillisiä syitä ovat CDN-säännöt, väärin konfiguroidut proxyt, geneeriset latausendpointit tai sovelluksen fallbackit, jotka palauttavat HTML:n XML:n sijaan.
Miten diagnosoit sen
Tarkista raakavastaus: HTTP-status, content-type, body ja mahdolliset redirectit. Oleellista ei ole vain se miltä selainnäkymä näyttää, vaan mitä endpoint oikeasti palauttaa.
Related pages
- Google Search Consolen sitemap-virheet: miten luet signaalin oikein — Kun Search Console hylkää sitemapin tai näyttää varoituksen, viesti on usein vain oire. Näin erotat fetch-, muoto- ja rakenneongelmat toisistaan.
- Yleisimmät sitemapin validointivirheet ja miten ne korjataan — Pienetkin sitemap-virheet voivat heikentää koko tiedoston luotettavuutta. Tärkeää on erottaa estävät virheet kontekstuaalisista varoituksista.
- .xml.gz-sitemapit: miten auditoit ne ilman arvailua — .xml.gz-sitemap voi olla URL-set, sitemap-index tai pakattu child sitemap. Pelkkä tiedostopääte ei kerro juuri mitään. Näin arvioit sen oikein.
- Blogi — Vinkkejä, oppaita ja parhaita käytäntöjä XML-sivustokartoista ja teknisestä SEO:sta.