SitemapScan Blog
HTML XML-sitemapin sijaan: miksi näin tapahtuu ja miten sen korjaa
Sitemap-URL voi olla olemassa, avautua selaimessa ja silti olla väärä, jos se palauttaa HTML:ää oikean XML:n sijaan. Tämä hämmentää crawlereita ja Search Consolea erityisen helposti.
Miksi tämä virhe on yleinen
Framework-fallbackit, CDN-säännöt ja geneerinen routing voivat saada sitemap-URL:n palauttamaan HTML:n XML:n sijaan.
Mitä hakukoneet oikeasti odottavat
Hakukoneet odottavat oikeaa XML-vastausta, jossa on validi juurielementti, ei HTML-kuorta tai virhesivua.
Miten ongelma diagnosoidaan
Tarkista raakavastaus: status, content-type ja varsinainen body. Pelkkä selainnäkymä ei riitä.
Related pages
- Sitemapien content-type-virheet: kun tiedosto on olemassa mutta haku epäonnistuu silti — Jotkin sitemap-URL-osoitteet ovat olemassa ja avautuvat selaimessa, mutta epäonnistuvat silti tärkeissä tarkistuksissa. Väärä content-type on yksi hiljaisimmista syistä.
- Google Search Consolen sitemap-virheet: miten luet signaalin oikein — Kun Search Console hylkää sitemapin tai näyttää varoituksen, viesti on usein vain oire. Näin erotat fetch-, muoto- ja rakenneongelmat toisistaan.
- .xml.gz-sitemapit: miten auditoit ne ilman arvailua — .xml.gz-sitemap voi olla URL-set, sitemap-index tai pakattu child sitemap. Pelkkä tiedostopääte ei kerro juuri mitään. Näin arvioit sen oikein.
- Blogi — Vinkkejä, oppaita ja parhaita käytäntöjä XML-sivustokartoista ja teknisestä SEO:sta.