SitemapScan Blog

Blockerad av robots.txt men listad i en sitemap: varför konflikten spelar roll

När en URL listas i en sitemap men blockeras av robots.txt säger webbplatsen två olika saker till crawlers samtidigt. Så här bör konflikten bedömas.

Varför konflikten är viktig

Sitemapen säger att URL:en är värd att upptäcka. robots.txt-blocket säger att vägen inte ska crawlas. Det skapar en onödig motsägelse.

Hur det vanligtvis uppstår

Det dyker ofta upp efter migreringar, tillfälliga regler, ärvda disallow-mönster eller generators som inte känner till robots-policyn.

Hur du auditerar konflikten

Kontrollera om blockeringen är avsiktlig, om URL:en verkligen ska finnas i sitemapen och om konflikten gäller några få URL:er eller en hel sektion.

Related pages

Läs artikel