SitemapScan Blog

Blokeret af robots.txt men listet i et sitemap: hvorfor konflikten betyder noget

Når en URL er listet i et sitemap men blokeret af robots.txt, fortæller sitet to forskellige ting til crawlers på samme tid. Sådan bør konflikten vurderes.

Hvorfor konflikten er vigtig

Sitemapet siger, at URL'en er værd at opdage. robots.txt-blokken siger, at stien ikke skal crawles. Det skaber en unødvendig modsigelse.

Hvordan det typisk opstår

Det sker ofte efter migreringer, midlertidige regler, arvede disallow-mønstre eller generatorer, der ikke kender robots-politikken.

Hvordan du auditerer konflikten

Kontrollér om blokeringen er tilsigtet, om URL'en virkelig bør stå i sitemapet, og om konflikten gælder få URL'er eller en hel sektion.

Related pages

Læs artikel