SitemapScan Blog

robots.txt:n user agentit selitettynä: näin luet bottisääntöjä arvailematta

robots.txt voi mainita hakubotteja, AI-crawlereita, social preview -botteja, monitorointityökaluja ja pitkän hännän outoja agenttinimiä. Näin teet listasta ymmärrettävän.

Aloita wildcard-säännöstä

User-agent: * on laaja oletussääntö kaikille boteille, ellei tarkempi agentti saa omaa lohkoaan.

Miksi bottiperheillä on väliä

Hakubotit, sosiaaliset botit, security-botit, AI-crawlerit ja monitorointityökalut tekevät eri asioita. Jos niputat kaiken yhteen, sivuston oikea policy hämärtyy.

Mitä teet tuntemattomille nimille

Tuntemattomat agentit on helpoin ymmärtää luokittelemalla ne ensin funktion mukaan: discovery, distribution, extraction, monitoring, verification tai infrastruktuuri.

Related pages

Lue artikkeli