SitemapScan Blog

User agents no robots.txt explicados: como ler regras de bots sem adivinhar

Um robots.txt pode mencionar buscadores, bots de IA, social preview bots, ferramentas de monitoramento e uma longa cauda de nomes estranhos. Veja como organizar isso sem colapsar tudo em um único grupo.

Comece pela regra curinga

A linha User-agent: * define a regra ampla para todos os bots, a menos que um bloco mais específico a substitua.

Por que famílias de bots importam

Bots de busca, bots sociais, bots de segurança, crawlers de IA e ferramentas de monitoramento não cumprem o mesmo papel. Agrupar tudo junto apaga a postura real do site.

O que fazer com nomes desconhecidos

Quando surgir um bot pouco conhecido, classifique primeiro por função: descoberta, distribuição, extração, monitoramento, verificação ou infraestrutura.

Related pages

Ler artigo