Is robots.txt mandatory or just advisory?

robots.txt is entirely advisory. Well-behaved crawlers like Googlebot, Bingbot, and most legitimate bots respect it, but there is no technical enforcement. Malicious bots, scrapers, and some AI crawlers may ignore it completely. For sensitive content, use server-side access controls (authentication, IP blocking) rather than relying solely on robots.txt.

How do I test my robots.txt file?

Google Search Console provides a robots.txt tester that shows whether specific URLs are blocked or allowed. You can also use online validators that parse your robots.txt and simulate crawler behavior. Test by checking if critical pages are accessible and non-essential pages are blocked. Always verify after deploying changes.

Does Google respect Crawl-delay in robots.txt?

No, Google does not support the Crawl-delay directive. Instead, Google uses its own algorithms to determine optimal crawl rate based on server response times. To control Google's crawl rate, use the Crawl Rate settings in Google Search Console. Bing does respect Crawl-delay, so include it if Bing traffic matters to you.

Generatore robots.txt: Controllare il crawling dei motori di ricerca

In questo articolo

Cos'e robots.txt?

robots.txt e un file di testo posizionato nella root di un sito web che indica ai crawler quali pagine possono o non possono accedere. Segue il Protocollo di Esclusione dei Robot, uno standard dal 1994.

Quando un crawler visita il sito, verifica prima il file robots.txt. Il file contiene direttive che specificano quali user agent possono accedere a quali percorsi. robots.txt e consultivo — i crawler corretti lo rispettano, ma i bot malevoli possono ignorarlo.

Sintassi di robots.txt

Il file utilizza una sintassi semplice basata su direttive:

User-agent — specifica quale crawler e interessato dalle regole
Disallow — blocca l'accesso a un percorso specifico
Allow — consente esplicitamente l'accesso a un percorso
Sitemap — specifica l'URL della sitemap XML
Crawl-delay — suggerisce un ritardo tra richieste successive

I caratteri jolly sono supportati: * corrisponde a qualsiasi sequenza e $ alla fine di un URL.

Pattern robots.txt comuni

Le configurazioni robots.txt piu utili:

Consenti tutto — una direttiva Disallow vuota consente il crawling completo
Blocca tutto — Disallow: / blocca tutti i crawler
Blocca crawler IA — targetizza bot IA specifici con User-agent: GPTBot
Consenti solo Google — combina blocchi per Googlebot e altri agenti
Proteggi percorsi admin — Disallow: /admin/, /api/

Prova gratuitamente — nessuna registrazione richiesta

Genera robots.txt →

Casi d'uso comuni

Un robots.txt ben configurato serve diversi scopi:

Ottimizzazione SEO — prevenire il crawling di contenuti duplicati
Blocco degli scraper — scoraggiare bot di scraping e addestramento IA
Protezione ambienti di staging — bloccare tutti i crawler sui server di staging
Gestione del budget di crawl — bloccare pagine a basso valore

robots.txt e SEO

robots.txt impatta direttamente su come i motori di ricerca scoprono il contenuto:

Bloccare non significa de-indicizzare — usa il meta tag noindex
Includi sempre la sitemap — aggiungi una direttiva Sitemap
Non bloccare file CSS o JavaScript — i motori ne hanno bisogno per il rendering
Errori comuni — bloccare accidentalmente intere directory puo danneggiare il SEO

Domande frequenti

robots.txt e obbligatorio o solo consultivo?

robots.txt e completamente consultivo. Per contenuti sensibili, usa controlli di accesso lato server.

Come testo il mio file robots.txt?

Google Search Console fornisce un tester robots.txt. Puoi anche usare validatori online.

Google rispetta Crawl-delay in robots.txt?

No, Google non supporta Crawl-delay. Usa le impostazioni della velocita di crawl in Google Search Console. Bing rispetta Crawl-delay.

Strumenti correlati

Come generare meta tag perfetti per la SEOCrea meta tag ottimizzati con anteprima SERP e social media.Leggi l'articolo → Parser URL: struttura e componenti degli URLAnalizza gli URL in protocollo, host, percorso, parametri e frammenti. Scopri la struttura URL e i consigli per il debug.Leggi l'articolo → Validazione URL: Come verificare se i link sono validi e sicuriI link non funzionanti e gli URL malformati danneggiano l'esperienza utente e la SEO.Leggi l'articolo →

Torna al Blog