Il file robots.txt è un file di testo che contiene dei comandi destinati a dei robot di indicizzazione dei motori di ricerca per precisare loro le pagine che possono o meno essere indicizzate. Così ogni motore di ricerca comincia l'esplorazione di un sito web cercando il f robots.txt nel root del sito.
Il file robots.txt (scritto in minuscolo e al plurale) è un file ASCII che si trova nel root del sito e contiene i seguenti comandi&mnsp;:
![]() |
Il file robots.txt non deve contenere nessuna linea vuota! |
Ecco un esempio di file robots.txt :
User-Agent: * Disallow: /
User-Agent: * Disallow:
User-Agent: nomeDelRobot Disallow : User-Agent: * Disallow: /
User-Agent: NomeDelRobot Disallow: / User-Agent: * Disallow:
User-Agent: * Disallow: /cartella/percorso/pagina.html
User-Agent: * Disallow: /cartella/percorso/pagina.html Disallow: /cartella/percorso/pagina2.html Disallow: /cartella/percorso/pagina3.html
User-Agent: * Disallow: /cartella/
Ecco qualche esempio di User-Agent per i motori di ricerca più famosi :
| Nome del motore | User-Agent |
|---|---|
| Alta Vista | Scooter |
| Excite | ArchitextSpider |
| Googlebot | |
| HotBot | Slurp |
| InfoSeek | InfoSeek Sidewinder |
| Lycos | T-Rex |
| Voilà | Echo |