La Serp di Google: come si indicizzano le pagine

Che cos’è la Serp?

La Serp di Google è l’indice che racchiude i siti ordinati in base al loro ranking, ovvero al punteggio che il motore di ricerca affida ad ogni singola pagina in relazione alla sua parola chiave. La Serp è dunque l’elenco di risultati prodotti da una determinata ricerca. In alto Google mette i risultati più pertinenti, più citati da altri siti, meglio scritti.

 

Come si indicizzano le pagine di Google?

Google provvede a scandagliare il web con un programma chiamato Crawler.  Quando trova una pagina che presenta una determinata parola chiave, la Inserirà nella Serp (indice) corrispondente alla ricerca Google di quella parola chiave. Ad esempio se scriviamo un articolo sulle mele, il Crawler di Google la inserirà in un indice che corrisponde alla ricerca “mele”. Quando l’utente cercherà quella parola, Google gli presenterà un indice con pagine che contengono quella parola chiave.

 

Come si de-indicizzano le pagine?

I programmatori o coloro che gestiscono un determinato sito, possono dire al Crawler di Google di non fare la scansione di una determinata pagina, cioè di non entrare in quel file per aggiornare le informazioni e inserirle nell’indice della ricerca.

Questo è possibile lavorando su un file chiamato /robots.txt.  Non fare la scansione però non significa “non indicizzare”, e quindi per questo motivo potremmo trovare dei file indicizzati sotto forma di dati elencati “per conoscenza”. Ciò accade perché vengono trovati linkati, per esempio nel web attraverso altre risorse, o perché erano stati inizialmente indicizzati e successivamente è apparso l’ordine di non farne la scansione.

Nascondere una pagina dall’indice di Google non è affatto raro, infatti alcune pagine del nostro sito potrebbero essere più tecniche che utili all’utente. Farlo può essere utile anche su richiesta di esercitare il Diritto all’Oblio.

 

Torna a Focus On: Google