In prima pagina su Google con il Metodo Go.S.T.

fatti trovare dai tuoi clienti

Corso SEO: 🕷 cosa sono gli spider dei motori di ricerca?

2020-11-18 12:37:17

Perché internet si chiama World Wide Web? Cosa vuol dire spider web? Qual è la differenza tra client e server? Che differenza c'è tra una comunicazione human-machine e machine-machine nel web? Cosa c'entra tutto questo con la SEO? adesso ti spiego...

Hai un sito internet o un e-Commerce 
per promuovere il tuo negozio o la tua professione?

Hai mai sentito parlare di World Wide Web? 
sai perché si chiama così?

Hai mai sentito parlare di Spider Web? 
sai che cosa sono gli spider?

Sai perché dovresti sapere queste cose? 

Io mi chiamo Emanuele Frisoni, sono ingegnere informatico e questo è il mio pane quotidiano, mi dicono che sono molto bravo a spiegare queste cose perché ci lavoro tutti i giorni e mi diverto un sacco a raccontarle anche nel mio canale YouTube... ora ti spiego in poche parole di semplice comprensione il significato di tutti questi termini e per quale motivo è molto importante che tu sappia di cosa si tratta, se vuoi avere visibilità su Google.


Perché internet si chiama Web

Web è un termine inglese che significa ragnatela

La volta scorsa — parlando di parole chiave (fai click per leggere l'articolo) — abbiamo spiegato cos'é internet. Oggi voglio approfondire leggermente l'argomento spiegandoti per quale ragione internet viene chiamato World Wide Web.


Il progetto originario era nato per scopi bellici. 

Le specifiche di progetto della rete ARPANET, parlavano di un modo di collegare tutti i computer tra di loro, per trasmettere informazioni di vario genere, tale per cui — in seguito ad un malfunzionamento della rete, o peggio ancora di un attacco nemico — ogni computer dovesse essere SEMPRE in grado di raggiungere tutti gli altri!

Ti spiego molto velocemente come è fatta la rete telefonica:



La rete telefonica tradizionale ha una struttura ad albero e per chiamare un telefono, si percorre la rete attraverso l'uso dei prefissi. Questo è il motivo per cui un tempo per fare una telefonata locale non si doveva digitare il prefisso.

Facciamo l'esempio in cui una persona straniera voglia chiamare una persona italiana, di Bologna. Per prima cosa deve digitare +39 (oppure 0039) che è il prefisso internazionale dell'Italia per collegare il telefono del chiamante alla centrale internazionale; poi deve digitare 051 che è il prefisso della centrale interurbana della provincia di Bologna; poi infine deve digitare il numero che può essere compreso tra le 5 e le 8 cifre a seconda della densità di popolazione della zona chiamata.

Se un nemico decidesse di bombardare il cavo che collega due centrali internazionali o una dorsale tra la centrale internazionale e le principali centrali interurbane, con un semplicissimo attacco metterebbe in ginocchio una intera nazione distaccandola fisicamente dal resto del mondo (in termini di trasmissione dati).

Certamente è vero che si può creare una ridondanza nella connessione e far transitare le connessioni per più vie... ma ciò che è stato inventato con il progetto ARPANET, poi diventato INTERNET, è una cosa estremamente più efficace!

La struttura dei collegamenti di internet è molto simile a quella della foto di copertina (una ragnatela) dove i computer — rappresentati dai fantasmini — sono collegati con uno o più altri computer da una serie di connessioni arbitrarie, senza una struttura predefinita.


Ogni computer può essere connesso a
un numero arbitrario di altri computer. 

La forma geometrica di una rete telefonica assomiglia ad un albero: si ramifica con una struttura gerarchica e rende l'intera infrastruttura vulnerabile. La forma geometrica di internet, invece, assomiglia ad una ragnatela: dove non esiste gerarchia e ogni computer connesso alla rete, può essere sia un nodo terminale (utilizzatore), sia un nodo strutturale (router o bridge).

Inoltre, ogni computer che fa parte della rete internet, può essere sia un client (utilizzatore finale) o server (servitore, erogatore di servizi). Un esempio di client server può essere il servizio di consultazione delle pagine web, dove il nostro Browser è il client, mentre ciò che eroga il sito è il server (detto anche webserver). 

Nella rete internet non esiste più un percorso specifico da seguire per connettere due computer tra loro, qualunque percorso è valido purché ci sia un modo per connettere un computer A con un computer B. 

Per questo motivo non esiste una numerazione gerarchica per definire i computer connessi alla rete come avviene nella telefonia, bensì ogni computer ha un indirizzo IP, un numero formato con altre regole che oggi non esamineremo, che deve semplicemente essere unico (univoco) all'interno della rete.

Se un nemico dovesse bombardare un ramo della rete internet, i dati che prima transitavano da quel ramo della rete, ora verranno rediretti altrove e cercheranno un percorso alternativo per raggiungere la destinazione. Con la massima probabilità i pacchetti contenenti i dati troveranno sempre un modo per raggiungere la destinazione!

Cosa vuol dire spider web

Cosa sono gli spider dei motori di ricerca

Avrai certamente sentito parlare di spider e di motori di ricerca. Il nome deriva naturalmente dal fatto che se Web significa ragnatela, i suoi abitanti non potevano chiamarsi altro che Spider, ovvero "ragnetti"!

Mentre internet ce lo immaginiamo utilizzato solo dagli umani (human-machine communication) ad esempio per consultare un sito web, esistono un numero spropositato di comunicazioni tra le macchine (machine to machine communication) che hanno lo scopo di sincronizzare dati, aggiornare tabelle, inviare chiavi crittografiche di sicurezza o semplicemente perlustrare il web!

Tecnicamente parlando uno spider è un programma che esegue un lavoro di perlustrazione, molto prezioso per tutti gli utilizzatori della rete.

Googlebot ad esempio è lo spider di Google che si occupa di perlustrare la rete — andando alla ricerca di nuovi siti internet o di aggiornamenti nelle pagine web dei siti che già conosce — e fa sì che le informazioni archiviate nell'indice del motore di ricerca di Google siano sempre attuali, corrette e complete.

  • attuali: significa che le informazioni devono essere perlustrate immediatamente appena esse vengono pubblicate;
  • corrette: significa che le informazioni devono essere corrette nell'indice del motore di ricerca appena esse vengono modificate dalla fonte;
  • complete: significa che lo spider deve individuare tutte le informazioni presenti sul web senza tralasciare alcun sito web, che altrimenti resterebbe chiuso nell'oblio!

Come funziona uno spider

La grossa difficoltà è partire poi una caramella tira l'altra


Quando lo spider entra in una pagina web, va alla ricerca dei contenuti e delle parole chiave, perché oltre che memorizzare l'URL (Uniform Resource Locator) di tutte le pagine web che scansiona, deve anche indicizzarle sulla base di ciò che esse contengono.

Appena lo spider incontra un link all'interno della pagina HTML, lo utilizza per scansionare la prossima pagina web; là dentro troverà altri link e quindi li utilizzerà per saltare in un'altra pagina... e così via!

Ora capisci perché ti dico sempre che devi creare dei Link interni tra le pagine del tuo sito, ma anche Link esterni e soprattutto devi fare in modo che nei siti esterni al tuo siano presenti dei link che puntano al tuo sito web! 

Ad esempio devi sempre condividere i tuoi articoli di Blog o i tuoi Video di YouTube sui tuoi canali social e chiedere ai tuoi amici, fans o follower di condividerli a loro volta!

Perché appena lo spider incontra un link che punta al tuo sito, viene a conoscenza della sua esistenza e lo va a perlustrare in cerca di informazioni utili da indicizzare!

Questo è altresì il motivo per cui non devi mai inserire pagine orfane all'interno del tuo sito! Cioè pagine che non hanno alcun link interno verso di loro!

Gli aiutanti di Googlebot

Google Search Console e Google Analytics

Pensi che Googlebot sia in grado di fare tutto da solo? certamente no! Anche nella perlustrazione dei dati esistono ruoli gerarchici e mansioni specifiche.

Google Search Console è una piattaforma offerta in uso gratuito da Google, per consentire a tutti i proprietari di siti web  di comunicare a Googlebot che hanno "aperto" un nuovo sito e che può andare a perlustrarlo utilizzando un certo URL (Uniform Resource Locator). Inoltre Google Search Console ci offre la possibilità di dire a Googlebot quali sono esattamente tutte le pagine che dovrebbe scansionare attraverso le Sitemap!

Google Analytics invece è uno strumento — sempre offerto ad uso gratuito da Google — che consente a Googlebot di registrare una serie strepitosa di informazioni legate all'interazione che hanno gli utenti con il tuo sito web, consentendo di aumentare notevolmente la quantità di dati all'interno dell'indice del motore di ricerca.

Se desideri approfondire questo argomento e imparare come sfruttare al massimo questi strumenti offerti da Google per dare la massima visibilità al tuo sito web, guarda i 100 minuti di video che ho preparato per te gratis:


by Emanuele Frisoni