Quanti di noi aprendo il browser si trovano di fronte alla pulita pagina iniziale di Google? Credo davvero in tanti, il motore di ricerca è praticamente la prima tappa obbligata di quasi tutte le connessioni ad internet; grazie a Google, a Bing o a Yahoo, per citare i principali motori, abbiamo accesso a quell’oceano sconfinato di informazioni, notizie, immagini video e contenuti che il web custodisce e al quale possiamo accedere in qualsiasi momento.

Ma cosa sono in realtà i motori di ricerca? Quali sono le logiche di funzionamento di queste interfacce così apparentemente semplici e lineari? Il concetto di base è quello di considerare un motore di ricerca come un grande database unico, una immensa banca dati che custodisce le informazioni di tutti i siti in rete. Da questa mole imponente di dati i motori di ricerca riescono, in pochi decimi di secondo, a tirar fuori le informazioni che desideriamo.

Per costituire questa banca dati i motori di ricerca si servono dei cosiddetti Spider, degli applicativi che visitano, secondo criteri ben precisi, i siti web; uno Spider “spulcia” un blog o un sito da cima a fondo, memorizza le parole chiave dei contenuti, segue i collegamenti interni, quelli esterni in entrata e in uscita per arricchire ed ampliare sempre più il database. Il frutto di questa continua ricerca viene inviato ad appositi centri di raccolta digitali.

Oltre agli spider, che come avrete compreso sono dei software, dopo la raccolta intervengono altri programmi che provvedono all’identificazione e alla catalogazione. La fase successiva è quella dell’indicizzazione, una delle più importanti poiché classifica e ordina, in base all’attinenza e all’autorevolezza dei contenuti, l’ordine con il quale ci vengono proposti i risultati di una interrogazione ai motori di ricerca.