Cos'è una sitemap e come funziona

Attenzione: questo è un articolo “for dummies”, pertanto cari web-cosi non prendetevela troppo se stavolta do spazio a chi ancora non conosce alcuni aspetti basilari del web.

Entriamo nel vivo: una sitemap, come dice la parola stessa, è la mappa del sito. Attenzione, lo so già dove sta andando la vostra fantasia: “ah, è quella pagina dove c’è l’indice e l’albero di navigazione, clicchi e ti porta direttamente alla pagina che vuoi!”. NO, non è quella. Quella è la struttura del sito, detta anche mappa del sito, ed ha una funzione di accessibilità. Tra parentesti credo che molti, con l’avvento delle sitemap, abbiano fatto confusione fra le due perché c’è stato un periodo di boom di tali “mappe”.

La sitemap per i motori di ricerca è invece un file .xml che contiene l’elenco di titoli e data di ultima modifica di articoli e pagine del nostro sito. Ma facciamo un passo indietro.

Google è un motore di ricerca, ed in quanto tale deve scansire ogni volta milioni e miliardi di pagine. Immaginate la quantità di risorse necessarie per fare tutto ciò. Per alleggerire il lavoro alle macchine dello “spider”, ragno che tesse la tela, così si chiama il motore che lavora, sono stati creati gli “Strumenti per Webmaster” di Google attraverso i quali segnalare a Google la presenza di un nuovo sito (provate ad immaginare se dovesse andare sui Registri e indicizzare tutti i domini acquistati, dove magari non è stato ancora messo nessun sito: improponibile oltreché inutile!)

Sempre negli strumenti menzionati, Google chiede la “cortesia” di inviare anche l’indirizzo dove risiede la sitemap. Questo perché, dopo aver fatto una prima scansione del sito ed indicizzato tutte le pagine, sarebbe inutile per lui tornare ogni giorno se non è cambiato nulla, siete d’accordo? Allora ecco che le sitemap  ci vengono in aiuto. Confrontando il file presente nel suo archivio con quello nuovo (generato automaticamente se  si dispone di un CMS), e notando la data di modifica diversa di alcune pagine o articoli, ecco che nello spider si attiva il comando di “rileggerle” e reindicizzarle. Meno risorse sprecate, e voi reindicizzate solo le pagine modificate.

Funzionano, per fare un paragone, allo stesso modo dei vostri feed rss, tanto che spesso i due files coincidono, a seconda del sistema. In genere però Google predilige il formato sitemap.xml o sitemap.xml.gz (file compresso), in modo da velocizzare il sistema che è già predisposto per tali files.

Come accennavo se si dispone di un CMS il file in genere viene generato automaticamente, con l’ausilio o meno di alcuni plugin. A tal proposito vi rimando all’articolo sui migliori plugin per Sitemap di WordPress o nel caso non ne disponiate, ad uno strumento web gratuito che ve la genera automaticamente.

Laura De Masi ce ne aveva già parlato qui.

Chiaro? Domande?

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

%d blogger hanno fatto clic su Mi Piace per questo: