Google, Yahoo! e MSN si mettono d'accordo sulle URL Canoniche e stabiliscono un formato di suggerimento per fare in modo che il proprietario di un sito, o il suo webmaster possano suggerire l'url con il quale si vuole far comparire una pagina web all'interno dei risultati di una SERP.

Cosa è un URL Canonico? Cerco di spiegarlo in modo che anche un utente profano possa darmi retta. Prendiamo ad esempio un sito piuttosto grande con negozio on-line. Guardate la pagina dei prodotti, che è solitamente quella più interessante sotto questo punto di vista, provate a fare delle navigazioni all'interno di quel sito e vi ritroverete ben presto una cronologia con degli url insensati che tappezzano la vostra finestra. Indirizzi insensati, a cui ben presto, si è pensato di porre rimedio tirando in ballo i cosidetti SEO Friendly url, cioè nomi pagina che avessero un senso logico per il visitatore e per il motore di ricerca.
Questi url però sono per l'appunto finti, perchè ogni sistema CMS alle spalle, piuttosto che motore di e-commerce, avrà bisogno di parametri specifici che recupererà dietro le scene nel momento della richiesta.
Cosa significa questo? Che se io accedo con il friendly URL, piuttosto che con quello astruso ma vero, in entrambe i casi, il sito web mi restituirà una pagina potenzialmente indicizzabile dal motore di ricerca.
Succede lo stesso con gli ID di sessione, con i cookies e con qualsiasi altra cosa espressamente riportata nel querystring e utilizzata almeno una volta in un qualsiasi link sparso per la rete.

Ecco allora delinearsi il problema a tutti noto come contenuto duplicato, che alla lunga, può generare problemi di indicizzazione e ottimizzazione. E' vero che i sempre più sofisticati algoritmi dei motori cercano di sopperire a questo genere di problemi in maniera empirica, tuttavia resta sempre il fatto: molteplici URL che puntano allo stesso risultato.

Cosa fare? Canonicalizzare gli URL. La canonicalizzazione altro non è che una semplice indicazione – in questo caso nei confronti del motore – che l'aiuta a scegliere l'indirizzo di accesso ad una pagina (in questo caso si presuppone quello più logico e sensato). Ma chi è che opera questa scelta? Fino ad oggi era l'algoritmo del motore che si preoccupava di farlo. Da oggi, grazie a quanto anticipato sopra, saremo noi autori a poter suggerire quale è l'URL che noi riteniamo più interessante o quello che vogliamo utilizzare.

Il motore di ricerca, in presenza dell’attributo “rel” con valore “canonical” all'interno di un link, farà tutto il resto, compreso anche il trasferimento di PR, di link e chi più ne ha più ne metta.

Un interessante passo avanti quindi verso una migliore gestione del web. Per coloro i quali sono interessati ad approfondire, vi lascio i link dei rispettivi motori(Google, Yahoo! e MSN/Bing) dove spiegano il loro singolo approccio. Inoltre, per gli italian speaker, mi permesso di segnalare questa interessante risorsa che trovo ben fatta per approfondire, anche se l'autore poteva sforzarsi un pò di più piuttosto che prendere parecchi spunti dal post di Rand.

Update del 13/03/2009: navigando per la rete ho trovato queste slides molto ben fatte, in inglese, e mi permetto di suggerirlo come approfondimento.

Update del 03/08/2009: questo me l'ero perso per strada. Anche Ask ha aderito alla canonicalization.

Be Sociable, Share!