SEM


Che cosa significa il fatto che i motori di ricerca hanno ancora un approccio lessicale e non semantico? Questa situazione è destinata a cambiare? Sono tante le avvisaglie che i motori di ricerca leader al mondo stanno già lavorando su questo tema e non è quindi improbabile che già adesso buona parte delle SERP siano influenzate da parametri che sino a poco tempo fa non erano nemmeno presi in considerazione . Abbiamo infatti già detto che i contenuti (e quindi: i fattori on-page ) sono e saranno un fattore sempre più importante per ottimizzare un sito web. Non basta quindi aggiornare i contenuti costantemente (come spesso leggiamo in articoli on-line od off-line ) e non è nemmeno sufficiente utilizzare i feed rss o i blog per rendere più ‘attraente' un sito agli ‘occhi' di un motore di ricerca (per quanto, come abbiamo visto, questo sia caldamente consigliabile). Non è nostra intenzione analizzare qui quali possono essere le modalità che permetteranno a un motore di ricerca di superare la fase ‘lessicale ‘ (le parole contenute in una pagina web) per passare a quella semantica (dove contanto gli ‘argomenti' e i ‘contesti'); probabilmente verranno utilizzate tecniche di LSI ( Latent Semantic Indexing ) e LSA ( Latent Semantic Analysis ) o, senza essere così specifici, tecniche di IR (Information Retrieval), quello che più ci importa è quello di capire come è possibile sfruttare questo nuovo trend dei motori di ricerca , preparandosi magari prima che effettivamente diventi operativo (pare che Google e Msn Search siano i motori
Chi usa Internet usa i motori di ricerca; i dati internazionali parlano di circa un 95%, ma è probabile che siano stime per difetto , è, infatti, inimmaginabile navigare il Web senza usare (anche ‘accidentalmente') un motore di ricerca. Lo stesso non si può dire di tutti gli altri ‘tipi' di siti; i portali, i market place, gli e-mall, le pagine bianche, gialle e via dicendo. I motori di ricerca sono il ‘cuore' del web , perché chi naviga lo fa per cercare (prima di comprare o prima di non comprare, prima di sapere o di non sapere) e il modo più semplice per trovare ciò che ci importa è (attualmente) quello di usare un motore di ricerca. Allo stesso tempo, i motori di ricerca sono anche il ‘cuore economico' di Internet perché i motori di ricerca sono stati riconosciuti, ormai da molti anni, come lo strumento più efficace ed economico (anche se non l'unico) per trovare nuovi clienti , per fidelizzare i vecchi e per recuperare quelli che si sono persi per strada. Purtroppo, il successo e l'affermazione dei motori di ricerca nel Web non sono stati seguiti da una rapida evoluzione dei meccanismi e dell'efficacia. Detto in poche parole, i motori di ricerca non hanno seguito lo sviluppo del Web o, per meglio dire, non hanno mantenuto le promesse (implicite) del passato, un ritardo veramente straordinario se pensiamo che la web industry è molto più dinamica (quindi veloce) della industria classica del software e che i motori di ricerca ne rappresentano la punta
In questa lezione cercheremo allora di analizzare l'utilità e l'efficacia dei blog come strumenti di indicizzazione piuttosto, non concentrandoci tanto sul loro fenomeno ‘sociale' e ‘giornalistico', quanto piuttosto cercando di mostrare il perché i blog siano indicizzati molto bene nei motori di ricerca. A nostro parere i motivi sono molti, ma possiamo riassumerli in questi: 1) Per prima cosa, i blog sono ‘pieni di contenuti' ; ai motori di ricerca ‘piacciono' i contenuti. 2) In secondo luogo, i blog sono (nella maggior parte dei casi) aggiornati spessissimo (di solito, quotidianamente) e i motori di ricerca ‘apprezzano' molto i siti aggiornati in quanto gli consentono di aggiornare a loro volta le proprie pagine. 3) I blog sono linkati da altri blog , o comunque da altri siti (secondo la pratica molto diffusa dei ‘ blogroll' ) 4) Questi link sono tutti ‘naturali' , nel senso che seguono un processo di crescita naturale, che contengono nomi dei link generalmente differenti e che provengono da siti ospitati su server differenti, appartenenti a diversi proprietari etc (secondo le indicazioni che abbiamo dato in merito all' artificial linking in una precedente lezione). La maggior parte delle piattaforme che ospitano blog permette infatti a qualsiasi utente di inserire i propri commenti e di partecipare attivamente all'attività editoriale del blog stesso; i blog quindi consentono quell'interazione che è invece totalmente assente dai classici portali (verticali o generalisti) dove la fruizione dei contenuti del sito avviene in maniera pressochè identica a quella di qualsiasi mass medium tradizionale. Questa breve analisi significa dunque due
C'è un altro fattore da valutare quando si cerca di attribuire un ‘valore' a uno o più link in entrata. Se la compravendita di link è un fenomeno ‘dannoso' per la ‘purezza' degli algoritmi di Google, altrettanto può dirsi per il fenomeno dell'artificial linking, ovverosia della creazione e pubblicazione di siti che linkano a un ‘destination site'. Questa pratica è molto diffusa, ma i SEO che la applicano si sono già resi conto che non è affatto efficace e per un semplice motivo: è difficile far sì che questi siti linkanti abbiano pagine con un pagerank superiore a 2 e questo per ovvi motivi; perché abbiano un pagerank superiore bisognerebbe farli linkare da siti esterni e quindi il problema si riverbera all'infinito in un circolo vizioso. C'è però da dire che, al contrario di quello che si sentiva dire qualche tempo fa, non c'è rischio che questi link ‘artificiali' danneggino il pagerank o comunque il posizionamento delle pagine linkate e questo per un semplice motivo; potrebbe accadere che un concorrente linki un sito con dei siti ‘artificiali' solo per danneggiarlo. Per evitare questo, Google (e – presumibilmente – anche gli altri motori di ricerca) fa solo un calcolo ‘positivo' dei link: un link ‘positivo' aggiunge valore, un link ‘negativo' non ne sottrae. All'interno di questa strategia 'autocratica' di linkaggio ci possono essere due 'tattiche'; la prima quantitativa e la seconda qualitativa. Nell'ipotesi quantitativa, il SEO è interessato a creare un grande numero di siti che linkino al mother-site (o destination-site ), non preoccupandosi del loro
Da qualche tempo a questa parte si sente parlare di over-optimization in relazione a pratiche di SEO. Inutile dire che questo concetto è legato per lo più a Google, che - nonostante gli sforzi profusi negli ultimi mesi/anni da MSN e Yahoo - è a tutt'oggi la più grande 'fonte' di visite per qualsiasi sito web che abbia un traffico 'engined'. Prima di capire se effettivamente esista questa over-optimization, vediamo di chiarirne il concetto. Come dice la parola stessa, l'over-optimization è una 'eccessiva' ottimizzazione; per ottimizzazione intendiamo quell'attività volta a migliorare l'esperienza di navigazione dell'utente e allo stesso tempo l'attività di spidering e di indicizzazione dei motori di ricerca. E' bene subito chiarire che per ottimizzazione si debbono intendere quelle attività "white hat", ovverosia consentite, e non quelle "black hat", ovverosia di vero spamdexing . Attività tipicamente di spamdexing sono – come abbiamo già ricordato in una precedente lezione - l'utilizzo di font dello stesso colore del background, utilizzo di font troppo piccoli per essere letti da un navigatore etc. In questo articolo presupponiamo che le attività di "white" optimization siano conosciute e le citeremo solo come esempi nell'analisi della possibilità della suddetta over-optimization. La nostra teoria è che di fatto non si possa mai parlare di over-optimization , quanto piuttosto di bad optimization , ovverosia di utilizzo scorretto degli strumenti che normalmente migliorano il posizionamento di un sito nelle SERPs ( Search Engine Result Pages ). Partiamo da un dato di fatto: molti siti che sino a poco tempo prima erano presenti e ben
Come abbiamo visto , la link popularity di una pagine è strettamente legata al suo pagerank , quindi è fondamentale fare di tutto per aumentarla (in maniera sapiente e ragionata e progressiva). Ricordiamo che la link popularity misura quanti sono i link esterni che puntano a una pagina in questione (non al sito tutto). E' ovvio che non conta tanto (o soltanto) il numero di link che puntano al sito quanto piuttosto la loro qualità. Essere linkati dalle directory di Dmoz, di Virgilio e di Yahoo e certamente importantissimo per un qualsiasi sito e si può trasformare in una grand link popularity e anche in un aumento di pagerank. Il modo migliore per aumentare la link popularity di un sito non è certo quello di ‘comprare' dei link da altri siti (anche se rimane sempre una possibilità) e questo per diversi motivi, così come non è quello di costruire network di link artificiali (come abbiamo visto nella scorsa lezione). 1) In primo luogo, difficilmente chi vende link ha una gestione seria del proprio business online (ci sono ovviamente le eccezioni), dal momento che cerca di avere dei ricavi con un sistema che è trasversale e quindi sicuramente non attinente con il proprio business (spesso del tutto assente); essendo quindi il business assente è difficile che questo sito possa avere una vera forza e una vera importanza agli occhi dei motori di ricerca. 2) In secondo luogo, è difficile che il pricing sia corretto . Un pricing corretto presuppone un mercato aperto e libero e soprattutto
C'è un altro fattore da valutare quando si cerca di attribuire un ‘valore' a uno o più link in entrata. Se la compravendita di link è un fenomeno ‘dannoso' per la ‘purezza' degli algoritmi di Google, altrettanto può dirsi per il fenomeno dell'artificial linking, ovverosia della creazione e pubblicazione di siti che linkano a un ‘destination site'. Questa pratica è molto diffusa, ma i SEO che la applicano si sono già resi conto che non è affatto efficace e per un semplice motivo: è difficile far sì che questi siti linkanti abbiano pagine con un pagerank superiore a 2 e questo per ovvi motivi; perché abbiano un pagerank superiore bisognerebbe farli linkare da siti esterni e quindi il problema si riverbera all'infinito in un circolo vizioso. C'è però da dire che, al contrario di quello che si sentiva dire qualche tempo fa, non c'è rischio che questi link ‘artificiali' danneggino il pagerank o comunque il posizionamento delle pagine linkate e questo per un semplice motivo; potrebbe accadere che un concorrente linki un sito con dei siti ‘artificiali' solo per danneggiarlo. Per evitare questo, Google (e – presumibilmente – anche gli altri motori di ricerca) fa solo un calcolo ‘positivo' dei link: un link ‘positivo' aggiunge valore, un link ‘negativo' non ne sottrae. All'interno di questa strategia 'autocratica' di linkaggio ci possono essere due 'tattiche'; la prima quantitativa e la seconda qualitativa. Nell'ipotesi quantitativa, il SEO è interessato a creare un grande numero di siti che linkino al mother-site (o destination-site ), non preoccupandosi del loro
Il funzionamento del Sand-Box è molto semplice ; un sito che viene pubblicato oggi, con tanti link in entrata (inbound link), con una buona qualità di tali link (page rank dei siti linkanti), con tanto contenuto di testo, con gli URL contenenti keyword 'popolari' all'interno della pagina, ecc, insomma, un sito con tutte 'le carte in regola', non sarà posizionato per alcuni mesi. Questo filtro dovrebbe persuadere i webmaster ad evitare pratiche 'artificiali' perché a fronte, per esempio, dell'acquisto di vari link in entrata (e quindi a fronte di una spesa immediata) non vi sarebbero ritorni se non dopo mesi; pare che la durata della permanenza del sito nel Sand-Box possa variare da un mese a sei mesi; le variabili in gioco sono molte. Premesso che questo 'filtro' sembra si applichi solo a questi siti che sono stati pubblicati dopo il mese di marzo del 2004, possiamo dire che più il settore è competitivo, più le keyword sono popolari, più sarà lunga la permanenza nel Sand-Box. Diciamo che la durata media sembra essere di tre mesi, ma non è detto che essa non duri di più per alcune keyword (le più competitive). A chi si chiedesse quali siano i modi per accelerare l'uscita da questa Sand-Box (posto che ci si sia entrati), possiamo consigliare alcune procedure: in primis, non pensarci e agire come se Google non esistesse affatto, continuare ad aggiungere contenuti alle pagine e soprattutto continuare ad aggiungere link in entrata, possibilmente nella maniera più 'naturale' possibile, ovverosia non dieci link in un giorno
L'importanza del nome dei link in uscita Facciamo un esempio: poniamo di gestire un sito di abbigliamento e poniamo che un sito ci linki da una pagina, con il nome “cravatte in seta”; il nostro sito sarà avvantaggiato nel posizionamento quando qualcuno cercherà “cravatte in seta” o “cravatte”, ma non quando cercherà “accessori abbigliamento”, per quanto tutti sanno che le cravatte sono accessori di abbigliamento. Al contrario di quanto si potrebbe pensare, i motori di ricerca sono molto ‘conservatori' ; in sostanza, anche se non intenzionalmente, hanno riproposto le logiche dell'economia e della società ‘off-line'. I motivi per cui possiamo fare quest'affermazione sono molti; uno di questi è l' “ aging ” dei link; se il vostro sito è linkato da una pagina con PR=5, possiamo dire che non tutto il ‘potere' di questo link è passato alla pagina linkata immediatamente; il link assume un valore sempre più grande quanto più passa il tempo. Questo è motivato da ragioni ‘interne' e da ragioni ‘esterne'. Fra le ragioni ‘interne' c'è una considerazione facilmente condivisibile; alcuni link possono avere una vita di pochi giorni se non addirittura di poche ore ; tipici sono i casi di news o di giornali online; in questi casi il link in uscita ha una vita breve e quindi è comprensibile che la loro ‘influenza' sia minore di un link ‘strutturale', che prevede un rapporto duraturo fra due siti . Ma c'è un altro motivo per cui il pagerank non ‘passa' da una pagina all'altra immediatamente. Nell'ultimo anno si sono enormemente diffusi
Abbiamo detto che non tutti i link hanno lo stesso peso; ma che cosa ne determina il peso? I fattori, come sempre quando parliamo di algoritmi di motori di ricerca, sono molteplici. 1) pagerank del sito linkante 2) diluizione del pagerank proporzionato ai link in uscita ( outbound link ) dal sito linkante 3) attinenza dei contenuti del sito linkante con i contenuti del sito linkato 4) nome del link Il primo punto è chiaramente di grande importanza; un inbound link di un sito acquista importanza in ragione del pagerank della pagina da cui proviene; se il sito linkante ha PR=0, possiamo stare certi che non avrà alcun influsso positivo sul posizionamento del sito linkato; se invece il sito ha un pagerank alto, è probabile che il suo influsso sarà importante; diciamo “probabile” semplicemente perché il pagerank di un sito può essere ‘diluito' dalla contemporanea presenza di altri link in uscita. Per semplificare le cose, potremmo dire che una pagina a PR=5 che conta 5 link in uscita (da non confondere con gli internal links ) distribuisce per ogni link il valore di 5/5, quindi di 1. L'esempio non è molto corretto perché potrebbe sembrare che essere linkati da un sito che ha PR=1 e un solo link in uscita sia la stessa cosa che essere linkati a una pagina a PR=5 e 5 link in uscita. Non è affatto così; una pagina a PR=1 è completamente ininfluente, mentre una pagina a PR=5 (anche se conta decine di link) dà un grosso contributo al miglioramento

Next Page »