Home » Focus del mese

INTERNET: Così si aggirano i motori di ricerca

18 Dicembre 2002 Commenta

Stavamo cercando con un motore di ricerca la parola “lambrusco” e, fra i risultati, ci siamo imbattuti in un sito web pornografico? Questa e’ una delle conseguenze del cd. Cloaking, cioe’ un trabocchetto che i webmaster utilizzano per risultare primi negli elenchi dei motori di ricerca. Il tutto e’ compiuto a discapito dei tradizionali metodi di “positioning” a pagamento.


Pisa – Quando non si conosce con precisione la URL di un determinato sito web che offre, per es., un certo bene o sevizio, il navigatore si rivolge ai “motori di ricerca”. La tecnologia odierna riesce a fornire risposte con una precisione e una velocita’ mai viste fino a pochi anni fa. Molto spesso, pero’, fra i risultati di questi motori di ricerca si trovano pagine del tutto non coerenti con la nostra stringa di ricerca. Stavamo cercando la parola “lambrusco” e, fra i risultati, ci siamo imbattuti in un sito web pornografico? Niente di strano.
Il webmaster di quello specifico sito ha probabilmente fatto uso di “trucchi” che hanno portato il proprio sito a una visibilita’ enorme, tanto da farlo rientrare in ricerche fatte su argomenti del tutto differenti. Questa prassi e’ molto diffusa in rete e una recentissima indagine ha registrato un aumento del cd. Cloacking, ovvero un trabocchetto che i webmaster utilizzano per risultare primi negli elenchi dei motori di ricerca. Simili tecniche, soprattutto quando coinvolgono parole coperte da brevetto o semplicemente registrate, possono far entrare in gioco i diritti di brevetto e la tutela del copyright. E’ opportuno, quindi, non solo sanzionare questi fenomeni quando danneggiano l’immagine di un determinato prodotto, ma anche conoscere come si possono tecnicamente realizzare questi “trabocchetti”, per poterne impedire la diffusione.


E’ opinione diffusa che i motori di ricerca sono lo strumento principale per attrarre visitatori sul proprio sito. Dalla comparsa sul web di Altavista – uno dei primi motore universali in grado di raggiungere gran parte del web internazionale – di acqua sotto i ponti ne e’ passata parecchia. L’avvento di Google, con i suoi criteri di ranking oggettivi (PageRank) e non influenzabili con le normali tecniche di spamming delle parole, come ad esempio l’utilizzo indiscriminato dei tag meta keywords e description oppure l’inserimento di parole nascoste utilizzando lo stesso colore del sottofondo, ha costretto i webmaster ad aguzzare l’ingegno …

Un ritrovato relativamente recente in fatto di “trucchetti” per innalzare il cosiddetto “positioning” dei siti web consiste nell'”ingannare” gli spider di Google (ma ovviamente anche di altri motori di ricerca) facendo indicizzare loro dei contenuti alterati rispetto a quelli visualizzabili con i normali browser.
Alla base di questa tecnica semplice ma ingegnosa, c’e’ la possibilita’ per un server http di distinguere tra le richieste fatte dai  browser tradizionali e quelle provenienti dagli spider.
L’elemento di distinzione e’ costituito dal cosiddetto “User-Agent”, uno dei campi previsti nell’intestazione delle richieste http, che serve per identificare il tipo di client che effettua la richiesta.
Normalmente, tale campo e’ sempre presente nelle richieste http ed e’ buona norma per uno spider utilizzare un proprio identificativo evitando di spacciarsi per un normale browser. Se si considera inoltre che grazie al tag meta “ROBOTS” contenente “NOARCHIVE”, e’ possibile impedire a Google di memorizzare la copia di cache sui loro server, e’ chiaro che diventa possibile spammare sulle pagine dei siti web qualsiasi parola riservata, protetta da marchio o altro, senza che ci sia la possibilita’ di provare oggettivamente che effettivamente la pagina contiene la parole stesse.
Se oltre allo user-agent viene utilizzato anche l’indirizzo IP degli spider, allora diventa impossibile persino simulare le richieste al fine di provarne l’utilizzo scorreto.
Questa tecnica e’ chiamata in gergo “cloaking” ed e’ nota gia’ da diverso tempo nell’ambiente dei webmaster e delle webagency che si occupano di positioning.
Sebbene sia nota a Google ed ovviamente deprecata in quanto puo’ portare all’esclusione del motore di ricerca, la tecnica del cloaking viene addirittura reclamizzata come metodo per proteggere le “preziose” parole dagli occhi di eventuali concorrenti.
Se consideriamo il fatto che una simile tecnica di promozione aggressiva puo’ generare situazioni davvero ingannevoli, non solo per gli utenti del web, ma anche per le autorita’ e le forze dell’ordine preposte al controllo ed al rispetto della legge sul web, e’ fondamentale che non resti un semplice trucco conosciuto solo dagli “addetti ai lavori” ma che diventi il piu’ possibile di dominio pubblico.

Scritto da

Commenta!

Aggiungi qui sotto il tuo commento. E' possibile iscriversi al feed rss dei commenti.

Sono permessi i seguenti tags:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>