Home » Focus del mese

Internet: Nuovi strumenti di ricerca nel web

27 Gennaio 2003 Commenta

La fabbrica di servizi telematici di Cagliari ha realizzato un nuovo metamotore di ricerca intelligente denominato BRAIN (Browsing/Retrieval Advanced Interface).
Il metamotore e’ in grado di rintracciare informazioni sul Web con un linguaggio naturale che riconosce i significati delle parole in modo piu’ preciso.
L’utente interagisce per mezzo di query scritte in italiano che permettono di eseguire ricerche piu’ accurate. BRAIN riconosce i significati comuni, il senso differente tra vocaboli simili o equivalenti e le sfumature.

Cagliari – L’affermarsi e il diffondersi dell’utilizzo di reti telematiche, in particolare di Internet, porta un elemento nuovo e per molti aspetti rivoluzionario.
L’accesso all’informazione avviene, in questa prospettiva reticolare, in modo diffuso; l’utente e’ per cosi’ dire immerso in una massa di dati ricca ma disordinata che spazia da un polo all’altro del globo terrestre.
L’ovvia conseguenza di questa nuova dimensione e’ la prevalenza di un tipo di ragionamento associativo rispetto a quello deduttivo, al quale siamo culturalmente piu’ abituati.
La modalita’ ipertestuale, che sta alla base di Internet, e’ la manifestazione piu’ evidente di questo processo mentale.
Alla visione di banche dati centralizzate, che pure hanno indiscussi vantaggi, si va affiancando la visione piu’ ampia di una informazione distribuita, dislocata cioe’ in piu’ punti della Rete.
Nasce, quindi, l’esigenza, allo scopo di sfruttare al meglio le potenzialita’ di una rete telematica come Internet di ricorrere a strumenti, come guide, motori di ricerca specifici, intelligent agent che consentano all’utente di orientarsi e ottenere delle informazioni pertinenti, ristabilendo un ordine fra il disordine.
Ma affinche’ tali strumenti possano essere efficienti e’ necessario che siano coordinati fra di loro: l’elemento indispensabile che sta alla base di questa nuova filosofia e’ infatti proprio quello della cooperazione che non significa solo comunicarsi dati, ma significa, in prospettiva, concordare strategie, uniformare certi canoni di base (per esempio rendere omogenee le citazioni) in modo da evitare per quanto possibile la dispersivita’ che puo’ divenire fonte di disinformazione.

L’esigenza di disporre di strumenti di aiuto alla ricerca, almeno a livello generale, e’ stata avvertita fin dall’inizio, tant’e’ vero che esistono in Rete guide, intelligent agent e motori di ricerca.

Le guide sono di tipo eterogeneo; nella maggior parte dei casi sono raccolte di link organizzati per materie o su singoli argomenti oppure elenchi di siti di un determinato tipo (per esempio, in ambito giuridico amministrativo gli indirizzi di tutti i ministeri o delle piu’ importanti reti civiche), talvolta accompagnati da note di commento o illustrative.

Gli intelligent agent sono invece programmi che filtrano le informazioni in base ad un interesse particolare dell’utente, memorizzandone le scelte e costruendone la domanda.
Oggi sono considerati il futuro della ricerca di informazioni su Internet e costituiscono quindi oggetto di studio da parte di molti produttori di software anche se allo stato attuale sono ancora di difficile implementazione.
I motori di ricerca (ad es. AltaVista, Excite, HotBot, Infoseek, Lycos, Northern Light) accedono ai siti Web utilizzando particolari software denominati crawler o spider, che scaricano il contenuto delle pagine Web; tali pagine in seguito indicizzate in locale, andranno a costituire, insieme ai loro URL, il database del motore di ricerca.
La formazione degli indici dei motori di ricerca avviene grazie ad indicizzatori che, sebbene possano essere dotati delle piu’ avanzate tecnologie probabilistiche di analisi testuale per l’estrazione delle parole chiave, non possono fornire risultati qualitativamente comparabili ad un’analoga attivita’ umana.
Ogni motore ha caratteristiche particolari che lo rendono differente dagli altri come la facilita’ d’uso, la tempestivita’ di aggiornamento, la potenza elaborativa, il tipo di informazioni contenute.
In alcuni settori (come quello giuridico), pero’, la ricerca dell’informazione presenta maggiori complessita’, in quanto a differenza di Internet, nell’ambito di una banca dati giuridica siamo in presenza di dati strutturati, sia grazie all’unitarieta’ del contenuto, sia grazie all’opera di catalogazione e indicizzazione effettuata da operatori specializzati.
L’efficienza della ricerca, quindi, e’ data da diversi fattori quali: ambito circoscritto, omogeneita’ dei materiali, possibilita’ di combinare diverse metodologie di ricerca, possibilita’ di effettuare ricerche per codici identificativi numerici.

Poiche’ tutti questi fattori non esistono in Internet una ricerca effettuata con i tradizionali motori presenti in rete sarebbe poco efficace per cui sono stati sviluppati dei metamotori di ricerca, come nel caso di BRAIN, che si presentano all’utente come pagine Web in cui occorre inserire un’unica stringa di ricerca e indicare quali motori di ricerca consultare.

Il metamotore si occupera’ di inviare contemporaneamente la query ai vari motori selezionati, adattando la sintassi della query a quelle richieste dai singoli motori: la ricerca sara’ effettuata quindi in parallelo, i risultati saranno poi presentati insieme, dopo aver eliminato le ridondanze.
Sulla base dello stesso principio che ispira i metamotori sono stati creati i cd. metadata che possono rivelarsi particolarmente utili per il reperimento di informazioni giuridiche in reti distribuite come appunto Internet.
I metadata possono essere utili in quanto possono fornire all’utente un metodo piu’ affidabile delle attuali ricerche di tipo full text o tramite meri soggettari.
Il concetto di metadata non e’ affatto nuovo, ne e’ prova la millenaria attivita’ dei bibliotecari: una scheda bibliotecaria non e’ altro che un esempio d’uso dei metadata, per scoprire in primo luogo se esistono informazioni circa un determinato argomento e, successivamente, per reperire i volumi collocati negli scaffali indicati nelle schede.

La possibilita’ di reperire informazioni rilevanti in Internet “sembra” decrescere proporzionalmente alla quantita’ di informazioni disponibili: per risolvere tale problema e’ emersa recentemente la proposta di “arricchire” i materiali pubblicati in Internet affiancando loro una descrizione mediante “informazioni concernenti altre informazioni”: i metadata appunto.
Risulterebbe cosi’ possibile descrivere la natura di una risorsa Internet: la sua ubicazione, l’oggetto di cui tratta, il formato con cui tale oggetto e’ presentato, ecc. Un’adozione estesa dei metadata nella descrizione-catalogazione delle risorse Internet faciliterebbe inoltre il reperimento delle informazioni e in casi particolari anche una loro valutazione qualitativa.

Una valida e corretta applicazione dei metadata purtroppo e’ ancora difficile a causa dell’esistenza di tutta una serie di problemi da superare quali: l’individuazione delle informazioni oggetto dei metadata, la produzione dei metadata che necessita dell’attivita’ ermeneutica umana, la creazione di uno standard che permetta di processare metadata strutturalmente e contenutisticamente differenti.

Scritto da

Commenta!

Aggiungi qui sotto il tuo commento. E' possibile iscriversi al feed rss dei commenti.

Sono permessi i seguenti tags:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>