Home » Focus del mese

Una migliore ricerca per il sito della Commissione europea.

6 Agosto 2003 Commenta

Il sito web del Cordis – Centro Informazioni Ricerca e Sviluppo della Commissione europea ha di recente implementato e messo a disposizione dei navigatori un nuovo strumento di ricerca che consente di trovare piu’ agevolmente le informazioni desiderate, ricercando tra piu’ di 40.000 pagine web, 9 database e centinaia di documenti. La ricerca puo’ essere condotta in modalita’ semplice o avanzata e puo’ essere impostata per tipo di informazione (news, eventi, progetti, partners). L’esito della ricerca e’ costituito da una lista di risultati ordinata per data o per importanza e in piu’ un abstract introduttivo di ogni documento ottenuto permettera’ una piu’ veloce individuazione dei dati desiderati.

Anche il sito web del Cordis si e’ quindi adeguato alle nuove esigenze degli utenti della Rete che su Internet trovano sempre numerose difficolta’ durante la fase di ricerca di documenti, contenuti in banche dati, che invece dovrebbe essere semplice ed immediata.
In effetti, l’affermarsi e il diffondersi dell’utilizzo di reti telematiche, in particolare di Internet, porta un elemento nuovo e per molti aspetti rivoluzionario. L’accesso all’informazione avviene, in questa prospettiva reticolare, in modo diffuso; l’utente e’ per cosi’ dire immerso in una massa di dati ricca ma disordinata che spazia da un polo all’altro del globo terrestre.
L’ovvia conseguenza di questa nuova dimensione e’ la prevalenza di un tipo di ragionamento associativo rispetto a quello deduttivo, al quale siamo culturalmente piu’ abituati. La modalita’ ipertestuale, che sta alla base di Internet, e’ la manifestazione piu’ evidente di questo processo mentale.
Alla visione di banche dati centralizzate, che pure hanno indiscussi vantaggi, si va affiancando la visione piu’ ampia di una informazione distribuita, dislocata cioe’ in piu’ punti della Rete.
I vantaggi e gli svantaggi delle due soluzioni sono in realta’ per cosi’ dire speculari. Le principali caratteristiche degli archivi centralizzati sono rappresentate da informazioni strutturate, sistemi di reperimento omogenei e piu’ sofisticati, registrazione uniforme dei dati. Nel sistema ad informazione diffusa mancano gli elementi sopra descritti con evidenti riflessi negativi ma sono presenti altri vantaggi quali, innanzi tutto, la ricchezza di informazione, l’ampiezza della diffusione, la responsabilita’ dei dati (l’informazione risiede dove nasce), la possibilita’ di aggiornamento tempestivo, l’agilita’ nella creazione degli archivi. In sintesi, gli aspetti positivi degli archivi centralizzati costituiscono gli aspetti problematici degli archivi diffusi e viceversa.

Resta pero’ il fatto che ormai la soluzione tradizionale (centralizzata) e’ per molti aspetti ormai superata e di fatto impossibile: e’ impensabile, ad esempio, che presso un sistema informativo si raccolga tutta la normativa italiana sia a carattere nazionale che a carattere locale (regionale, provinciale, comunale, ecc.), per l’impossibilita’ pratica (piu’ che tecnica) di gestire una mole di dati di questa portata, mentre appare ragionevolmente realizzabile l’ipotesi che ogni realta’ territoriale ( cosi’ come accade spesso su Internet) renda disponibile, senza eccessivo sforzo, la propria produzione normativa.
Cio’ non ci esime dal constatare che l’informatica giuridica con le sue banche ordinate ha prodotto notevoli benefici mentre il regno di Internet si presenta come un mondo di anarchia, dove ciascuno mette in linea ogni tipo di materiale nelle forme piu’ diverse: elenchi, banche dati, testo integrale, riferimenti. Il panorama e’ talmente vasto ed eterogeneo da rendere particolarmente difficile il reperimento delle informazioni ricercate.
Nasce, quindi, l’esigenza, allo scopo di sfruttare al meglio le potenzialita’ di una rete telematica come Internet di ricorrere a strumenti, come guide, motori di ricerca specifici, intelligent agent che consentano all’utente di orientarsi e ottenere delle informazioni pertinenti, ristabilendo un ordine fra il disordine. Ma affinche’ tali strumenti possano essere efficienti e’ necessario che siano coordinati fra di loro: l’elemento indispensabile che sta alla base di questa nuova filosofia e’ infatti proprio quello della cooperazione che non significa solo comunicarsi dati, ma significa, in prospettiva, concordare strategie, uniformare certi canoni di base (per esempio rendere omogenee le citazioni) in modo da evitare per quanto possibile la dispersivita’ che puo’ divenire fonte di disinformazione.
L’esigenza di disporre di strumenti di aiuto alla ricerca, almeno a livello generale, e’ stata avvertita fin dall’inizio, tant’e’ vero che esistono in Rete guide, intelligent agent e motori di ricerca.


Le guide sono di tipo eterogeneo; nella maggior parte dei casi sono raccolte di link organizzati per materie o su singoli argomenti oppure elenchi di siti di un determinato tipo (per esempio, in ambito giuridico amministrativo gli indirizzi di tutti i ministeri o delle piu’ importanti reti civiche), talvolta accompagnati da note di commento o illustrative.
Gli intelligent agent sono invece programmi che filtrano le informazioni in base ad un interesse particolare dell’utente, memorizzandone le scelte e costruendone la domanda. Oggi sono considerati il futuro della ricerca di informazioni su Internet e costituiscono quindi oggetto di studio da parte di molti produttori di software anche se allo stato attuale sono ancora una chimera.

I motori di ricerca (ad es. AltaVista, Excite, HotBot, Infoseek, Lycos, Northern Light) accedono ai siti Web utilizzando particolari software denominati crawler o spider, che scaricano il contenuto delle pagine Web; tali pagine in seguito indicizzate in locale, andranno a costituire, insieme ai loro URL, il database del motore di ricerca. La formazione degli indici dei motori di ricerca avviene grazie ad indicizzatori che, sebbene possano essere dotati delle piu’ avanzate tecnologie probabilistiche di analisi testuale per l’estrazione delle parole chiave, non possono fornire risultati qualitativamente comparabili ad un’analoga attivita’ umana.
L’operazione di download di tutte le pagine di un Web server (effettuata frequentemente al fine di mantenere aggiornato il database) comporta un oneroso aumento del traffico della rete: per ovviare a tale problema sono stati proposti sistemi che indicizzano in locale presso ogni web server il contenuto e che inviano al motore di ricerca (o a un sistema intermedio) solo tale indice, di dimensioni notevolmente inferiori rispetto all’intero contenuto del web server.
L’utente, dal suo canto, interroga il database compilando stringhe di ricerca frutto della combinazione di termini con operatori booleani o posizionali. I risultati delle sessioni di ricerca, anche se effettuate in base a stringhe complesse ed articolate, si presentano a volte di scarsa utilita’, per i seguenti motivi:
– rumore, “amplificato” dalla mole di documenti di natura eterogenea presenti in Internet;
– silenzio, causato dalla mancanza di una categorizzazione dell’informazione;
– attualita’ dei riferimenti trovati, cioe’ effettiva esistenza del nodo di destinazione.
Ogni motore ha caratteristiche particolari che lo rendono differente dagli altri come la facilita’ d’uso, la tempestivita’ di aggiornamento, la potenza elaborativa, il tipo di informazioni contenute. Nonostante le perplessita’ manifestate prima, i motori di ricerca rimangono lo strumento piu’ utile di reperimento di informazioni, soprattutto se l’utente, che in questo approccio svolge una funzione importante, imposta la ricerca in modo efficiente e corretto.
Nel settore giuridico, pero’, la ricerca dell’informazione presenta maggiori complessita’, in quanto a differenza di Internet, nell’ambito di una banca dati giuridica siamo in presenza di dati strutturati, sia grazie all’unitarieta’ del contenuto, sia grazie all’opera di catalogazione e indicizzazione effettuata da operatori specializzati.
L’efficienza della ricerca, quindi, e’ data da diversi fattori quali: ambito circoscritto, omogeneita’ dei materiali, possibilita’ di combinare diverse metodologie di ricerca, possibilita’ di effettuare ricerche per codici identificativi numerici. Tutti questi fattori non esistono in Internet.

In Italia e’ stato fatto un tentativo, peraltro ben riuscito, di motore di ricerca dedicato al reperimento di informazioni giuridiche come “Cicerone”, ma tale motore non agisce in modo autonomo (cioe’ su un proprio indice) ma su indici costruiti da altri motori e a questi indirizza la stringa di ricerca opportunamente adattata, raccogliendone poi i risultati; si comporta in altre parole come un intermediario tra gli utenti e i veri motori di ricerca.
Per eliminare gli inconvenienti dei classici motori di ricerca sono stati sviluppati dei metamotori di ricerca, che si presentano all’utente come pagine Web in cui occorre inserire un’unica stringa di ricerca e indicare quali motori di ricerca consultare. Il metamotore si occupera’ di inviare contemporaneamente la query ai vari motori selezionati, adattando la sintassi della query a quelle richieste dai singoli motori: la ricerca sara’ effettuata quindi in parallelo, i risultati saranno poi presentati insieme, dopo aver eliminato le ridondanze.
Sulla base dello stesso principio che ispira i metamotori sono stati creati i cd. metadata che possono rivelarsi particolarmente utili per il reperimento di informazioni giuridiche in reti distribuite come appunto Internet. I metadata possono essere utili in quanto possono fornire all’utente un metodo piu’ affidabile delle attuali ricerche di tipo full text o tramite meri soggettari.
Il concetto di metadata non e’ affatto nuovo, ne e’ prova la millenaria attivita’ dei bibliotecari: una scheda bibliotecaria non e’ altro che un esempio d’uso dei metadata, per scoprire in primo luogo se esistono informazioni circa un determinato argomento e, successivamente, per reperire i volumi collocati negli scaffali indicati nelle schede.
La possibilita’ di reperire informazioni rilevanti in Internet “sembra” decrescere proporzionalmente alla quantita’ di informazioni disponibili: per risolvere tale problema e’ emersa recentemente la proposta di “arricchire” i materiali pubblicati in Internet affiancando loro una descrizione mediante “informazioni concernenti altre informazioni”: i metadata appunto. Risulterebbe cosi’ possibile descrivere la natura di una risorsa Internet: la sua ubicazione, l’oggetto di cui tratta, il formato con cui tale oggetto e’ presentato, ecc. Un’adozione estesa dei metadata nella descrizione-catalogazione delle risorse Internet faciliterebbe inoltre il reperimento delle informazioni e in casi particolari anche una loro valutazione qualitativa.

Una valida e corretta applicazione dei metadata purtroppo e’ ancora difficile a causa dell’esistenza di tutta una serie di problemi da superare quali: l’individuazione delle informazioni oggetto dei metadata, la produzione dei metadata che necessita dell’attivita’ ermeneutica umana, la creazione di uno standard che permetta di processare metadata strutturalmente e contenutisticamente differenti.

Scritto da

Commenta!

Aggiungi qui sotto il tuo commento. E' possibile iscriversi al feed rss dei commenti.

Sono permessi i seguenti tags:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Home » Internet & Tecnologia

Una Migliore Ricerca Per Il Sito Della Commissione Europea

4 Agosto 2003 Commenta

BRUXELLES. Il sito web del Cordis – Centro Informazioni Ricerca e Sviluppodella Commissione europea (http://ica.cordis.lu/services) ha di recenteimplementato e messo a disposizione dei navigatori un nuovo strumento diricerca che consente di trovare piu’ agevolmente le informazioni desiderate,ricercando tra piu’ di 40.000 pagine web, 9 database e centinaia didocumenti. La ricerca puo’ essere condotta in modalita’ semplice o avanzatae puo’ essere impostata per tipo di informazione (news, eventi, progetti,partners). L’esito della ricerca e’ costituito da una lista di risultatiordinata per data o per importanza e in piu’ un abstract introduttivo diogni documento ottenuto permettera’ una piu’ veloce individuazione dei datidesiderati.Anche il sito web del Cordis si e’ quindi adeguato alle nuove esigenze degliutenti della Rete che su Internet trovano sempre numerose difficolta’durante la fase di ricerca di documenti, contenuti in banche dati, cheinvece dovrebbe essere semplice ed immediata.In effetti, l’affermarsi e il diffondersi dell’utilizzo di reti telematiche,in particolare di Internet, porta un elemento nuovo e per molti aspettirivoluzionario. L’accesso all’informazione avviene, in questa prospettivareticolare, in modo diffuso; l’utente e’ per cosi’ dire immerso in una massadi dati ricca ma disordinata che spazia da un polo all’altro del globoterrestre.L’ovvia conseguenza di questa nuova dimensione e’ la prevalenza di un tipodi ragionamento associativo rispetto a quello deduttivo, al quale siamoculturalmente piu’ abituati. La modalita’ ipertestuale, che sta alla base diInternet, e’ la manifestazione piu’ evidente di questo processo mentale.Alla visione di banche dati centralizzate, che pure hanno indiscussivantaggi, si va affiancando la visione piu’ ampia di una informazionedistribuita, dislocata cioe’ in piu’ punti della Rete.I vantaggi e gli svantaggi delle due soluzioni sono in realta’ per cosi’dire speculari. Le principali caratteristiche degli archivi centralizzatisono rappresentate da informazioni strutturate, sistemi di reperimentoomogenei e piu’ sofisticati, registrazione uniforme dei dati. Nel sistema adinformazione diffusa mancano gli elementi sopra descritti con evidentiriflessi negativi ma sono presenti altri vantaggi quali, innanzi tutto, laricchezza di informazione, l’ampiezza della diffusione, la responsabilita’dei dati (l’informazione risiede dove nasce), la possibilita’ diaggiornamento tempestivo, l’agilita’ nella creazione degli archivi.Cio’ non ci esime dal constatare che l’informatica giuridica con le suebanche ordinate ha prodotto notevoli benefici mentre il regno di Internet sipresenta come un mondo di anarchia, dove ciascuno mette in linea ogni tipodi materiale nelle forme piu’ diverse: elenchi, banche dati, testointegrale, riferimenti. Il panorama e’ talmente vasto ed eterogeneo darendere particolarmente difficile il reperimento delle informazioniricercate.Nasce, quindi, l’esigenza, allo scopo di sfruttare al meglio le potenzialita’ di una rete telematica come Internet di ricorrere a strumenti, come guide,motori di ricerca specifici, intelligent agent che consentano all’utente diorientarsi e ottenere delle informazioni pertinenti, ristabilendo un ordinefra il disordine.]]>

Scritto da

Commenta!

Aggiungi qui sotto il tuo commento. E' possibile iscriversi al feed rss dei commenti.

Sono permessi i seguenti tags:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>