Un’importante e nuova realta’: le biblioteche digitali
L’Istituto di Biblioteconomia e Paleografia dell’Universita’ degli Studi di Parma e la School of Information Studies della University of Northumbria a Newcastle (UK) hanno raggiunto un importante accordo ai fini dell’organizzazione di un master internazionale per formare professionisti della biblioteca digitale. I problemi attinenti all’archiviazione della documentazione on line stanno ormai assumendo una rilevanza predominante ed ormai molte strutture si stanno dotando di biblioteche digitali. L’obiettivo di tali progetti e’ quello di mettere a disposizione di un’utenza potenzialmente illimitata, il proprio patrimonio culturale. In quest’ottica, quindi, cresce l’esigenza di esperti del settore.
Uno degli aspetti fondamentali di una biblioteca digitale e’ sicuramente rappresentato dall’applicazione delle tecniche informatiche di classificazione dei testi che sono:
• parole-chiave;
• riassunti o abstracts;
• thesaurus;
La valutazione della efficacia delle tecniche si fonda su quattro elementi:
– l’efficienza intesa come percentuale delle informazioni pertinenti ritrovate rispetto a quelle effettivamente memorizzate;
– l’utilizzabilita’ cioe’ il rapporto tra l’uso effettivo delle informazioni trovate e il massimo uso possibile del sistema informativo stesso;
– l’accessibilita’ cioe’ il grado di difficolta’ che l’utente incontra nel porre quesiti al sistema informativo;
– la velocita’ operativa cioe’ il tempo che intercorre tra il momento in cui l’utente pone la domanda e il momento in cui riceve la risposta.
La prima tecnica informatica da esaminare e’ quella delle parole-chiave che permette di ottenere, tramite l’elaboratore, indicazioni sull’esistenza di un documento agevolando la individuazione di dati relativi ad uno scritto su una materia determinata.
La tecnica delle parole-chiave, che e’ la piu’ semplice consiste nello sfruttare le informazioni contenute nel titolo del singolo documento chiamate parole-chiave o descrittori che costituiscono il mezzo attraverso cui l’utente raggiunge i documenti che gli interessano; quando l’utente chiede di conoscere tutti i documenti sull’argomento individuato da una certa parola- …
chiave, il programma la ricerca in tutti i documenti memorizzati mettendo a disposizione del richiedente quelli in cui e’ stata trovata; la tecnica in esame, essendo piuttosto approssimativa, puo’ essere fruttuosamente adoperata solo nelle discipline in cui si e’ gia’ affermata la pratica di dare titoli chiari e descrittivi a libri e a saggi.
Un sistema di ricerca fondato su parole-chiave mostra immediatamente un vizio centrale: interi settori di informazioni possono risultare inaccessibili, perche’ codificati sotto una parola-chiave che, in un’epoca successiva, e’ stata sostituita da un’altra. Di qui un gravoso compito supplementare per i responsabili di sistemi informativi di riclassificazione periodica del materiale memorizzato che si aggiunge al lungo lavoro di indicizzazione iniziale.
La seconda tecnica del riassunto o abstract richiede un grande lavoro preliminare, in quanto ogni articolo deve essere riassunto da esperti e dotato di parole-chiave; i riassunti memorizzati possono venire, pero’, stampati periodicamente riunendo in un’unica pubblicazione periodica tutti gli scritti riguardanti una certa materia. Questa tecnica, per molti aspetti notevolmente utile, esaspera tre difficolta’ tipiche dell’indicizzazione:
1. vi e’ arbitrarieta’ nella scelta di cio’ che si omette e di cio’ che si conserva;
2. richiede una smisurata quantita’ di lavoro umano;
3. non si riduce la discutibilita’ del risultato raggiunto, infatti un riassunto fedele non e’ migliore di un buon insieme di parole-chiave, perche’, tanto nel primo quanto nel secondo caso, lo studioso deve sempre risalire al testo originale (LOSANO).
Le difficolta’ di questa tecnica appaiono chiare: un riassunto troppo breve omette una parte delle informazioni contenute nel testo originale, ma un riassunto che non voglia perdere alcuna informazione rispetto al testo originale finisce per riprodurlo integralmente; una volta superate queste difficolta’, il riassunto non e’ ancora memorizzabile in quanto deve essere dotato di parole-chiave con tutti i problemi di questa tecnica visti in precedenza, che si aggiungono a quelli propri di quella del riassunto.
Malgrado i problemi evidenziati la tecnica degli abstracts puo’ essere utilizzata in quei settori dove il tenore letterale del documento non e’ vincolante consentendo, cosi’, una ampia possibilita’ di sintesi in funzione anche dell’individuazione per parole-chiave.
La terza tecnica informatica che viene applicata ai testi e’ il thesaurus.
Quando si usano le parole-chiave, si genera automaticamente anche un thesaurus cioe’ un elenco alfabetico di parole-chiave utilizzate nei vari documenti memorizzati in una determinata banca-dati. Alla costruzione di un thesaurus si fa ricorso soprattutto per la documentazione automatizzata; essa comporta un approfondito esame di contenuti e di forme in rapporto alle esigenze dell’utenza specifica. Il contenuto dipende dalle applicazioni per le quali il thesaurus viene creato; acquistano rilevanza i tipi di descrittori o di parole-chiave, le relazioni strutturali o gerarchiche, quelle semantiche, e tutti i codici previsti o prevedibili per individuare ciascuna unita’ informativa nel sistema documentario; le relazioni strutturali e semantiche vengono diversamente espresse e risolte a seconda del tipo di ricerca impostato, vi sono ipotesi in cui si opera con radicali linguistici; ipotesi in cui si opera con parole-chiave; ipotesi in cui si adottano sistemi misti (CARIDI).
Il thesaurus, fin qui esaminato, e’ chiamato positivo, perche’ contiene tutte le parole-chiave scelte dal documentarista. Tale thesaurus presenta pero’ un grosso inconveniente, costituito dalle sue dimensioni che potrebbero diventare proibitive nel momento in cui si dovesse decidere di memorizzare una documentazione piuttosto vasta. Per risolvere l’inconveniente di cui sopra si e’ pensato di contrapporre al thesaurus positivo il thesaurus negativo che ha dimensioni molto limitate perche’ non contiene tutte le parole-chiave scelte dal documentarista, ma solo un elenco di “parole vuote†che non servono ad individuare l’argomento specifico del documento: in tal modo il programma confronta tutte le parole di ogni documento memorizzato con l’elenco delle parole vuote, mettendo in memoria tutte le parole che non coincidono con quelle vuote, attraverso quest’espediente diventano parole-chiave tutte le parole non contenute nel thesaurus negativo†(LOSANO).
Il vantaggio di questo sistema e’ rappresentato dal fatto che non si ha un intervento manuale nell’attribuzione delle parole-chiave, in quanto automaticamente tutte le parole contenute nel testo e non elencate nel thesaurus negativo diventano parole-chiave.
Scritto da
Commenta!