Home » Focus del mese

Accessibilita’ telematica e XPath: Il linguaggio Xml si evolve.

28 Maggio 2003 Commenta

E’ stata presentata un’importante novita’ per la gestione documentale sul web. Si chiama XPath ed e’ un metalinguaggio che offre la possibilita’ di contrassegnare le parti rilevanti di un documento Xml. Tra le novita’ anche XQuery, che definisce i modi per ricercare documenti Xml e XSlt che si occupa di tradurre documenti scritti in linguaggi Xml differenti e tutta una serie di loro sottoinsiemi. Novita’ anche per XQuery 1.0 e XPath 2.0 Formal Semantics. Quest’ ultima stabilisce le modalita’ con cui possono essere attribuiti significati precisi al contenuto del Data Model condiviso da XQuery e da XPath. 


L’avvento di Internet ha sconvolto le tradizionali metodologie di trattamento documentario. Con la rete e’ cambiato il concetto di sistema informativo, passato da una dimensione locale ad una globale, e si e’ anche allargato il significato di informazione, non piu’ intesa come equivalente al documento, ma, grazie agli ipertesti, comprensiva di una soggettiva concatenazione di concetti.
Con la Rete la tecnologia dell’informazione si trova a fronteggiare problemi diversi; il punto cruciale non e’ piu’ la raccolta ed organizzazione delle fonti, quanto l’accesso mirato a quelle rilevanti; spesso l’informazione a disposizione e’ troppa, confusa, non attendibile, disordinata, non strutturata.
In tale contesto assumono notevole rilevanza i nuovi settori di ricerca dell’Intelligenza Artificiale che tengono conto sia della necessita’ di mantenere riferimento diretto alle fonti della documentazione, sia di raggiungere metodi di rappresentazione della conoscenza piu’ efficaci e immediati.
I campi di sviluppo piu’ recenti (data mining, document understanding, redazione assistita), sono accomunati da una nuova metodologia di trattamento delle informazioni: il documento viene descritto nel data base applicando un modello piu’ ricco di quelli delle banche dati tradizionali, ma senza arrivare all’onerosa operazione di formalizzare tutto il contenuto. Nelle nuove basi di dati strutturate gli elementi rilevanti vengono esplicitati secondo criteri dipendenti dagli scopi (informazione, diagnosi, classificazione, funzione normativa.), sino ai sistemi di redazione assistita in cui il modello precede il documento, anzi costituisce lo schema vuoto da cui verra’ prodotto il documento digitale (TISCORNIA).
Indubbiamente il linguaggio XML (extensible markup language) risulta particolarmente efficace in questo settore. Difatti tale linguaggio di marcatura, gia’ suggerito in passato, offre la possibilita’ di definire strutture per classi omogenee di documenti e si sta, quindi, progressivamente affermando come standard nell’ambito della rete Internet.

L’Xml consente di specificare vincoli di correttezza strutturale su una classe di documenti attraverso un formalismo di definizione di regole, denominato document type definition (DTD): ogni insieme di documenti che presenta caratteristiche uniformi puo’ essere descritto con uno specifico DTD.
In altri termini al DTD si fa ricorso per definire una metodologia di marcatura: per ogni tipologia di documenti si descrivono diverse componenti, e si da’ un nome ad ogni componente, che puo’ a sua volta essere ulteriormente scomposta in piu’ sottoparti.
Ad esempio componenti di una sentenza potrebbero essere: l’intestazione, l’autorita’, il collegio, le parti, l’oggetto, l’esposizione dei fatti, la motivazione, la decisione, la sottoscrizione. 
Tale metodologia propria dei sistemi per la redazione assistita (programmi che, diversamente dai tradizionali word processing, consentono di aggregare ai documenti le informazioni sul contenuto) si fonda sulla distinzione fra tipi o classi di documenti e documenti/istanza, ed in parallelo, fra il modello di documento, che e’ un metadocumento, e il documento finale: nel primo c’e’ conoscenza su come il documento deve essere, nel secondo su come effettivamente e’ (TISCORNIA).

Proprio in considerazione di questi aspetti particolarmente interessanti del linguaggio Xml la stessa AIPA con la circolare n. 40 del 22 aprile 2002 che fornisce dei suggerimenti alle amministrazioni pubbliche in merito alle regole da rispettare nell’esercizio dell’attivita’ di drafting (tecniche di redazione dei provvedimenti), ha consigliato, al fine di consentire l’accessibilita’ telematica alle norme, risolvendo tutti i problemi di carattere giuridico e tecnologico, l’utilizzo di tale linguaggio.
Ma l’XPath dovrebbe costituire qualcosa in piu’ e cioe’ un utile supporto all’Xml in quanto in grado di contrassegnare le parti rilevanti di quello che e’ gia’ un linguaggio di marcatura come l’Xml. In altri termini l’XPath dovrebbe di gran lunga facilitare l’utilizzo dell’Xml e specialmente la ricerca dei documenti redatti con questo linguaggio di marcatura.
In effetti, se vogliamo lo stesso Xml e’ un metalinguaggio in quanto serve anch’esso a definire altri linguaggi o applicazioni. Un tool per leggere un documento Xml consta di due parti: il Parser esegue il controllo semantico e gestisce gli errori, mentre il Processor utilizza un altro file in cui e’ definita la formattazione dei vari tag, per visualizzare il documento.

Gia’ da questa dinamica si capisce come la separazione fra struttura e rappresentazione, che come si e’ visto e’ uno degli aspetti chiave della buona costruzione di un ipertesto, sia garantita attraverso la separazione fisica dei dati che governano i due aspetti ed addirittura attraverso la separazione dei linguaggi (la rappresentazione viene infatti gestita dal Xsl).

Indubbiamente creare un linguaggio come XPath non e’ facile, perche’ una valida e corretta applicazione di un metalinguaggio presume superati tutta una serie di problemi   quali: l’individuazione delle informazioni oggetto del metalinguaggio, la creazione di uno standard che permetta di processare un determinato metalinguaggio, la complessa attivita’ ermeneutica che e’ alla base di un metalinguaggio.

Scritto da

Commenta!

Aggiungi qui sotto il tuo commento. E' possibile iscriversi al feed rss dei commenti.

Sono permessi i seguenti tags:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>