La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Un thesaurus per organizzare la conoscenza ambientale Fulvio MAZZOCCHI, Paolo PLINI Prima Giornata dellItaliano Istituzionale Commissione Europea (Bruxelles)

Presentazioni simili


Presentazione sul tema: "Un thesaurus per organizzare la conoscenza ambientale Fulvio MAZZOCCHI, Paolo PLINI Prima Giornata dellItaliano Istituzionale Commissione Europea (Bruxelles)"— Transcript della presentazione:

1 Un thesaurus per organizzare la conoscenza ambientale Fulvio MAZZOCCHI, Paolo PLINI Prima Giornata dellItaliano Istituzionale Commissione Europea (Bruxelles) - Mercoledì 23 novembre 2005

2 Definizione funzionale e strutturale di thesaurus In termini di funzione è uno strumento di controllo terminologico usato per tradurre il linguaggio naturale di documenti, indicizzatori e utenti in un linguaggio di sistema più ristretto (linguaggio documentario) [ISO 2788/1974] In termini di struttura è un vocabolario controllato e dinamico di termini correlati gerarchicamente e semanticamente che copre uno specifico campo di conoscenza [ISO 2788/1974] Environmental Knowledge Organisation Laboratory

3 E un dominio esteso ed eterogeneo. Presenta problemi di delimitazione (una delle schematizzazioni più utilizzate è il modello Stato-Pressioni-Risposte, che include anche gli aspetti sociali e politici, le attività produttive, ecc.). Carattere dinamico Nuove problematiche emergono con una certa continuità. Vi è una forte spinta verso lo sviluppo delle conoscenze e soprattutto verso linnovazione tecnologica. Multidisciplinarità La scienza ambientale costituisce un settore complesso e multidisciplinare che interagisce con molti altri settori (p.e., scienze sociali). Il linguaggio speciale dellambiente è in costante evoluzione, mantiene un forte contatto con la lingua comune, è formato da termini che possono essere definiti sulla base di diverse prospettive disciplinari. Il dominio ambiente Environmental Knowledge Organisation Laboratory

4 La realizzazione di un thesaurus che contribuisca a razionalizzare la gestione dellinformazione ambientale. Obiettivi del progetto EARTh proporre uno strumento in grado di garantire, allo stesso tempo, un controllo rigoroso dellorganizzazione concettuale e unampia applicabilità verso diversi ambiti operativi; proporre una mappa semantica e terminologica ben organizzata e aggiornata del dominio ambientale il thesaurus dovrà essere sviluppato tenendo in considerazione la dimensione culturale dellorganizzazione della conoscenza (una versione multilingue, per meglio riflettere le diverse identità culturali e linguistiche, potrà essere composta da strutture, sviluppate nelle singole lingue, tra loro non totalmente coincidenti o simmetriche). Environmental Knowledge Organisation Laboratory

5 EARTh Environmental Applications Reference Thesaurus Struttura sistematica Relazioni semantiche Versioni applicative Contenuto terminologico Environmental Knowledge Organisation Laboratory

6 Struttura sistematica di EARTh: il sistema di categorie La struttura sistematica di EARTh è basata su un sistema di categorie logiche. Le categorie rappresentano il livello più alto della struttura sistematica. Costituiscono i termini più generali a cui sono riconducibili tutti gli altri termini presenti nel thesaurus. Il sistema di categorie di EARTh Entità Entità materiali Entità immateriali Attributi Struttura e morfologia Composizione Proprietà Aspetti dinamici Processi Condizioni Attività Dimensioni Spazio Tempo Environmental Knowledge Organisation Laboratory

7 Modelli categoriali Entità Principi Oggetti immateriali Oggetti materiali Proprietà Quantità Qualità Relazioni Attività Operazioni Stati Processi Dimensioni Tempo Posizione Spazio Lettura delle categorie di Aristotele in base a 4 categorie fondamentali (Ur-categories) secondo Dahlberg Personalità Materia Energia Spazio Tempo Categorie (PMEST) di Ranganathan Entità/Oggetto Tipo Parte Proprietà Materiale Processo Operazione Paziente Prodotto Sottoprodotto Agente Spazio Tempo Categorie del Classification Research Group Environmental Knowledge Organisation Laboratory

8 Struttura sistematica di EARTh: lalbero La struttura sistematica del thesaurus comprende diversi livelli classificatori e gerarchici. Dal punto vista topologico, è un albero (tendenzialmente monogerarchico). Entità Entità materiali Entità non viventi Entità naturali Costituenti fisici e chimici Sostanze chimiche Sostanze organiche Sostanze org. aromatiche Benzene Dalla struttura ad albero di EARTh Environmental Knowledge Organisation Laboratory

9 Caratteristiche della struttura relazionale dei thesauri I thesauri prevedono tre tipi di relazioni paradigmatiche. Ogni relazione aggrega una famiglia di sottotipi che nei thesauri tradizionali non vengono, però, differenziati. Esistono almeno tre tipi di relazione GERARCHICA (relazione generica, relazione partitiva e relazione esemplificativa). La relazione di EQUIVALENZA include sinonimi, quasi-sinonimi e varianti lessicali. Un insieme molto eterogeneo di relazioni viene etichettato come relazione ASSOCIATIVA: it exists when a thematic connection can be established between concepts by virtue of experience (ISO 704). TelerilevamentoGestione della qualità dellaria Eutrofizzazione RT CartografiaRT Qualità dellariaRT Reflui (EnVoc, 1997)(EnVoc, 1997)(EnVoc, 1997) Environmental Knowledge Organisation Laboratory

10 Implementazione della struttura relazionale nei thesauri esistenti In molti thesauri esistenti limplementazione delle relazioni semantiche avviene in modo improprio. Probabilmente, la relazione più abusata è quella gerarchica- generica: molte relazioni classificate come BT/NT sono, infatti, relazioni associative. Riciclaggio Monitoraggio NT Percentuale di riciclaggio NT Tecniche di monitoraggio (GEMET, 1999)(GEMET, 1999) Environmental Knowledge Organisation Laboratory

11 Progetto di rafforzamento della struttura relazionale di EARTh In EARTh è previsto lo sviluppo di una struttura relazionale più articolata rispetto a quella tradizionale. Lipotesi è quella di differenziare in sottotipi le relazioni in base al loro contenuto semantico. Obiettivi: migliorare la funzione di controllo semantico del sistema offrire nuove opportunità ai fini del ricupero dellinformazione migliorare le possibilità di utilizzo del thesaurus mediante tecniche di elaborazione automatica Il thesaurus sarà, comunque, leggibile anche secondo lo schema di relazioni tradizionale. Environmental Knowledge Organisation Laboratory

12 Relazione gerarchica In EARTh, le relazioni generiche, partitive ed esemplificativa saranno tra loro differenziate. Per ciascuna di esse cercheremo, inoltre, di identificare dei sottotipi. Environmental Knowledge Organisation Laboratory

13 Relazione di equivalenza Sinonimi e varianti lessicali saranno tra loro differenziati e verranno, inoltre, indicati per entrambi i sottotipi. La categoria dei quasi-sinonimi probabilmente non verrà, invece, introdotta nel sistema. Environmental Knowledge Organisation Laboratory

14 Relazione associativa Ciò contribuirà a rafforzare la reticolarità del sistema e alla rappresentazione di quelle connessioni concettuali che non possono essere considerate dallalbero tassonomico-gerarchico. Il progetto prevede la valorizzazione ed una più articolata definizione della relazione associativa (suddivisione in sottotipi e esplicitazione del loro contenuto semantico). Environmental Knowledge Organisation Laboratory Ciò è importante per la rappresentazione del dominio ambientale. Il potenziamento della struttura di nessi traversali è importante anche per rendere il thesaurus più utilizzabile ai fini della gestione e della ricerca dellinformazione ambientale su internet (ne viene in parte incorporata lottica di rete).

15 Il modello prevede la possibilità di sviluppare versioni applicative del sistema. La terminologia verrà organizzata in base a criteri classificatori locali ed idonei al contesto operativo. Possono essere sviluppate, p.e., versioni del thesaurus organizzate tematicamente. I gruppi tematici riaggregano termini connessi, ad un determinato settore (la struttura ad albero tende invece a sparpagliare i termini collocandoli sotto la categoria logica di riferimento). In tal modo, potranno anche essere attualizzate, ove necessario dal punto di vista operativo, quelle componenti di significato non considerate dalla struttura ad albero. Versioni applicative di EARTh GRUPPO SUOLO Acidificazione del suolo Acqua nel suolo Acquifero Adsorbimento Chernozem Erosione Gestione del suolo Inquinamento del suolo Pedologia Suolo superficiale Umidità del suolo CLASSIFICAZIONI TEMATICHE DI BENZENE HEA: sostanza tossica POL: sostanza inquinante SAF: sostanza pericolosa Environmental Knowledge Organisation Laboratory

16 Una struttura generale di raccordo, lo strumento principale di controllo semantico, costruita sulla base di categorie logiche (lalbero di EARTh) La possibilità di derivare da questa struttura, diverse versioni applicative, più agili e organizzate in base a criteri classificatori definiti localmente, ma comunque compatibili e raccordate con la struttura generale Un modello per la gestione dei problemi di interoperabilità Environmental Knowledge Organisation Laboratory

17 Fonti di terminologia EARTh rappresenta la continuazione dellesperienza del GEMET - General European Multilingual Environmental Thesaurus (1997) sviluppato da CNR- EKOLab e UBA-Umweltbundesamt per lAgenzia Europea per lAmbiente. GEMET è la fonte più importante per lo sviluppo di EARTh (circa 4000 termini selezionati). Altre fonti: fonti di terminologia generale dellambiente –Environment and Development (UN, 1992) fonti di terminologia settoriale –Thesaurus Italiano di Scienze della Terra (APAT, 2000) –Terminology of Inland Waters (progetto EDEN/IW, 2001) –Thesaurus for Emergencies and Disasters (UBA-Austria, 1998/2003) –Terminologia di GIS e Telerilevamento (CNR, 2004) –Documenti riguardanti la terminologia della complessità e gli aspetti bioculturali. Environmental Knowledge Organisation Laboratory

18 EARTh: contenuto terminologico Attualmente, EARTh contiene circa 7000 termini. ~ 1500 termini riguardano le pressioni ambientali (p.e., attività industriali ed agricole). ~ 2500 termini descrivono lo stato dellambiente (p.e., processi e componenti naturali). ~ 1000 termini si riferiscono allimpatto ambientale (p.e., rifiuti, inquinamento, perdita di biodiversità). ~ 2000 termini riguardano le risposte della società (p.e. misure giuridiche ed economiche, educazione ambientale, ricerca). Environmental Knowledge Organisation Laboratory


Scaricare ppt "Un thesaurus per organizzare la conoscenza ambientale Fulvio MAZZOCCHI, Paolo PLINI Prima Giornata dellItaliano Istituzionale Commissione Europea (Bruxelles)"

Presentazioni simili


Annunci Google