La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Un thesaurus per organizzare la conoscenza ambientale

Presentazioni simili


Presentazione sul tema: "Un thesaurus per organizzare la conoscenza ambientale"— Transcript della presentazione:

1 Un thesaurus per organizzare la conoscenza ambientale
Prima Giornata dell’Italiano Istituzionale Un thesaurus per organizzare la conoscenza ambientale Fulvio MAZZOCCHI, Paolo PLINI Commissione Europea (Bruxelles) - Mercoledì 23 novembre 2005

2 Definizione funzionale e strutturale di thesaurus
In termini di funzione è uno strumento di controllo terminologico usato per tradurre il linguaggio naturale di documenti, indicizzatori e utenti in un “linguaggio di sistema” più ristretto (linguaggio documentario) [ISO 2788/1974] In termini di struttura è un vocabolario controllato e dinamico di termini correlati gerarchicamente e semanticamente che copre uno specifico campo di conoscenza [ISO 2788/1974] Environmental Knowledge Organisation Laboratory

3 Il dominio “ambiente” E’ un dominio esteso ed eterogeneo.
Presenta problemi di delimitazione (una delle schematizzazioni più utilizzate è il modello Stato-Pressioni-Risposte, che include anche gli aspetti sociali e politici, le attività produttive, ecc.). Carattere dinamico Nuove problematiche emergono con una certa continuità. Vi è una forte spinta verso lo sviluppo delle conoscenze e soprattutto verso l’innovazione tecnologica. Multidisciplinarità La scienza ambientale costituisce un settore complesso e multidisciplinare che interagisce con molti altri settori (p.e., scienze sociali). Il linguaggio speciale dell’ambiente è in costante evoluzione, mantiene un forte contatto con la lingua comune, è formato da termini che possono essere definiti sulla base di diverse prospettive disciplinari. Environmental Knowledge Organisation Laboratory

4 Obiettivi del progetto EARTh
Environmental Knowledge Organisation Laboratory La realizzazione di un thesaurus che contribuisca a razionalizzare la gestione dell’informazione ambientale. proporre una mappa semantica e terminologica ben organizzata e aggiornata del dominio ambientale proporre uno strumento in grado di garantire, allo stesso tempo, un controllo rigoroso dell’organizzazione concettuale e un’ampia applicabilità verso diversi ambiti operativi; il thesaurus dovrà essere sviluppato tenendo in considerazione la dimensione culturale dell’organizzazione della conoscenza (una versione multilingue, per meglio riflettere le diverse identità culturali e linguistiche, potrà essere composta da strutture, sviluppate nelle singole lingue, tra loro non totalmente coincidenti o simmetriche).

5 EARTh Environmental Applications Reference Thesaurus
Environmental Knowledge Organisation Laboratory Struttura sistematica Relazioni semantiche Versioni applicative Contenuto terminologico

6 Struttura sistematica di EARTh: il sistema di categorie
Environmental Knowledge Organisation Laboratory La struttura sistematica di EARTh è basata su un sistema di categorie logiche. Le categorie rappresentano il livello più alto della struttura sistematica. Costituiscono i termini più generali a cui sono riconducibili tutti gli altri termini presenti nel thesaurus. Entità Entità materiali Entità immateriali Attributi Struttura e morfologia Composizione Proprietà Aspetti dinamici Processi Condizioni Attività Dimensioni Spazio Tempo Il sistema di categorie di EARTh

7 Modelli categoriali Entità Personalità Principi Materia
Oggetti immateriali Oggetti materiali Proprietà Quantità Qualità Relazioni Attività Operazioni Stati Processi Dimensioni Tempo Posizione Spazio Personalità Materia Energia Spazio Tempo Environmental Knowledge Organisation Laboratory Categorie (PMEST) di Ranganathan Entità/Oggetto Tipo Parte Proprietà Materiale Processo Operazione Paziente Prodotto Sottoprodotto Agente Spazio Tempo Lettura delle categorie di Aristotele in base a 4 categorie fondamentali (Ur-categories) secondo Dahlberg Categorie del Classification Research Group

8 Struttura sistematica di EARTh: l’albero
La struttura sistematica del thesaurus comprende diversi livelli classificatori e gerarchici. Dal punto vista topologico, è un albero (tendenzialmente monogerarchico). Environmental Knowledge Organisation Laboratory Entità Entità materiali Entità non viventi Entità naturali Costituenti fisici e chimici Sostanze chimiche Sostanze organiche Sostanze org. aromatiche Benzene Dalla struttura ad albero di EARTh

9 Caratteristiche della struttura relazionale dei thesauri
I thesauri prevedono tre tipi di relazioni paradigmatiche. Ogni relazione aggrega una famiglia di sottotipi che nei thesauri tradizionali non vengono, però, differenziati. Esistono almeno tre tipi di relazione GERARCHICA (relazione generica, relazione partitiva e relazione esemplificativa). La relazione di EQUIVALENZA include sinonimi, quasi-sinonimi e varianti lessicali. Un insieme molto eterogeneo di relazioni viene etichettato come relazione ASSOCIATIVA: “it exists when a thematic connection can be established between concepts by virtue of experience” (ISO 704). Telerilevamento Gestione della qualità dell’aria Eutrofizzazione RT Cartografia RT Qualità dell’aria RT Reflui (EnVoc, 1997) (EnVoc, 1997) (EnVoc, 1997) Environmental Knowledge Organisation Laboratory

10 Implementazione della struttura relazionale nei thesauri esistenti
Environmental Knowledge Organisation Laboratory In molti thesauri esistenti l’implementazione delle relazioni semantiche avviene in modo improprio. Probabilmente, la relazione più “abusata” è quella gerarchica- generica: molte relazioni classificate come BT/NT sono, infatti, relazioni associative. Riciclaggio Monitoraggio NT Percentuale di riciclaggio NT Tecniche di monitoraggio (GEMET, 1999) (GEMET, 1999)

11 Progetto di rafforzamento della struttura relazionale di EARTh
Environmental Knowledge Organisation Laboratory In EARTh è previsto lo sviluppo di una struttura relazionale più articolata rispetto a quella tradizionale. L’ipotesi è quella di differenziare in sottotipi le relazioni in base al loro contenuto semantico. Obiettivi: migliorare la funzione di controllo semantico del sistema offrire nuove opportunità ai fini del ricupero dell’informazione migliorare le possibilità di utilizzo del thesaurus mediante tecniche di elaborazione automatica Il thesaurus sarà, comunque, leggibile anche secondo lo schema di relazioni tradizionale.

12 Relazione gerarchica Environmental Knowledge Organisation Laboratory In EARTh, le relazioni generiche, partitive ed esemplificativa saranno tra loro differenziate. Per ciascuna di esse cercheremo, inoltre, di identificare dei sottotipi.

13 Relazione di equivalenza
Sinonimi e varianti lessicali saranno tra loro differenziati e verranno, inoltre, indicati per entrambi i sottotipi. La categoria dei quasi-sinonimi probabilmente non verrà, invece, introdotta nel sistema. Environmental Knowledge Organisation Laboratory

14 Relazione associativa
Il progetto prevede la valorizzazione ed una più articolata definizione della relazione associativa (suddivisione in sottotipi e esplicitazione del loro contenuto semantico). Environmental Knowledge Organisation Laboratory Ciò contribuirà a rafforzare la reticolarità del sistema e alla rappresentazione di quelle connessioni concettuali che non possono essere considerate dall’albero tassonomico-gerarchico. Ciò è importante per la rappresentazione del dominio ambientale. Il potenziamento della struttura di nessi traversali è importante anche per rendere il thesaurus più utilizzabile ai fini della gestione e della ricerca dell’informazione ambientale su internet (ne viene in parte incorporata l’ottica di rete).

15 Versioni applicative di EARTh
Il modello prevede la possibilità di sviluppare versioni applicative del sistema. La terminologia verrà organizzata in base a criteri classificatori locali ed idonei al contesto operativo. Possono essere sviluppate, p.e., versioni del thesaurus organizzate tematicamente. I gruppi tematici riaggregano termini connessi, ad un determinato settore (la struttura ad albero tende invece a sparpagliare i termini collocandoli sotto la categoria logica di riferimento). In tal modo, potranno anche essere attualizzate, ove necessario dal punto di vista operativo, quelle componenti di significato non considerate dalla struttura ad albero. GRUPPO SUOLO Acidificazione del suolo Acqua nel suolo Acquifero Adsorbimento Chernozem Erosione Gestione del suolo Inquinamento del suolo Pedologia Suolo superficiale Umidità del suolo Environmental Knowledge Organisation Laboratory CLASSIFICAZIONI TEMATICHE DI BENZENE HEA: sostanza tossica POL: sostanza inquinante SAF: sostanza pericolosa

16 Un modello per la gestione dei problemi di interoperabilità
Environmental Knowledge Organisation Laboratory Una struttura generale di raccordo, lo strumento principale di controllo semantico, costruita sulla base di categorie logiche (l’albero di EARTh) La possibilità di derivare da questa struttura, diverse versioni applicative, più agili e organizzate in base a criteri classificatori definiti localmente, ma comunque compatibili e raccordate con la struttura generale

17 Fonti di terminologia EARTh rappresenta la continuazione dell’esperienza del GEMET - General European Multilingual Environmental Thesaurus (1997) sviluppato da CNR-EKOLab e UBA-Umweltbundesamt per l’Agenzia Europea per l’Ambiente. GEMET è la fonte più importante per lo sviluppo di EARTh (circa 4000 termini selezionati). Altre fonti: fonti di terminologia generale dell’ambiente Environment and Development (UN, 1992) fonti di terminologia settoriale Thesaurus Italiano di Scienze della Terra (APAT, 2000) Terminology of Inland Waters (progetto EDEN/IW, 2001) Thesaurus for Emergencies and Disasters (UBA-Austria, 1998/2003) Terminologia di GIS e Telerilevamento (CNR, 2004) Documenti riguardanti la terminologia della complessità e gli aspetti bioculturali. Environmental Knowledge Organisation Laboratory

18 EARTh: contenuto terminologico
Attualmente, EARTh contiene circa 7000 termini. ~ 1500 termini riguardano le pressioni ambientali (p.e., attività industriali ed agricole). ~ 2500 termini descrivono lo stato dell’ambiente (p.e., processi e componenti naturali). ~ 1000 termini si riferiscono all’impatto ambientale (p.e., rifiuti, inquinamento, perdita di biodiversità). ~ 2000 termini riguardano le risposte della società (p.e. misure giuridiche ed economiche, educazione ambientale, ricerca). Environmental Knowledge Organisation Laboratory


Scaricare ppt "Un thesaurus per organizzare la conoscenza ambientale"

Presentazioni simili


Annunci Google