Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Sommario Introduzione Linguaggi per la gestione delle ontologie Valutazioni (delle ontologie, dei tool basati su ontologie e degli ontology editors)
Contesti di valutazione Poichè una ontologia si riferisce ad una sfera cognitiva ed è un artefatto software che deve essere usato (riusato) in diversi contesti applicativi e tecnologici, la sua valutazione si riferisce a diversi contesti: valutazione del modello dellontologia, valutazione dei tools che gestiscono unontologia allinterno di un framework, valutazione degli ontology editors.
Valutare una ontologia Non esistono criteri standard od universalmente condivisi; esistono variabili in funzione di scenari diversi. Esiste un agreement generale sui seguenti criteri: copertura precisione dettaglio assiomatico sostenibilità flessibilità Tali criteri non sono in genere correlati e sono funzione dei diversi scenari applicativi
Copertura di una ontologia La copertura è la misura della quantità dei modelli desiderati che siano rappresentabili da una ontologia. La copertura è complementare alla specificità. Una copertura ampia copre molti modelli/aspetti del mondo (Le ontologie a copertura ampia sono in genere più riusabili) Una copertura specifica è molto specifica su un aspetto, ma richiede estensioni se si vuole esprimere qualcosa di non specifico
Copertura di una ontologia La copertura è una misura funzionale perché la sua misura richiede proprio ciò che si vuole costruire: lo spazio semantico di riferimento dellontologia. Le misure di copertura sono indotte a partire da altri tipi di dato (corpora testuali o domande rivolte ad esperti del dominio del quale lontologia dovrebbe coprire i modelli attesi)
Precisione di una ontologia La precisione è una misura della selettività di una ontologia, ovvero individua quanti dei modelli rappresentabili in una ontologia sono effettivamente voluti. Anche la precisione è una misura funzionale
Dettaglio assiomatico di una ontologia Si tratta della quantità di assiomi presenti in media per ogni classe dellontologia. Il dettaglio assiomatico è complementare alla precisione, alla espressività, ovvero alla complessità delle strutture logiche usate nella costruzione degli assiomi Il dettaglio assiomatico è misurabile in base alla ontologia stessa (è una misura strutturale)
Sostenibilità di una ontologia La sostenibilità è una misura della possibilità nella realtà di usare un modello ontologico e di mantenerlo allinterno di una qualsivoglia organizzazione. Es. una ontologia con un alto dettaglio assiomatico, alta precisione, ampia copertura è onerosa da progettare, costruire, mantenere e usare in sistemi informativi con molti dati (alto numero di inferenze generate dai ragionatori automatici)
Flessibilità di una ontologia La flessibilità è il numero dei diversi punti di vista del dominio che è possibile rappresentare. La misura della flessibilità è possibile solo in presenza di informazioni di dettaglio sulle caratteristiche di progettazione dellontologia stessa (componenti, criteri, processi decisionali, etc.)
Valutazione dei tool basasti su ontologie Le ontologie cercano di catturare conoscenza di dominio che può essere riusata, condivisa, e resa operativa per molteplici applicazioni. La dimensione delle ontologie, la loro complessità, la necessità di rappresentare una conoscenza comune a più gruppi di persone, sono tutti fattori che limitano il loro affermarsi come strumento di base per le applicazioni. Linteroperabilità (semantica), la scalabilità, laccesso multiutente sono fattori chiave per la loro diffusione a livello aziendale.
Proprietà delle ontologie generate da tool di sviluppo Language conformity: la sintassi della rappresentazione dellontologia in un linguaggio speciale risulta conforme allo standard Nella valutazione loutcome di un tool ontologico deve essere confrontato rispetto alla definizione sintattica, oppure rispetto ad una implementazione usata come riferimento
Proprietà delle ontologie generate da tool di sviluppo Consistenza: rispetto alla propria semantica La valutazione della consistenza esprime quanto il tool sia capace di creare ontologie consistenti rispetto alla propria semantica, ovvero deve verificarsi che diverse parti di una ontologia non siano in contraddizione
Proprietà delle tecnologie Interoperabilità semantica: grado di facilità con cui è possibile scambiare ontologie per unapplicazione. Non solo deve esserci language conformity, ma bisogna verificare che tool diversi interpretino le stesse cose nello stesso modo
Proprietà delle tecnologie Turn around ability: capacità di produrre loutcome di un tool sempre nello stesso modo
Proprietà delle tecnologie Performance: tempo necessario per risolvere uno specifico task inferenziale (es. memorizzare ontologie di riferimento standard) Nella valutazione è necessario disporre di benchmarks e deve essere definito cosa si intende per misura di una ontologia, complessità del task e quali parametri influenzano, e come, la misura.
Proprietà delle tecnologie Memory allocation: memoria necessaria al tool per gestire ontologie Nella valutazione è necessario disporre di benchmarks e deve essere definito cosa si intende per misura di una ontologia, complessità del task e quali parametri influenzano, e come, la misura.
Proprietà delle tecnologie Scalabilità: valuta la performance ed il comportamento del tool rispetto alla memoria in funzione dellaumento della dimensione dellontologia
Proprietà delle tecnologie Integrazione in un framework: misura della facilità di usare il tool in ambienti diversi Connettività: capacità di collegarsi con altri tool (database, index servers, MS systems, Lotus Notes, etc)
Tool per la costruzione di ontologie Gli ontology editors possono essere selezionati in base a criteri di: Funzionalità a livello di operazioni permesse Riusabilità di tutto o parte del contenuto ontologico Complessità dellinstallazione Associabilità ad altri sistemi Scalabilità dellontologia al modificarsi del dominio Affidabilità rispetto agli accessi di uno sviluppatore Utilizzabilità in locale o remoto Efficienza nelle operazioni (processo iterativo di creazione dellontologia) Visibilità del modello ontologico per un umano
Funzionalità Add: fino a che punto il tool rende possibile laggiunta di classi, proprietà, relazioni ed istanze Modify: fino a che punto il tool rende possibile la modifica di classi, proprietà, relazioni ed istanze Delete : fino a che punto il tool rende possibile la rimozione di classi, proprietà, relazioni ed istanze Limplementazione di tutte queste funzionalità è importante perché ciascuna di esse va a modificare il modello ontologico
Riusabilità Riusare: Ontologie: grado in cui una ontologia esistente può essere usata da una nuova versione delleditor Classi: grado in cui una classe esistente può essere usata per creare una nuova ontologia Slot: grado in cui uno slot esistente può essere usato per creare una nuova ontologia Istanza: grado in cui una istanza esistente può essere usata per creare una nuova istanza di unaltra classe Dati: grado in cui dati esistenti possono essere usati per popolare istanze di una nuova ontologia La riusabilità rende più semplice e più economico lo sviluppo di nuove ed il riuso di ontologie esistenti
Complessità Installazione del processo: numero di passi e tempo necessario nella installazione Necessità di una piattaforma: capacità delleditor di funzionare su piattaforme diverse Interfacce: amichevolezza dellinterfaccia delleditor La complessità è relativa alla difficoltà con cui il tool può essere installato.
Associabilità Connettività ad un database: livello di interoperabilità con database diversi Capacità di gestire macro: possibilità offerte dal tool per aggiungere macro allontologia (per supportare un appropriato data entry e la formattazione, e la presentazione allutente) Caratteristiche importanti per la gestione delle ontologie in ambienti industriali
Scalabilità Aggiungere nuove superclassi/classi Modificare superclassi in sottoclassi Cancellare super/sotto classi esistenti Queste funzionalità permettono di modificare lontologia al variare della conoscenza di dominio. La cancellazione delle classi deve tener conto delle istanze eventuali associate alla classe
Affidabilità Validazione: controllare che non si aggiungano nuove classi/slot con un nome già esistente Verifica: verifica e correzione di errori di lieve entità per migliorare la consistenza Il grado di affidabilità è importante per lo sviluppatore
Utilizzabilità Accessibilità: eventualmente online Prezzo: richiesto per lacquisto Caratteristiche rilevanti a livello industriale
Efficienza Model browsing: capacità offerta dalleditor per navigare facilmente nel modello ontologico Query capability: capacità di supportare efficienti attività di ricerca sullontologia Design tools: capacità di supportare lo sviluppatore con tool di disegno facili da usare Tali funzionalità sono collegate al fatto che la creazione di una ontologia è un processo iterativo
Visibilità Model creation using external programs: supporto alla visualizzazione del modello usando programmi esterno, es. plug-in Model creation using internal programs: supporto alla visualizzazione del modello come built-in capability Conversation to HTML pages: supporto alla visualizzazione del modello grazie alla capacità di convertire unontologia in pagine HTML La funzionalità di visibilità è richiesta a supporto della comprensione immediata del contenuto ontologico da parte di un utente umano.
Riferimenti Guarino N.: Formal ontologies in information systems, Proceedings of Formal Ontology and Information Systems, 1998 Arash Shaban-Nejad: tutorial on Ontology: Foundation of Semantic Web, 2004 Whitepaper: Evaluation of Ontology-based Tools, 2001, OntoWeb D1,3. tools Murshed Ahsan, Ramanjit Singh: Evaluation and Ranking of Ontology Construction Tools. Technical Report DIT , Informatica e Telecomunicazioni, University of Trento. (2005) D. Maynard.: Benchmarking ontology-based annotation tools for the Semantic Web; UK e-Science Programme All Hands Meeting (AHM2005) Workshop "Text Mining, e-Research and Grid-enabled Language Technology", Nottingham, UK, 2005.