Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Sommario Introduzione Wordnet Ontologie, framework ontologico
3 Ontologie e Basi di conoscenza
Ontologie, tassonomie, folksonomie In comunità diverse, per definire entità e le relazioni tra loro esistenti, vengono creati artefatti di diversa tipologia, ciascuna con finalità proprie quali: dataset di annotazione, supporto alla comprensione del linguaggio naturale, integrazione di risorse differenti, interoperabilità semantica, conoscenza di background in applicazioni, liste di parole-chiave per annotare risorse web (folksonomie). Tutti questi artefatti vengono assimilati ad ontologie
Ontologie, tassonomie, folksonomie Tra le ontologie vere e proprie e le folksonomie si collocano le tassonomie (modelli concettuali e vocabolari controllati con organizzazione in genere gerarchica) spesso usati per operazioni di information indexing e retrieval. E necessario identificare delle dimensioni chiave che definiscano le ontologie oltre a definire operativamente tali dimensioni
Framework ontologico E possibile sviluppare ontologie anche con una conoscenza parziale della loro definizione, implementazione e scopo applicativo. Obiettivo: fornire un framework che supporti la diversità (e non la divergenza) assicurando di mantenerne la stabilità e la riusabilità allinterno di approcci ontologici differenti.
Framework ontologico Possiamo identificare 2 gruppi di dimensioni: 1.dimensioni semantiche (espressività, granularità strutturale e rappresentazionale) 2.dimensioni pragmatiche (uso previsto, supporto di ragionamento automatico, identificazione della descrittività o della prescrittività di una ontologia, metodologia di disegno, …)
Framework ontologico Il framework ontologico è condizione fondamentale per specificare metadati per ontologie diverse; tali metadati includono le proprietà e le caratteristiche usate per descrivere una ontologia. Ciò a supporto della condivisione, riuso e confronto di ontologie
Dimensioni semantiche Una ontologia include un vocabolario e una specificazione della interpretazione sottesa (significato) di ciascun termine del vocabolario. La specificazione include: 1.identificazione delle categorie fondamentali nel dominio 2.identificazione dei modi in cui membri delle categorie sono correlati tra loro 3.vincoli sui modi in cui le relazioni possono essere usate Le dimensioni semantiche caratterizzano come un dato approccio specifichi i significati dei termini; ciò comprende lespressività del linguaggio di rappresentazione ontologica, le proprietà strutturali, la granularità della rappresentazione delle specificazioni ontologiche
Espressività Lespressività è una caratteristica del linguaggio in cui una ontologia è prodotta. Una ontologia definisce il proprio vocabolario in una qualche forma di rappresentazione. Informalmente una ontologia può essere espressa soltanto da una lista di termini e da definizioni in linguaggio naturale (inglese, italiano,…). Ciò produce confusione tra ontologie ed il linguaggio usato per rappresentare le ontologie.
Proprietà strutturali Il livello di struttura spesso corrisponde alla formalità delle definizioni dei termini nel vocabolario. Una ontologia che specifica formalmente i concetti (es. astrazione matematica) ha molte proprietà strutturali Una ontologia che specifica poco i concetti (es. documento, hyperlink) ha poche proprietà strutturali Molte ontologie sono semistrutturate contenendo un mix di definizioni formali ed informali di concetti e relazioni (es. ontologia bibliografica con concetto tempo altamente strutturato e concetto titolo di libro scarsamente strutturato – stringa di testo-)
Proprietà strutturali
Granularità La granularità è una proprietà del contenuto della ontologia e non del linguaggio di rappresentazione; attiene alla numerosità di concetti e relazioni nel proprio vocabolario. La granularità è misurabile con la profondità media delle sottoclassi e/o sottoproprietà, la densità media dei termini nella gerarchia, il numero medio di assiomi per termine Ridotta granularità se si usano primitive di rappresentazione ad alto livello (come accade nelle tassonomie con concetti e sussunzione), Granularità fine (come nelle ontologie con molti dettagli circa le proprietà dei concetti e di come essi relazionino tra loro.
Confronto tra ontologie Le ontologie possono essere confrontate rispetto ai linguaggi con espressività minima richiesta per definire il loro vocabolari Le tassonomie richiedono un linguaggio più ristretto per specificare la relazione di sottoclasse tra classi
Dimensioni pragmatiche Luso previsto può determinare la proprietà di una ontologia: condividere una base di conoscenza migliorare la comunicazione tra agenti supporto alle decisioni rappresentazione del vocabolario di un linguaggio naturale rappresentazione della semantica per servizi ed applicazioni software fornire un framework concettuale per lindicizzazione di contenuti
Dimensioni pragmatiche Si può misurare la tipologia di ragionamento automatico supportato dallontologia: a livello di specificazione si valutano i vincoli sia sul linguaggio che sul contenuto Ragionamento semplice (fare inferenze usando la relazione di ereditarietà delle proprietà tra classi/sottoclassi) Ragionamento speciale (il reasoner può fare asserzioni arbitrarie nel linguaggio di rappresentazione della conoscenza) Ragionamento generale (uso di regole deduttive che combinano informazioni attraverso lontologia)
Dimensioni pragmatiche Uso descrittivo/prescrittivo si riferisce alla sorgente di interpretazione attesa del vocabolario dellontologia. Nellapproccio descrittivo il contenuto di una ontologia descrive linterpretazione attesa caratterizzando le entità e le relazioni tra entità come lo farebbe un utente/esperto Nellapproccio prescrittivo il contenuto di una ontologia prescrive le interpretazioni attese forzando così il modo in cui entità e relazioni debbano essere caratterizzate
Dimensioni pragmatiche Le metodologie di disegno usate nella costruzione di una ontologia ne determinano il modo duso e sono strettamente connesse alluso previsto. Una metodologia bottom-up (o empirica) pone enfasi sullanalisi dei dati e la loro semantica; si suppone che questo approccio possa far emergere patterns di caratterizzazione preferiti da comunità di utenti Una metodologia top-down (o razionalista) pone enfasi sullo sviluppo di una ontologia a partire dalla conoscenza sul mondo o sul dominio. Lontologia in tal caso è indipendente dai dati reali. Lo scopo dellontologia in tal caso è determinato dalla classe di domande che un esperto di dominio può porre.
Dimensione di Governance delle ontologie La governance attiene a come le decisioni relative alla struttura ed al contenuto sono state prese ed include la specificazione dei criteri di qualità e di certificazione. Si potrebbe demandare alle organizzazioni professionali o di categoria (piuttosto che a validi ricercatori o ingegneri della conoscenza) la definizione in linguaggio naturale delle entità e delle relazioni semantiche intesa come uno sforzo per formalizzare i concetti. Ciò potrebbe far riferimento a legislazioni specifiche, regolamenti standard usati per le definizioni e permetterebbe di valutare formalmente la bontà dei risultati ottenuti dalle applicazioni
Riferimenti Arash Shaban-Nejad: tutorial on Ontology: Foundation of Semantic Web, 2004 M. Gruninger, O. Bodenreider, F. Olken, L. Obrst, P. Yim: Ontology, taxonomy, folksonomy: understanding the distinctions, Applied Ontology journal, 3 (2008) pagg