La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Metodi e strumenti per lannotazione semantica Nunzia Osimi Tesista di Informatica presso il LEKS-CNR 14 Novembre 2003.

Presentazioni simili


Presentazione sul tema: "Metodi e strumenti per lannotazione semantica Nunzia Osimi Tesista di Informatica presso il LEKS-CNR 14 Novembre 2003."— Transcript della presentazione:

1

2 Metodi e strumenti per lannotazione semantica Nunzia Osimi Tesista di Informatica presso il LEKS-CNR 14 Novembre 2003

3 2 Indice Introduzione al Web Semantico Interoperabilità e ontologie Lannotazione semantica Criteri di classificazione delle AS Alcuni tool per lannotazione semantica Conclusioni

4 3 Semantic Web: Motivazioni Intento Originale: rendere la semantica delle informazioni accessibile agli elaboratori Nel web attuale: necessario lintervento umano per comprendere il contenuto di risorse Obiettivo: rendere linformazione machine- understandable Soluzione: Utilizzare i metadati Passo successivo: Interoperabilità Semantica combinare informazioni provenienti da sorgenti diverse ai fini di realizzare: estrazione intelligente, cioè semantica (Smart retrieval) Scambio di informazioni tra applicazioni software Web Services: ricerca e composizione di servizi

5 4 Come realizzare linteroperabilità? Vocabolario controllato linteroperabilità migliora se gli stessi termini sono usati per denotare gli stessi concetti Ontologie Elementi principali 1. Un vocabolario controllato 2. Relazioni tassonomiche tra concetti 3. Altre relazioni tra concetti

6 5 Cosè un ontologia? Definizioni …an explicit specification of a conceptualization (Gruber) …a formal specification of a shared conceptualization (Borst) explicit i tipi di concetti utilizzati e i vincoli su di essi sono definiti in modo esplicito. formal definita in un ling. formale. shared la conoscenza rappresentata in unontologia non è scaturita dalla decisione di un singolo individuo, ma è riconosciuta da una collettività. conceptualization perchè un ontologia identifica i concetti rilevanti di un dominio applicativo stabilito.

7 6 Generalità sulle ontologie Come costruire un ontologia? Nominando una commissione ad hoc … ma è necessaria una metodologia Ad esempio, il Dublin Core ha impiegato anni per enucleare 15 elementi metadato principali. approccio Darwiniano : lontologia migliore/la più popolare prevale Come combinazione di standard officiali e de-facto Sono in corso progetti per la def. di upper ontology le Ontologie consentono deduzioni (reasoning) Ciò permette di spostarsi dallelaborazione della sintassi a quella della semantica. ma: da dove scaturiscono i dati semantici? Semantic Annotation

8 7 Annotazioni Semantiche Sono informazioni semantiche associate a risorse web. Perché si usano? Per arricchire il contenuto informativo dei documenti Per esprimere in maniera formale, il significato di : Porzione di testo in un documento Web service Strutture dati coinvolte in un processo di collaborazione (interoperabilità tra applicazioni software)

9 8 The Internet Ontologia Meta-KR Utenti Knowledge Resource Management KR: Knowledge Resources

10 9 Criteri per classificare le annotazioni Livello di formalità del linguaggio usato Posizionamento dellannotazione Destinatario dellannotazione Tipo di risorsa annotata Livello di restrizione imposto sul linguaggio. Modalità di annotazione

11 10 Livello di formalità del linguaggio usato formale espressa in un linguaggio formale di rappresentazione della conoscenza Alcuni linguaggi RDF e RDFS: un framework per esprimere i metadati nel web DAML, DAML+OIL, OWL sono usati per la definizione di ontologie Permette di processare i dati senza lintervento umano (machine understandable) informale Espressa in linguaggio naturale o in un linguaggio controllato Permette di aggiungere informazioni su documenti o risorse, fruibili da un utente umano

12 11 Esempio Esempio Annotazione Formale in RDF Michele Missikoff Esempio Annotazione Informale in linguaggio naturale Michele Missikoff un ricercatore dello IASI-CNR.

13 12 Posizionamento dellannotazione Embedded inserita allinterno dello stesso documento annotato Attached Memorizzata separatamente, collegata al documento da un link. … … … annot

14 13 Destinatario dellannotazione Human user Ha lo scopo di fornire informazioni aggiuntive su una risorsa in questo caso lannotazione in genere sarà poco formale probabilmente realizzata in linguaggio naturale Computer Ha lo scopo di esplicitare il significato di una risorsa in tal caso lannotazione deve essere di tipo formale per poi essere processabile da una macchina

15 14 Tipo di risorsa annotata Annotazione di documenti Frammento di testo, pagina HTM, immagini, ecc. Annotazione di Web Services Esprimere cosa fa un servizio, descrivere i parametri di input e loutput Solitamente è di tipo formale Annotazione di strutture dati, processi,… coinvolti nello scambio di informazioni tra applicazioni software che cooperano Solitamente è di tipo formale, ontology-based

16 15 Livello di restrizione imposto al linguaggio Absence i termini del linguaggio possono essere usati senza vincoli Advised (consigliato…) si è liberi di scegliere se utilizzare o meno un glossario, un ontologia, (o anche parole chiavi) in alternativa al linguaggio naturale. Mandatory (vincolante) Cè lobbligo di usare un glossario di riferimento o un ontologia (Annotazione Ontology-based)

17 16 Modalità di Annotazione NB. questa classificazione riguarda solo le SA Ontology-based Annotazione attraverso istanze di concetti Lannotazione consiste in 1. Associazione di una istanza allelemento annotato 2. Valorizzazione delle proprietà che descrivono listanza Annotazione attraverso concetti Lannotazione consiste in Associazione di un concetto dellontologia allelemento annotato Associazione di una composizione di concetti dellontologia (attraverso opportuni operatori) allelemento annotato

18 17 Student Person Researcher Faculty_Member IDMicheleMissikoff Is a Instance of Michele Missikoff è un ricercatore dello IASI CNR Michele Missikoff è un ricercatore dello IASI CNR name address Ontologia Annotazione attraverso concetti Annotazione attraverso istanze

19 18 FormalitàPosizionamDestinatarRisorsaRestriz.ElemAnn Ontomat Formale (DAML+ OIL) Embedded (nellheader) ComputerPg.htmlOntology- based Istanze Mnm Formale (DAML+ OIL, RDF) AttachedComputerPg.html Ontology- based Istanze Smore Formale (RDF, DAML+ OIL, OWL) Embedded (nellheader) / ( ,Img.) Attached Computer Foto, mail, Pg.html Advised ?? Annotea Infomale Human userPg.htmlAbsence Non O-B Cohse Formale ComputerDoc/ Pg.html Ontology- based Concetti Melita Formale ComputerDocOntology- based Istanze documenti Si Annotea Melita Classificazione di alcuni tool

20 19 Tool Analizzati Si è riuscito ad annotare con: OntoMat-Annotizer Mnm Smore Problemi : Cohse (problemi distallazione) Melita (eseguibile non fornito)

21 20 Esempio Organization Researcher Reserch funding Institution University Person Student Faculty_Member IASI-CNR Michele Missikoff Is a Instance of Has_affiliate Has affiliation

22 21 Ontomat (caratteristiche generali) Visualizzazione dellontologia ( in DAML+OIL ) mediante albero Browser per lesplorazione dellontologia e delle istanze Browser Html che visualizza le parti di testo annotate. Implementato in Java, permette lestensione tramite plugin Le annotazioni avvengono mediante dragndrop

23 22

24 23 Ontomat Input : ontologia (DAML+OIL) pagina html Output : Pagina Html con annotazioni inserite nell header Istanze esportate (annotazione in DAML+OIL) Ontologia (DAML+OIL) Ontologia + Istanze (DAML+OIL).

25 24 Annotazione (istanza esportata da OntoMat) Viale Manzoni,30 Italy Rome IASI-CNR …

26 25 …esempio … Michele Missikoff

27 26 Pro e contro di OntoMat (1) PRO Interfaccia User-friendly Chiara distinzione tra classi, attributi, relazioni e istanze Fornisce lhelp on line (Wizard) Estendibile ad altri linguaggi tramite plugin.

28 27 Pro e contro di OntoMat (2) CONTRO Impone vincoli sulla visualizzazione delle proprietà che descrivono una classe: una proprietà P può essere utilizzata perdescrivere una istanza di una classe C, soltanto se C è stata definita attraverso un "restriction su P Non effettua reasoning: non gestisce in modo automatico linversa di una relazione Limportazione di ontologia+istanze non avviene in modo corretto: le istanze non vengono caricate automaticamente.

29 28 Mnm (caratteristiche generali) Browser Browser Html Browser dellontologia Mark-up del testo Apprendimento automatico (Amilcare) Annotazione semi-automatica

30 29

31 30 Mnm (I/O) Input: ontologia in DAML/ DAML+OIL/ RDF Pagina Html. Output: Base di conoscenza rappresentante lannotazione del documento in DAML/ DAML+OIL/ RDF File dummy (proprietario) che mantiene il collegamento tra annotazione e documento.

32 31 Annotazione (base di conoscenza salvata con MNM) Michele Missikoff LEKS …

33 32 …esempio … Lab for Ent. Knowledge Systems IASI-CNR …

34 33 Pro e contro di MNM (1) PRO La parte di testo annotata è facilmente riconoscibile perché evidenziata in diversi colori Possibilità di definire le annotazioni attraverso form o tramite selezione del testo Effettua Apprendimento automatico (Amilcare)

35 34 Pro e contro di MNM (2) CONTRO Struttura ontologia è poco intuitiva Presuppone conoscenza dell RDF da parte dellutente Impone vincoli sulla visualizzazione delle proprietà che descrivono una classe: una proprietà P può essere utilizzata per descrivere una istanza di una classe C soltanto se C è stata dichiarata come dominio di P. OSS: OntoMat e MNM non interpretano l input allo stesso modo

36 35 Smore (caratteristiche generali) Fornisce Editor pagine html Fornisce un collegamento alle esistenti ontologie su Internet per renderle utilizzabili allinterno della propria web-page. Possibile creazione di una propria ontologia personalizzata costruibile a partire dallesistenti (Editor di Ontologie)

37 36

38 37 Smore Input: ontologia in RDF, DAML, DAML+OIL, OWL Pagina html Output file dataset proprietario (.dat) (rappresentante la struttura usata per annotare) Pagina html annotazione in RDF (è possibile salvare sia lannotazione pura sia il documento con annotazione embeded nellheader)

39 38 Annotazione (file RDF salvato con Smore) Michele Missikoff Si è perso il link allistanza Michele Missikoff dellontologia

40 39 Pro e contro di Smore (1) PRO E necessaria una minima conoscenza della sintassi e dei termini del RDF da parte dellutente. Unico tool esaminato che permette di annotare anche in OWL

41 40 Pro e contro di Smore (2) CONTRO Poco comprensibile come creare effettivamente le istanze di classi e le relazioni tra istanze definite a partire da una ontologia fissata Help in linea poco dettagliato, molte funzionalità rimangono oscure Poco stabile, genera eccezioni durante lesecuzione

42 41 Conclusioni (1) Obiettivo di questo lavoro era trovare un tool che avesse le seguenti caratteristiche: Formale Machine-oriented Per annotare qualsiasi tipo di risorsa documenti, webServices, risorse coinvolte in un processo di interoperabilità tra applicazioni soft. Ontology-based Possibilità di annotare sia concetti che istanze Di facile utilizzo (anche da utente inesperto) Escluso OntoMat gli altri tool sono risultati poco stabili e poco user-friendly.

43 42 Conclusioni (2) Soluzioni possibili: Estendere OntoMat con Plugin per la gestione di OWL (lasciando comunque cosi irrisolta l annotazione attraverso concetti ) Creare una nuova applicazione che soddisfi tutte le esigenze elencate.

44 43 References (1) 1. S. Bechhofer, C. Goble. Towards Annotation using DAML+OIL K-CAP 2001 workshop on Knowledge Markup and Semantic Annotation, Victoria B.C, October (COHSE)Towards Annotation using DAML+OIL 2. M. Denny. Ontology Building: A Survey of Editing Tools November 06, S. Handschuh, S. Staab, A. Mädche. CREAM - Creating relational metadata with a component-based, ontology driven annotation framework. K-CAP S. Handschuh, S. Staab, A. Maedche. An AnnotationFramework for the Semantic Web Karlsruhe, Germany M. Missikoff, F. Schiappelli, F.Taglino A Controlled Language for Semantic Annoatation and Interoperability in e-Business Application IASI-CNR (Italy) M. Missikoff F. Schiappelli. Semantic Annotation for Enterprises Interoperability IASI_CNR (Italy) 2003

45 44 References (2) 1. M. Vargas-Vera, E. Motta, J. Domingue, M. Lanzoni, A. Stutt and F. Ciravegna. "MnM: Ontology Driven Semi-Automatic and Automatic Support for Semantic Markup",The 13th International Conference on Knowledge Engineering and Management (EKAW 2002), ed Gomez-Perez, A., Springer Verlag, "MnM: Ontology Driven Semi-Automatic and Automatic Support for Semantic Markup" 2. M. Vargas-Vera, E. Motta, J. Domingue, M. Lanzoni, A. Stutt and F. Ciravegna. "MnM: Ontology Driven Tool for Semantic Markup", European Conference on Artificial Intelligence (ECAI 2002). In proceedings of the Workshop Semantic Authoring, Annotation & Knowledge Markup (SAAKM 2002). Lyon France, July 22-23, "MnM: Ontology Driven Tool for Semantic Markup" 3. M. Vargas-Vera, J. Domingue, E. Motta, S. Buckingham Shum and M. Lanzoni. "Knowledge Extraction by using an Ontology-based Annotation Tool. In proceedings of the Workshop Knowledge Markup & Semantic Annotation, K- CAP'01, Victoria Canada, October "Knowledge Extraction by using an Ontology-based Annotation Tool 4. A. Wolff, Z. Zdrahal, Z. Kouba. Tools for Personalised Annoatation and Organization of Diverse Web Resources KMI 5.


Scaricare ppt "Metodi e strumenti per lannotazione semantica Nunzia Osimi Tesista di Informatica presso il LEKS-CNR 14 Novembre 2003."

Presentazioni simili


Annunci Google