Metodi e strumenti per l’annotazione semantica

Slides:



Advertisements
Presentazioni simili
Training On Line - CONP. 2 Richiesta Da Menu: Conferimenti ad inizio anno termico > Agosto > Pluriennali > Nuova Richiesta Si accede alla pagina di Richiesta.
Advertisements

1 Tutto su liceoclassicojesi.it 1° Incontro sulla gestione di liceoclassicojesi.it.
TAV.1 Foto n.1 Foto n.2 SCALINATA DI ACCESSO ALL’EREMO DI SANTA CATERINA DEL SASSO DALLA CORTE DELLE CASCINE DEL QUIQUIO Foto n.3 Foto n.4.
Introduzione ad XML Mario Arrigoni Neri.
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
Unità D2 Database nel web. Obiettivi Comprendere il concetto di interfaccia utente Comprendere la struttura e i livelli che compongono unapplicazione.
Francesco Cristofoli Microsoft Italia
Consumare Web Service Andrea Saltarello
International Society for Knowledge Organization Università Ca Foscari di Venezia Dipartimento di Informatica Matteo Ballarin SKOS Un sistema per lorganizzazione.
Modulo3 Visualizzatori
Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Progetto e sviluppo di.
Peer to Peer DBMS: il sistema FOAF Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Università degli.
Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio.
Università degli Studi di Modena e Reggio Emilia
COMPARAZIONE DI STRUMENTI SOFTWARE PER LA CREAZIONE, LA GESTIONE E LINTEGRAZIONE DI ONTOLOGIE Università degli Studi Modena e Reggio Emilia Facoltà di.
Frontespizio Economia Monetaria Anno Accademico
1 Tavolo del Patto per la crescita intelligente, sostenibile e inclusiva Il ricorso agli ammortizzatori sociali nei territori colpiti dagli eventi sismici.
Training On Line – CONA. 2 Richiesta Da Menu: Conferimenti ad inizio anno termico > Agosto > Annuali > Nuova Richiesta Si accede alla pagina di Richiesta.
Training On Line - Report. 2 Report storico Da menu: Reportistica -> Report storico Si accede alla pagina di selezione del report storico.
Implementazione dell algortimo di Viterbi attraverso la soluzione del problema di cammino mi- nimo tramite software specifico. Università degli studi di.
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Algoritmi e Strutture Dati Capitolo 2 Modelli di calcolo e metodologie di analisi.
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
1 Seconda ora Larchitettura di un sistema di e- government: parte seconda Un esempio di progetto di e-Government: il progetto servizi alle imprese Un esempio.
Corso di Informatica (Basi di Dati)
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
1. 2 CAMERA DI COMMERCIO PESARO E URBINO Elaborazione Servizio Statistica Fonti: ISTAT – Unioncamere – Tagliacarne – Infocamerere – Regione Marche – Comune.
eliana minicozzi linguaggi1a.a lezione2
1 Anatomia di una pagina Un insieme di pagine web hanno generalmente una parte invariante (o poco): header, navigazione, footer una parte variabile: contenuti.
Architettura del World Wide Web
La partita è molto combattuta perché le due squadre tentano di vincere fino all'ultimo minuto. Era l'ultima giornata del campionato e il risultato era.
Laboratorio di Informatica
Linguaggi di markup1 LINGUAGGI DI MARKUP. Linguaggi di markup2 Documenti su Internet Internet permette (tra laltro) di accedere a documenti remoti In.
DHTML: Modello degli Eventi 1. 2 Sommario Introduzione Evento onclick Evento onload Gestione errori con onerror Gestione mouse con levento onmousemove.
Strutture di controllo in C -- Flow Chart --
Lezione 4 Probabilità.
STILI DI APPRENDIMENTO ED EVOLUZIONE INTERFACCE
19 Lezione 21/5/04 Composizione dell'immagine 1 COMPOSIZIONE DELLIMMAGINE.
1 IsaPress. 2 Obiettivo Realizzare uno strumento di facile uso per estrarre il contenuto da documenti binari di vario tipo in un formato utile per l'impaginazione.
1 IsaPress. 2 Obiettivo Realizzare uno strumento di facile uso per estrarre il contenuto da documenti binari di vario tipo in un formato utile per l'impaginazione.
2 3 4 RISERVATEZZA INTEGRITA DISPONIBILITA 5 6.
Melfi, 1 aprile 2011 – MediaShow 1 Social Network: possibilità di uso consapevole nella didattica Uso, consapevolezza, opportunità, proposte Caterina Policaro.
1ROL - Richieste On Line Ente pubblico 5ROL - Richieste On Line.
Descrizione Semantica ad Alto Livello di Ambienti Virtuali in X3D
Test Reti Informatiche A cura di Gaetano Vergara Se clicchi sulla risposta GIUSTA passi alla domanda successiva Se clicchi sulla risposta ERRATA passi.
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
ISOIVA (LOCALE) TO ISOIVA (WEB) RIPARTIZIONE INFORMATICA UFFICIO APPLICATIVI AMMINISTRATIVI 13/04/2011 UNIVERSITÀ DEGLI STUDI DI FERRARA 1.
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
Il Semantic Web applicato ai percorsi formativi nelle organizzazioni innovative By CSTAdvising CSTAdvising, professionisti della conoscenza,
1 Guida per linsegnamento nei corsi per il conseguimento del CERTIFICATO DI IDONEITÀ ALLA GUIDA DEL CICLOMOTORE.
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
A cosa serve GWAESSE? E’ un software di semplice utilizzo per la configurazione e la preventivazione di quadri AS (per moli e campeggi), ASC (per cantiere)
Esercitazioni di Meteorologia da satellite
1 Ly-LAB Sistema di gestione dei dati analitici di laboratorio.
Tesi di Laurea in Ingegneria Informatica
Il World Wide Web Lidea innovativa del WWW è che esso combina tre importanti e ben definite tecnologie informatiche: Documenti di tipo Ipertesto. Sono.
Presentazione del problema Obiettivo: Lapplicazione di Search of Sematic Services permette di ricercare sevizi semantici, ossia servizi a cui sono associati.
Sviluppare un programma in C che, dato un array da 100 elementi interi caricato con numeri casuali compresi tra [10,100], sia in grado di cercare il valore.
Annotazione Semantica di risorse Web basata su ontologie di dominio
Modulo 6 Test di verifica
1 Ontology languages. Strato dei modelli LA SCELTA DEL LINGUAGGIO Una volta selezionati i componenti dell’ontologia occorre esprimerli in maniera esplicita,
METODI DI RAPPRESENTAZIONE TECNICA
1 PerfectFit06 Sistema di personalizzazione dei contenuti per gli scavi archeologici di Ercolano Candidato: Vincenzo Scognamiglio Relatore: Prof. Ernesto.
DAL WEB AL SEMANTIC WEB Aspetti teorici e tecnologici Carmagnola Francesca Dipartimento Informatica C.so Svizzera 185, Torino
Ontologie e World Wide Web: la diffusione della conoscenza.
A.P. cat. B - 1 Per chi vuole: Libro di testo D.P. Curtis, K. Foley, K. Sen, C. Morin Informatica di base 2° edizione Mc Graw-Hill Companies.
1 Semantic Web Docente: Federica Cena Dipartimento Informatica
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Transcript della presentazione:

Metodi e strumenti per l’annotazione semantica Nunzia Osimi Tesista di Informatica presso il LEKS-CNR 14 Novembre 2003

Indice Introduzione al Web Semantico Interoperabilità e ontologie L’annotazione semantica Criteri di classificazione delle AS Alcuni tool per l’annotazione semantica Conclusioni

Semantic Web: Motivazioni Intento Originale: rendere la semantica delle informazioni accessibile agli elaboratori Nel web attuale: necessario l’intervento umano per comprendere il contenuto di risorse Obiettivo: rendere l’informazione “machine-understandable” Soluzione: Utilizzare i metadati Passo successivo: Interoperabilità Semantica combinare informazioni provenienti da sorgenti diverse ai fini di realizzare: estrazione intelligente, cioè semantica (“Smart” retrieval) Scambio di informazioni tra applicazioni software Web Services: ricerca e composizione di servizi

Come realizzare l’interoperabilità? Vocabolario controllato l’interoperabilità migliora se gli stessi termini sono usati per denotare gli stessi concetti Ontologie Elementi principali Un vocabolario controllato Relazioni tassonomiche tra concetti Altre relazioni tra concetti

Cos’è un’ ontologia? Definizioni “…an explicit specification of a conceptualization” (Gruber) “…a formal specification of a shared conceptualization” (Borst) “explicit” i tipi di concetti utilizzati e i vincoli su di essi sono definiti in modo esplicito. “formal” definita in un ling. formale. “shared” la conoscenza rappresentata in un’ontologia non è scaturita dalla decisione di un singolo individuo, ma è riconosciuta da una collettività. “conceptualization“ perchè un’ ontologia identifica i concetti rilevanti di un dominio applicativo stabilito.

Generalità sulle ontologie Come costruire un ontologia? Nominando una commissione ad hoc … ma è necessaria una metodologia Ad esempio, il Dublin Core ha impiegato anni per enucleare 15 elementi metadato principali. approccio “Darwiniano” : l’ontologia migliore/la più popolare prevale Come combinazione di standard officiali e de-facto Sono in corso progetti per la def. di “upper ontology” le Ontologie consentono deduzioni (reasoning) Ciò permette di spostarsi dall’elaborazione della “sintassi” a quella della “semantica” . ma: da dove scaturiscono i “dati semantici”? Semantic Annotation

Annotazioni Semantiche Sono informazioni semantiche associate a risorse web. Perché si usano? Per arricchire il contenuto informativo dei documenti Per esprimere in maniera formale, il significato di : Porzione di testo in un documento Web service Strutture dati coinvolte in un processo di collaborazione (interoperabilità tra applicazioni software)

Knowledge Resource Management Ontologia The Internet Utenti Meta-KR KR: Knowledge Resources

Criteri per classificare le annotazioni Livello di formalità del linguaggio usato Posizionamento dell’annotazione Destinatario dell’annotazione Tipo di risorsa annotata Livello di restrizione imposto sul linguaggio. Modalità di annotazione

Livello di formalità del linguaggio usato formale espressa in un linguaggio formale di rappresentazione della conoscenza Alcuni linguaggi RDF e RDFS: un framework per esprimere i metadati nel web DAML, DAML+OIL, OWL sono usati per la definizione di ontologie Permette di processare i dati senza l’intervento umano (machine understandable) informale Espressa in linguaggio naturale o in un linguaggio controllato Permette di aggiungere informazioni su documenti o risorse, fruibili da un utente umano

Esempio Esempio Annotazione Formale in RDF <Researcher rdf:about=“file:///C:\…\PagineHtml\Michele Missikoff.htm#Michele Missikoff"> <first_Name> Michele </first_Name> <last_Name> Missikoff </last_Name> <has_affiliation rdf:resource=“file:///C:\…\Michele Missikoff.htm#IASI - CNR"/> </Researcher> Esempio Annotazione Informale in linguaggio naturale Michele Missikoff un ricercatore dello IASI-CNR.

Posizionamento dell’annotazione Embedded inserita all’interno dello stesso documento annotato Attached Memorizzata separatamente, collegata al documento da un link. <html> … <annot> </html> annot <html> … </html>

Destinatario dell’annotazione Human user Ha lo scopo di fornire informazioni aggiuntive su una risorsa in questo caso l’annotazione in genere sarà poco formale probabilmente realizzata in linguaggio naturale Computer Ha lo scopo di esplicitare il significato di una risorsa in tal caso l’annotazione deve essere di tipo formale per poi essere processabile da una macchina

Tipo di risorsa annotata Annotazione di documenti Frammento di testo, pagina HTM, immagini, ecc. Annotazione di Web Services Esprimere cosa fa un servizio, descrivere i parametri di input e l’output Solitamente è di tipo formale Annotazione di strutture dati, processi,… coinvolti nello scambio di informazioni tra applicazioni software che cooperano Solitamente è di tipo formale, ontology-based

Livello di restrizione imposto al linguaggio Absence i termini del linguaggio possono essere usati senza vincoli Advised (consigliato…) si è liberi di scegliere se utilizzare o meno un glossario, un ontologia, (o anche parole chiavi) in alternativa al linguaggio naturale. Mandatory (vincolante) C’è l’obbligo di usare un glossario di riferimento o un ontologia (Annotazione Ontology-based)

Modalità di Annotazione NB. questa classificazione riguarda solo le SA Ontology-based Annotazione attraverso istanze di concetti L’annotazione consiste in Associazione di una istanza all’elemento annotato Valorizzazione delle proprietà che descrivono l’istanza Annotazione attraverso concetti Associazione di un concetto dell’ontologia all’elemento annotato Associazione di una composizione di concetti dell’ontologia (attraverso opportuni operatori) all’elemento annotato

Annotazione attraverso concetti Ontologia Annotazione attraverso concetti Person name Michele Missikoff è un <Researcher> ricercatore </Researcher> dello IASI CNR address Is a Is a Is a Student Researcher Annotazione attraverso istanze Faculty_Member <IDMicheleMissikoff> Michele Missikoff </IDMicheleMissikoff> è un ricercatore dello IASI CNR Instance of IDMicheleMissikoff

Classificazione di alcuni tool Formalità Posizionam Destinatar Risorsa Restriz. ElemAnn Ontomat Formale (DAML+ OIL) Embedded (nell’header) Computer Pg.html Ontology-based Istanze Mnm OIL, RDF) Attached Smore Formale (RDF, DAML+ OIL, OWL) Embedded (nell’header)/ (e-mail,Img.) Foto, mail, Advised ?? Annotea Infomale ------ Human user Absence Non O-B Cohse Doc/ Pg.html Concetti Melita Doc documenti Si Annotea Melita

Tool Analizzati Si è riuscito ad annotare con: Problemi : OntoMat-Annotizer Mnm Smore Problemi : Cohse (problemi d’istallazione) Melita (eseguibile non fornito)

Reserch funding Institution Esempio Has_affiliate Organization Person Has affiliation Is a Is a Is a Is a Is a Researcher Student Is a University Reserch funding Institution Faculty_Member Instance of Michele Missikoff Instance of IASI-CNR

Ontomat (caratteristiche generali) Visualizzazione dell’ontologia (in DAML+OIL) mediante albero Browser per l’esplorazione dell’ontologia e delle istanze Browser Html che visualizza le parti di testo annotate. Implementato in Java, permette l’estensione tramite plugin Le annotazioni avvengono mediante drag’n’drop

Ontomat Input : Output : ontologia (DAML+OIL) pagina html Pagina Html con annotazioni inserite nell’ header Istanze esportate (annotazione in DAML+OIL) Ontologia (DAML+OIL) Ontologia + Istanze (DAML+OIL).

Annotazione (istanza esportata da OntoMat) <rdf:RDF ... > <Research_Funding_Institution rdf:about="http://…\Michele Missikoff.htm#IASI-CNR"> <address> Viale Manzoni,30 </address> <country> Italy </country> <location> Rome </location> <name> IASI-CNR </name> <has_affiliate rdf:resource="http://…\Michele Missikoff.htm#Michele Missikoff"/> </Research_Funding_Institution> …

…esempio … <Researcher rdf:about="http://…\Michele Missikoff.htm#Michele Missikoff"> <first_Name> Michele </first_Name> <last_Name> Missikoff </last_Name> <has_affiliation rdf:resource="http://…\Michele Missikoff.htm#IASI-CNR"/> </Researcher> </rdf:RDF>

Pro e contro di OntoMat (1) Interfaccia User-friendly Chiara distinzione tra classi, attributi, relazioni e istanze Fornisce l’help on line (Wizard) Estendibile ad altri linguaggi tramite plugin.

Pro e contro di OntoMat (2) Impone vincoli sulla visualizzazione delle proprietà che descrivono una classe: una proprietà P può essere utilizzata per descrivere una istanza di una classe C, soltanto se C è stata definita attraverso un "restriction“ su P Non effettua reasoning: non gestisce in modo automatico l’inversa di una relazione L’importazione di “ontologia+istanze” non avviene in modo corretto: le istanze non vengono caricate automaticamente.

Mnm (caratteristiche generali) Browser Browser Html Browser dell’ontologia Mark-up del testo Apprendimento automatico (Amilcare) Annotazione semi-automatica

Mnm (I/O) Input: Output: ontologia in DAML/ DAML+OIL/ RDF Pagina Html. Base di conoscenza rappresentante l’annotazione del documento in DAML/ DAML+OIL/ RDF File “dummy” (proprietario) che mantiene il collegamento tra annotazione e documento.

Annotazione (base di conoscenza salvata con MNM) <rdf:RDF…. > <rdf:Description rdf:about='file:/…/MnM2/ KbCreated/Misha1.rdf#Michele Missikoff'> <rdf:type rdf:resource='file:/…/MnM2/Ontologies/ s_community.rdfs#Person'/> <NS0:name>Michele Missikoff</NS0:name> <NS0:worksAt>LEKS</NS0:worksAt> </rdf:Description> …

…esempio … <rdf:Description rdf:about='file:/…/MnM2/ KbCreated/Misha1.rdf#LEKS'> <rdf:type rdf:resource='file:/…/MnM2/Ontologies/ s_community.rdfs#Organisation'/> <NS0:title>Lab for Ent. Knowledge Systems </NS0:title> <NS0:location>IASI-CNR</NS0:location> </rdf:Description> </rdf:RDF>

Pro e contro di MNM (1) PRO La parte di testo annotata è facilmente riconoscibile perché evidenziata in diversi colori Possibilità di definire le annotazioni attraverso form o tramite selezione del testo Effettua Apprendimento automatico (Amilcare)

Pro e contro di MNM (2) CONTRO Struttura ontologia è poco intuitiva Presuppone conoscenza dell’ RDF da parte dell’utente Impone vincoli sulla visualizzazione delle proprietà che descrivono una classe: una proprietà P può essere utilizzata per descrivere una istanza di una classe C soltanto se C è stata dichiarata come dominio di P. OSS: OntoMat e MNM non interpretano l’ input allo stesso modo

Smore (caratteristiche generali) Fornisce Editor pagine html Fornisce un collegamento alle esistenti ontologie su Internet per renderle utilizzabili all’interno della propria web-page. Possibile creazione di una propria ontologia personalizzata costruibile a partire dall’esistenti (Editor di Ontologie)

Smore Input: Output ontologia in RDF, DAML, DAML+OIL, OWL Pagina html file dataset proprietario (.dat) (rappresentante la struttura usata per annotare) annotazione in RDF (è possibile salvare sia l’annotazione pura sia il documento con annotazione “embeded” nell’header)

Annotazione (file RDF salvato con Smore) <rdf:RDF … xmlns:personal1.0="http://www.cs.umd.edu/projects/plus/DAML/onts/personal1.0.daml#"> <personal1.0:Organization rdf:ID="LEKS"> <personal1.0:member> Michele Missikoff </personal1.0:member> </personal1.0:Organization> <personal1.0:Person rdf:ID="Michele_Missikoff"> </personal1.0:Person> </rdf:RDF> Si è perso il link all’istanza Michele Missikoff dell’ontologia

Pro e contro di Smore (1) PRO E’ necessaria una minima conoscenza della sintassi e dei termini del RDF da parte dell’utente. Unico tool esaminato che permette di annotare anche in OWL

Pro e contro di Smore (2) CONTRO Poco comprensibile come creare effettivamente le istanze di classi e le relazioni tra istanze definite a partire da una ontologia fissata Help in linea poco dettagliato, molte funzionalità rimangono oscure Poco stabile, genera eccezioni durante l’esecuzione

Conclusioni (1) Obiettivo di questo lavoro era trovare un tool che avesse le seguenti caratteristiche: Formale Machine-oriented Per annotare qualsiasi tipo di risorsa documenti, webServices, risorse coinvolte in un processo di interoperabilità tra applicazioni soft. Ontology-based Possibilità di annotare sia concetti che istanze Di facile utilizzo (anche da utente inesperto) Escluso OntoMat gli altri tool sono risultati poco stabili e poco user-friendly.

Conclusioni (2) Soluzioni possibili: Estendere OntoMat con Plugin per la gestione di OWL (lasciando comunque cosi’ irrisolta l’ annotazione attraverso concetti ) Creare una nuova applicazione che soddisfi tutte le esigenze elencate.

References (1) S. Bechhofer, C. Goble. Towards Annotation using DAML+OIL K-CAP 2001 workshop on Knowledge Markup and Semantic Annotation, Victoria B.C, October 2001. (COHSE) M. Denny. Ontology Building: A Survey of Editing Tools November 06, 2002 http://www.xml.comp/pub/a/2002/11/06/ontologies.html?pages=2 S. Handschuh, S. Staab, A. Mädche . CREAM - Creating relational metadata with a component-based, ontology driven annotation framework . K-CAP 2001 S. Handschuh, S. Staab, A. Maedche. An AnnotationFramework for the Semantic Web Karlsruhe, Germany 2001 M. Missikoff, F. Schiappelli, F.Taglino A Controlled Language for Semantic Annoatation and Interoperability in e-Business Application IASI-CNR (Italy) 2003 M. Missikoff F. Schiappelli. Semantic Annotation for Enterprises Interoperability IASI_CNR (Italy) 2003

References (2) M. Vargas-Vera, E. Motta, J. Domingue, M. Lanzoni, A. Stutt and F. Ciravegna. "MnM: Ontology Driven Semi-Automatic and Automatic Support for Semantic Markup",The 13th International Conference on Knowledge Engineering and Management (EKAW 2002), ed Gomez-Perez, A., Springer Verlag, 2002. M. Vargas-Vera, E. Motta, J. Domingue, M. Lanzoni, A. Stutt and F. Ciravegna. "MnM: Ontology Driven Tool for Semantic Markup", European Conference on Artificial Intelligence (ECAI 2002). In proceedings of the Workshop Semantic Authoring, Annotation & Knowledge Markup (SAAKM 2002). Lyon France, July 22-23, 2002. M. Vargas-Vera, J. Domingue, E. Motta, S. Buckingham Shum and M. Lanzoni. "Knowledge Extraction by using an Ontology-based Annotation Tool“. In proceedings of the Workshop Knowledge Markup & Semantic Annotation, K-CAP'01, Victoria Canada, October 2001. A. Wolff, Z. Zdrahal, Z. Kouba. Tools for Personalised Annoatation and Organization of Diverse Web Resources KMI WWW.semanticweb.org