Annotazione Semantica di risorse Web basata su ontologie di dominio

Slides:



Advertisements
Presentazioni simili
1 Tutto su liceoclassicojesi.it 1° Incontro sulla gestione di liceoclassicojesi.it.
Advertisements

Unità D2 Database nel web. Obiettivi Comprendere il concetto di interfaccia utente Comprendere la struttura e i livelli che compongono unapplicazione.
Francesco Cristofoli Microsoft Italia
Consumare Web Service Andrea Saltarello
Corsi per il personale Bicocca-Insubria
Java Enterprise Edition (JEE)
Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio.
Università degli Studi di Modena e Reggio Emilia
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
1 Tavolo del Patto per la crescita intelligente, sostenibile e inclusiva Il ricorso agli ammortizzatori sociali nei territori colpiti dagli eventi sismici.
Training On Line – CONA. 2 Richiesta Da Menu: Conferimenti ad inizio anno termico > Agosto > Annuali > Nuova Richiesta Si accede alla pagina di Richiesta.
Training On Line - Report. 2 Report storico Da menu: Reportistica -> Report storico Si accede alla pagina di selezione del report storico.
1 Scoprire e capire HTML Creare semplici pagine WEB Maria Laura Alessandroni.
Implementazione dell algortimo di Viterbi attraverso la soluzione del problema di cammino mi- nimo tramite software specifico. Università degli studi di.
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Algoritmi e Strutture Dati Capitolo 2 Modelli di calcolo e metodologie.
1 Il servizio di prestito e fornitura documenti ILL-SBN una visione di insieme caratteristiche della procedura illustrazione delle funzionalità
eliana minicozzi linguaggi1a.a lezione2
1 Anatomia di una pagina Un insieme di pagine web hanno generalmente una parte invariante (o poco): header, navigazione, footer una parte variabile: contenuti.
Corso di Informatica per Giurisprudenza Lezione 5
Seminari di ingegneria del software
Metodi e strumenti per l’annotazione semantica
Riconoscimento automatico di oggetti in immagini digitali
Laboratorio di Informatica
Cercare informazioni sul Web. 5-2 Organizzazione dellinformazione tramite gerarchie Classificazione gerarchica Linformazione è raggruppata in un piccolo.
DHTML: Modello degli Eventi 1. 2 Sommario Introduzione Evento onclick Evento onload Gestione errori con onerror Gestione mouse con levento onmousemove.
XML e la generazione di cataloghi multimediali F. Garzotto, L. Mainetti, P. Paolini Politecnico di Milano HOC - Hypermedia Open Center Dipartimento di.
Metodologie di Annotazione Semantica per la Rappresentazione della Conoscenza nellambito dei Beni Culturali Paola Velardi Dipartimento di Informatica Università
Labortaorio informatica 2003 Prof. Giovanni Raho 1 INFORMATICA Termini e concetti principali.
1ROL - Richieste On Line Ente pubblico 5ROL - Richieste On Line.
Progettazione multimediale
Descrizione Semantica ad Alto Livello di Ambienti Virtuali in X3D
Test Reti Informatiche A cura di Gaetano Vergara Se clicchi sulla risposta GIUSTA passi alla domanda successiva Se clicchi sulla risposta ERRATA passi.
ISOIVA (LOCALE) TO ISOIVA (WEB) RIPARTIZIONE INFORMATICA UFFICIO APPLICATIVI AMMINISTRATIVI 13/04/2011 UNIVERSITÀ DEGLI STUDI DI FERRARA 1.
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
CORSO AVANZATO INFORMATICA
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
A cosa serve GWAESSE? E’ un software di semplice utilizzo per la configurazione e la preventivazione di quadri AS (per moli e campeggi), ASC (per cantiere)
QUIZ – PATENTE EUROPEA – ESAME WORD
La versione 18 di Aleph500: le novità CATALOGAZIONE Rita Vanin Ottobre 2007.
Fondamenti delle Reti di Computer Seconda parte Carasco 15/04/2010.
1 Ripassino Reti di Computer Carasco 19/02/ Che cosa è una rete informatica? Una rete informatica è un insieme di computer connessi tra di loro.
Tesi di Laurea in Ingegneria Informatica
Multimedia Information Retrieval
La nuova “visione” del web: il Web Semantico
Il World Wide Web Lidea innovativa del WWW è che esso combina tre importanti e ben definite tecnologie informatiche: Documenti di tipo Ipertesto. Sono.
Everywhere Takeaway Progetto di SSCSWeb A.A. 2011/2012.
Everywhere Takeaway Progetto di SSCSWeb A.A. 2011/2012.
Everywhere Takeaway Progetto di SSCSWeb A.A. 2011/2012.
Everywhere Takeaway Progetto di SSCSWeb A.A. 2011/2012 V. Costamagna, F. Dotta, F. Barbano, L. Violanti, Oltikuka.
Everywhere Takeaway Progetto di SSCSWeb A.A. 2011/2012.
Documentazione Tecnica
Bando di Residenza Cap Scheda ENTE 3ROL - Richieste On Line.
USO DEL COMPUTER E GESTIONE DEI FILE
Bando Valorizzazione a rete. 2ROL - Richieste On Line Pittori e scultori.
Modulo 6 Test di verifica
1 Ontology languages. Strato dei modelli LA SCELTA DEL LINGUAGGIO Una volta selezionati i componenti dell’ontologia occorre esprimerli in maniera esplicita,
METODI DI RAPPRESENTAZIONE TECNICA
DAL WEB AL SEMANTIC WEB Aspetti teorici e tecnologici Carmagnola Francesca Dipartimento Informatica C.so Svizzera 185, Torino
1 Sharpdesk Descrizione generale Editoria ComposerRicerca Elaborazione immagini.
A.P. cat. B - 1 Per chi vuole: Libro di testo D.P. Curtis, K. Foley, K. Sen, C. Morin Informatica di base 2° edizione Mc Graw-Hill Companies.
1 Microsoft Access Gruppo di lavoro Alberti, Boldi, Gaito, Grossi, Malchiodi, Mereghetti, Morpurgo, Rosti, Palano, Zanaboni Informatica per laurea triennale.
1 Semantic Web Docente: Federica Cena Dipartimento Informatica
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Internet e HTML Diffusione di informazioni mediante la rete Internet.
Università degli Studi di Pavia
Eprogram informatica V anno. ASP.NET Introduzione ASP.NET (Active Server Page) è il linguaggio che, sfruttando la tecnologia.NET, permette di: -scrivere.
Siti Web Elementi di base per la costruzione di siti web.
SISTEMI DIDATTICI PER L’ E- LEARNING
Transcript della presentazione:

Annotazione Semantica di risorse Web basata su ontologie di dominio

Syllabus Il Semantic web e i sistemi di annotazione Stato dell’arte Analisi delle metodologie di annotazione: criteri di classificazione Alcuni strumenti di annotazione basati su ontologie

Semantic web e annotazioni semantiche Il Semantic Web: rendere i dati “machine-understandable”  soluzione: esprimere in modo formale il contenuto informativo di risorse web In che modo? Attraverso l’ annotazione semantica Cos’è un ’annotazione semantica: Un’annotazione semantica esprime informazioni semantiche associate a risorse web. Un’ annotazione basata su ontologie esprime in modo formale il significato di una risorsa web o di una porzione di essa, utilizzando la terminologia fornita da un’ Ontologia di Riferimento (RO)

Esempio: semplice annotazione Risorsa da annotare Ontologia di riferimento Accommodation Services Hotel Internatinal situato a SBT A 500 mt dal mare. dotato di piscina, ristorante… Il Sea View è una scelta per il turista che ha bisogno di riposare … Hotel Swimming pool Inn Manor-House

Stato dell’arte Analisi delle metodologie di annotazione: criteri di classificazione Alcuni strumenti di annotazione basati su ontologie

Criteri per classificare le annotazioni: Tipo di risorsa annotata (Documenti / webServices / schemi di dati/ processi) Destinatario dell’annotazione (Human User/ Computer) Posizionamento dell’annotazione (Attached/Embedded) Livello di formalità del linguaggio usato (formale/informale) Livello di restrizione terminologica imposta sul linguaggio (absence, advised, mandatory) Annotazione attraverso: istanze/concetti

1. Tipo di risorsa annotata Cosa annotare? Annotazione di documenti Frammento di testo, pagina HTML, immagini, ecc. Annotazione di Web Services I servizi web sono associati a descrizioni in un linguaggio formale (es. WSDL) dei parametri di input e output necessari ad usufruire di un certo servizio (es. prenotazione on-line). Queste descrizioni possono essere annotate. Annotazione di schemi di dati, processi,… E’ possibile annotare dati e processi coinvolti nello scambio di informazioni tra applicazioni software che cooperano

Esempio: annotare Web Services Use of ontologies enables shared understanding between the service provider and service requestor

Esempio: Annotare documenti SCHEDA REF 820 TITOLO Discorso/ORAL_COMMUNICATION di Raffaello Lambruschini/PEDAGOGIST in occasione dell’adunanza/MEETING tenuta in onore di Vincenzo Gioberti/PHYLOSOPHER DESCRIZIONE / Raffaello Lambruschini. - [documento manoscritto]. - 5 luglio 1853. - 8 c. AUTORE Lambruschini, Raffaello INVENTARIO 58671 COLLOCAZIONE Busta 81.1394 NOTA Pubbl. in Atti, C. 31, 1853, p. 344. KEYWORDS Accademia dei Georgofili STUDIOSO FILOSOFO PEDAGOGO COMUNICAZIONE_ORALE COMUNICAZIONE RELAZIONE_SOCIALE INCONTRO GRUPPO_SOCIALE GRUPPO Vincenzo Gioberti Raffaello Lambruschini discorso adunanza

Esempio: annotare dati Studente Corso Età learner person education activity property

Esempio: annotare oggetti multimediali (MadCow)

2. Destinatario dell’annotazione Utente umano L’annotazione ha lo scopo di fornire informazioni aggiuntive su una risorsa in questo caso l’annotazione in genere sarà poco formale probabilmente realizzata in linguaggio naturale Computer Ha lo scopo di esplicitare il significato di una risorsa in tal caso l’annotazione deve essere di tipo formale per poi essere processabile da una macchina

3. Posizionamento dell’annotazione Embedded inserita all’interno dello stesso documento annotato Attached Memorizzata separatamente, collegata al documento da un link. <html> … <annot> </html> annot <html> … </html>

4. Livello di formalità del linguaggio di annotazione usato formale espressa in un linguaggio formale di rappresentazione della conoscenza Alcuni linguaggi RDF e RDFS: un framework per esprimere i metadati nel web DAML, DAML+OIL, OWL sono usati per la definizione di ontologie Permette di elaborare i dati senza l’intervento umano (machine understandable) informale Espressa in linguaggio naturale o in un linguaggio controllato Permette di aggiungere informazioni su documenti o risorse, fruibili da un utente umano Esempio Annotazione Formale <Hotel rdf:about=“file:///C: \PagineHtml\prolocoSbt\alberghi.htm #Pierrot"> <Name> Pierrot</Name> <is_situated rdf:resource=“file:///C:\…\prolocoSbt\alberghi.htm #S.Benedetto"/> <has_service rdf:resource=“file:///C:\…\prolocoSbt\alberghi.htm #Piscina"/> </Hotel> Esempio Annotazione Informale in linguaggio naturale Descrizione caratteristiche hotel… Il Pierrot, posto piacevole ed accogliente per soggiornare, si trova sul lungomare di S.Benedetto. E’ dotato di piscina.. …

5. Livello di restrizione imposto al linguaggio Absence (nessuno) Non ci sono restrizioni sull’utilizzo del linguaggio (i termini del linguaggio possono essere usati senza vincoli) Advised (consigliato) È possibilie annotare utilizzando o meno i termini di un glossario, di un ontologia, parole chiavi in alternativa al linguaggio naturale. Mandatory (imposto) L’annotazione può essere costituita utilizzando esclusivamente termini definiti in un glossario o un un’ontologia di riferimento (Annotazione Ontology-based)

6. Modalità di Annotazione NB. questa classificazione riguarda solo le annotazioni Ontology-based Annotazione attraverso istanze “ontologiche” L’annotazione consiste in Associazione di una istanza all’elemento annotato Valorizzazione delle proprietà che descrivono l’istanza Annotazione attraverso concetti dell’ontologia Associazione di un concetto dell’ontologia all’elemento annotato Associazione di una composizione di concetti dell’ontologia (attraverso opportuni operatori) all’elemento annotato

Nota: Istanza: un individuo della classe descritta da un concetto (es: “Pierrot” è un’istanza della classe Hotel, “Paola Velardi” è un’istanza della classe Professori_di_Informatica) Concetto: una astrazione che rappresenta le proprietà comuni di insiemi di istanze

Ontologia Accommodation Annotazione attraverso concetti Il <Hotel> Pierrot </Hotel> situato a SBT a 500 mt dal mare. dotato di piscina, ristorante… Accommodation name address Is a Is a Inn Hotel Nota: es. di annot. Embedded O.B Instance of Annotazione attraverso istanze Il <IDPierrot> Pierrot </IDPierrot> situato a SBT a 500 mt dal mare. dotato di piscina, ristorante… <IDPierrot>

Annotazioni complesse Una risorsa (documento multimediale, servizio web, base di dati o processo) possono essere annotati semanticamente associando all’intera risorsa o a frammenti di essa un concetto dell’ontologia, oppure un’istanza Tuttavia sono possibili annotazioni più complesse: ad esempio, posso associare alla descrizione di un hotel una espressione formale (ad esempio usando linguaggi logici) che sia una composizione di più concetti, ad esempio: beachhotel In un’ontologia infatti non è opportuno generare concetti singoli per ogni possibile caratterizzazione di un concetto più generale (es hotel-sul-mare, hotel-di-montagna, ecc.)

Un esempio di processo di annotazione complessa Risorsa da annotare Doc Annotazione Link Costruzione dell’espr. di Annot. AnnotExp (OWL) Hotel_With_Swimming pool RO Hotel Inn Manor-House Accommodation Il Pierrot, posto piacevole ed accogliente per soggiornare, si trova sul lungomare di S.Benedtto. E’ dotato di piscina… Swimming pool Services Costruzione dell’espressione di annotazione: Concetto esistente nell’ontologia di riferimento (RO) Nuovo concetto (composizione di elementi in RO) Associazione dell’annotazione alla risorsa hotel(x)swimming_pool(y)  has(x,y)

Una survey degli strumenti per l’annotazione di risorse web

Tool presi in considerazione Principali tool Ontology-based, annotazione di documenti testuali Ontomat Mnm Smore Cohse Trellis Melita Kim Shoe Altri tool Semantic Word (annotazione di documenti Word in Daml+oil) Gate (annotazione in NPL) Annotea (non onotogy-based) Yavas (non onotlogy-based) Semantic murk-up plugin…

Strumenti di Annotazione automatici o semi-automatici Strumenti di annotazione disponibili: 1) per costruire ontologie e realizzare una annotazione Automatica 2) per annotazione manuale basate su Referece Ontology Strumenti di Annotazione automatici o semi-automatici Si parte da archivi testuali annotati manualmente Algoritmi di Information Extraction (IE) e/o word sense disambiguation a partire da tali corpora di testi apprendono regole per l’estrazione di informazioni da altri documenti (es. Melita). Le regole derivate da questo processo possono essere usate per popolare un’ ontologia usata poi per annotare. L’annotazione può, da questo momento in poi, essere automatica o semi-automatica (semi-automatica se richiede conferma o correzione da parte di un umano) Strumenti di Annotazione Manuale basata su Reference Ontology Lo scopo di tale annotazione è di “spiegare” il contenuto delle risorse rispetto ad un ontologia stabilita, eventualmente anche componendo più concetti della RO (esempio: Ontomat)

Ontomat (Univ. of Karlsruhe, Germany) Applicazione java (stand-alone) Permette la visualizzazione tree-like di ontologie nel linguaggio DAML+OIL Ha un browser per l’esplorazione dell’ontologia e delle istanze e un browser Html che visualizza le parti di testo annotate. Implementato in Java, fornisce delle API d’interfaccia per l’estensione tramite plugin. Le annotazioni avvengono mediante drag’n’drop (si seleziona una porzione del documento e si trascina un concetto o istanza) Input : ontologia in DAML+OIL pagina html Output : Pagina Html con annotazioni inserite nell’ header Istanze esportate (DAML+OIL) Ontologia (DAML+OIL) Ontologia + Istanze.

Esempio

MnM (KMI The open University , Dep. of CS University of Sheffield. UK) Applicazione java (stand-alone) Fornito di browser Browser Html Browser dell’ontologia Si basa su un algoritmo di apprendimento automatico (Amilcare) Annotazione semi-automatica Input: ontologia in DAML/ DAML+OIL/ RDF Pagina Html Output: Le annotazioni prodotte sono Embedded: in un file xml copia della pagina html annotata (utilizzata da Amilcare per IE) Attached: un file espresso nello stesso formato dell’ontologia usata per annotare. Il collegamento con il file originale è realizzato tramite un ulteriore file espresso in un formato proprietario (con estensione “.dymmy”).

Esempio

Smore (University of Mariland) Applicazione java di (stand-alone) Fornisce Editor pagine html Editor di Ontologie (fornisce un collegamento alle esistenti ontologie su Internet per renderle utilizzabili all’interno della propria web-page) L’utente può classificare semanticamente il proprio insieme di dati con cui annotare, cioè marcare le frasi del documento in base al modello base Soggetto-predicato-oggetto. Input: Reference Ontology espressa in RDF, DAML, DAML+OIL, OWL Documento: Pagina html Output File dataset rappresentate l’ontologia + istanze utilizzate per annotare annotazione in RDF, DAML… (è possibile salvare sia l’annotazione pura, sia il documento con annotazione “embedded” nell’header) Nota. E’ necessaria una minima conoscenza della sintassi e dei termini del RDF da parte dell’utente.

Esempio

Cohse (Depart. of C. S. Univ .of Manchester UK) E’un plug-in di Mozilla, (barra delle applicazioni aggiuntiva) E’ possibile navigare la RO utilizzando l’interfaccia fornita da OilEd, editor di ontologie in DAML+OIL OilEd è sviluppato in Java, i componenti dell’interfaccia sono stati riusati dall’annotatore. Permette di scegliere un concetto in RO o di costruirne uno per composizione Permette di evidenziare porzioni di testo Annota attraverso concetti, lega le istanze ai concetti dell’ontologia attraverso il connettivo istanceOf Input: RO: DAML+OIL documenti html Output: annotazione formale il DAML*OIL Annotazione attached utilizzando Xpointer

Esempio Interfaccia di OilEd per navigare la RO

Melita (Depart. of C. S. Univ. of Sheffield. UK) Melita è un dimostratore di annotazioni ontology-based Applicazione client-server Apprendimento automatico (Amilcare) Le annotazioni sono graficamente presentate in modi differenti in base al processo che le ha definite: annotazione manuale (definite da un utente) annotazioni automatica (suggerita da Amilcare) l’utente può scegliere quale mantenere tra le due Intput RO:.sce (formato Amilcare), .ont (formato proprietario, di tipo logico Documenti testuali Output: File Xml Contenente tutte le annotazioni riguardanti un documenti annotati da un utente .

Esempio Luoghi Unità temporali

Kim (Ontotext Lab, Sirma AI, Bulgaria) E’ un plugin Internet Explorer. Prevede apprendimento automatico basato sul sistema Gate (utilizzato per la creazione di annotazioni a partire da linguaggio naturale) Le annotazioni sono memorizzate sul server e rese disponibili per realizzare “recupero intelligente” di informazioni Input: RO espressa in RDF(S) OWL lite / o tassonomia Documenti in formato txt, html, xml Ouput l'annotazione è attacched

Esempio Date Nomi propri complessi

Classificazione dei tools esaminati rispetto ai criteri visti Risorsa Destinat. Posizionamento Formalità Restriz. term. ElemAnn. Sviluppato presso Ontomat Html Computer Embedded (nell’header) Formale (DAML+OIL) Ontology-based Istanze Univ. of Karlsruhe, Germany Mnm Embedded (file XML), Attached tramite (file propr.) Formale (DAML+OIL, RDF) KMI The open Un. - Depart. of CS Univ. of Sheffield. UK Smore Foto, mail, html Embedded (header) / (e-mail, Img.) Formale (RDF, DAML+OIL, OWL) Advised --- University of Mariland Cohse Doc/ html Attached (Xpointer) DAML+OIL Concetti Depart. of CS Univ .of Manchester UK Trellis Formale (OWL) USC Information Science Institute Melita attached (file XML) (formato proprietario) Ontology-based (.ont .sce) Kim Txt,Html, xml Attacched (inserite in RO) Advised RO oppure tassonomia Ontotext Lab, Sirma AI, Bulgaria Annotea Html/xml Human user (XPointer) Informale: formattati RDF/XML ??? W3C INRIA Rhône-Alpes W3C MIT/LCS