La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

1 Annotazione Semantica di risorse Web basata su ontologie di dominio.

Presentazioni simili


Presentazione sul tema: "1 Annotazione Semantica di risorse Web basata su ontologie di dominio."— Transcript della presentazione:

1 1 Annotazione Semantica di risorse Web basata su ontologie di dominio

2 2 Syllabus Il Semantic web e i sistemi di annotazione Stato dellarte –Analisi delle metodologie di annotazione: criteri di classificazione –Alcuni strumenti di annotazione basati su ontologie

3 3 Semantic web e annotazioni semantiche Il Semantic Web: rendere i dati machine-understandable soluzione: esprimere in modo formale il contenuto informativo di risorse web annotazione semanticaIn che modo? Attraverso l annotazione semantica Cosè un annotazione semantica: –Unannotazione semantica esprime informazioni semantiche associate a risorse web. basata su ontologie –Un annotazione basata su ontologie esprime in modo formale il significato di una risorsa web o di una porzione di essa, utilizzando la terminologia fornita da un Ontologia di Riferimento (RO)

4 4 Hotel Internatinal situato a SBT A 500 mt dal mare. dotato di piscina, ristorante… Esempio: semplice annotazione Ontologia di riferimento Hotel InnManor-House AccommodationServices Swimming pool Il Sea View è una scelta per il turista che ha bisogno di riposare … Risorsa da annot are

5 5 Stato dellarte Analisi delle metodologie di annotazione: criteri di classificazione Alcuni strumenti di annotazione basati su ontologie

6 6 Criteri per classificare le annotazioni: Tipo di risorsa annotata (Documenti / webServices / schemi di dati/ processi) Destinatario dellannotazione (Human User/ Computer) Posizionamento dellannotazione (Attached/Embedded) Livello di formalità del linguaggio usato (formale/informale) Livello di restrizione terminologica imposta sul linguaggio (absence, advised, mandatory) Annotazione attraverso: istanze/concetti

7 7 1. Tipo di risorsa annotata Cosa annotare? Annotazione di documenti –Frammento di testo, pagina HTML, immagini, ecc. Annotazione di Web Services –I servizi web sono associati a descrizioni in un linguaggio formale (es. WSDL) dei parametri di input e output necessari ad usufruire di un certo servizio (es. prenotazione on-line). Queste descrizioni possono essere annotate. Annotazione di schemi di dati, processi,… –E possibile annotare dati e processi coinvolti nello scambio di informazioni tra applicazioni software che cooperano

8 8 Esempio: annotare Web Services Use of ontologies enables shared understanding between the service provider and service requestor

9 9 Esempio: Annotare documenti SCHEDA REF820 TITOLO Discorso/ ORAL_COMMUNICATION di Raffaello Lambruschini/ PEDAGOGIST in occasione delladunanza/ MEETING tenuta in onore di Vincenzo Gioberti/ PHYLOSOPHER DESCRIZIONE/ Raffaello Lambruschini. - [documento manoscritto]. - 5 luglio c. AUTORELambruschini, Raffaello INVENTARIO58671 COLLOCAZIONEBusta NOTAPubbl. in Atti, C. 31, 1853, p KEYWORDSAccademia dei Georgofili STUDIOSO FILOSOFO PEDAGOGO COMUNICAZIONE_ORALE COMUNICAZIONE RELAZIONE_SOCIALE INCONTRO GRUPPO_SOCIALE GRUPPO Vincenzo Gioberti Raffaello Lambruschini discorso adunanza

10 10 Esempio: annotare dati StudenteCorso Età learner person education activity property

11 11 Esempio: annotare oggetti multimediali (MadCow)

12 12 2. Destinatario dellannotazione Utente umano –Lannotazione ha lo scopo di fornire informazioni aggiuntive su una risorsa –in questo caso lannotazione in genere sarà poco formale probabilmente realizzata in linguaggio naturale Computer –Ha lo scopo di esplicitare il significato di una risorsa –in tal caso lannotazione deve essere di tipo formale per poi essere processabile da una macchina

13 13 3. Posizionamento dellannotazione Embedded –inserita allinterno dello stesso documento annotato Attached –Memorizzata separatamente, collegata al documento da un link. … … … annot

14 14 4. Livello di formalità del linguaggio di annotazione usato formale –espressa in un linguaggio formale di rappresentazione della conoscenza –Alcuni linguaggi RDF e RDFS: un framework per esprimere i metadati nel web DAML, DAML+OIL, OWL sono usati per la definizione di ontologie –Permette di elaborare i dati senza lintervento umano (machine understandable) informale –Espressa in linguaggio naturale o in un linguaggio controllato –Permette di aggiungere informazioni su documenti o risorse, fruibili da un utente umano Esempio Annotazione Formale Pierrot Esempio Annotazione Informale in linguaggio naturale Descrizione caratteristiche hotel… Il Pierrot, posto piacevole ed accogliente per soggiornare, si trova sul lungomare di S.Benedetto. E dotato di piscina.. …

15 15 5. Livello di restrizione imposto al linguaggio Absence (nessuno) –Non ci sono restrizioni sullutilizzo del linguaggio (i termini del linguaggio possono essere usati senza vincoli) Advised (consigliato) –È possibilie annotare utilizzando o meno i termini di un glossario, di un ontologia, parole chiavi in alternativa al linguaggio naturale. Mandatory (imposto) –Lannotazione può essere costituita utilizzando esclusivamente termini definiti in un glossario o un unontologia di riferimento (Annotazione Ontology- based)

16 16 6. Modalità di Annotazione NB. questa classificazione riguarda solo le annotazioni Ontology-based –Annotazione attraverso istanze ontologiche Lannotazione consiste in Associazione di una istanza allelemento annotato Valorizzazione delle proprietà che descrivono listanza –Annotazione attraverso concetti dellontologia Lannotazione consiste in –Associazione di un concetto dellontologia allelemento annotato –Associazione di una composizione di concetti dellontologia (attraverso opportuni operatori) allelemento annotato

17 17 Nota: Istanza: un individuo della classe descritta da un concetto (es: Pierrot è unistanza della classe Hotel, Paola Velardi è unistanza della classe Professori_di_Informatica) Concetto: una astrazione che rappresenta le proprietà comuni di insiemi di istanze

18 18 Inn Accommodation Hotel Is a Instance of Il Pierrot situato a SBT a 500 mt dal mare. dotato di piscina, ristorante… Il Pierrot situato a SBT a 500 mt dal mare. dotato di piscina, ristorante… name address Ontologia Annotazione attraverso concetti Annotazione attraverso istanze Nota: es. di annot. Embedded O.B

19 19 Annotazioni complesse Una risorsa (documento multimediale, servizio web, base di dati o processo) possono essere annotati semanticamente associando allintera risorsa o a frammenti di essa un concetto dellontologia, oppure unistanza Tuttavia sono possibili annotazioni più complesse: ad esempio, posso associare alla descrizione di un hotel una espressione formale (ad esempio usando linguaggi logici) che sia una composizione di più concetti, ad esempio: beach hotel In unontologia infatti non è opportuno generare concetti singoli per ogni possibile caratterizzazione di un concetto più generale (es hotel-sul-mare, hotel-di-montagna, ecc.)

20 20 Costruzione dellespressione di annotazione: 1.Concetto esistente nellontologia di riferimento (RO) 2.Nuovo concetto (composizione di elementi in RO) Associazione dellannotazione alla risorsa Un esempio di processo di annotazione complessa Risorsa da annot are Doc Annotazione Link Costruzione dellespr. di Annot. AnnotExp (OWL) Hotel_With_Swimming pool RO Hotel InnManor-House Accommodation Il Pierrot, posto piacevole ed accogliente per soggiornare, si trova sul lungomare di S.Benedtto. E dotato di piscina… Swimming pool Services hotel(x) swimming_pool(y) has(x,y)

21 21 Una survey degli strumenti per lannotazione di risorse web

22 22 Tool presi in considerazione Principali tool Ontology-based, annotazione di documenti testuali –Ontomat –Mnm –Smore –Cohse –Trellis –Melita –Kim –Shoe Altri tool –Semantic Word (annotazione di documenti Word in Daml+oil) –Gate (annotazione in NPL) –Annotea (non onotogy-based) –Yavas (non onotlogy-based) –Semantic murk-up plugin…

23 23 Strumenti di annotazione disponibili: 1) per costruire ontologie e realizzare una annotazione Automatica 2) per annotazione manuale basate su Referece Ontology –Strumenti di Annotazione automatici o semi-automatici Si parte da archivi testuali annotati manualmente Algoritmi di Information Extraction (IE) e/o word sense disambiguation a partire da tali corpora di testi apprendono regole per lestrazione di informazioni da altri documenti (es. Melita). Le regole derivate da questo processo possono essere usate per popolare un ontologia usata poi per annotare. Lannotazione può, da questo momento in poi, essere automatica o semi-automatica (semi-automatica se richiede conferma o correzione da parte di un umano) –Strumenti di Annotazione Manuale basata su Reference Ontology Lo scopo di tale annotazione è di spiegare il contenuto delle risorse rispetto ad un ontologia stabilita, eventualmente anche componendo più concetti della RO (esempio: Ontomat)

24 24 Ontomat (Univ. of Karlsruhe, Germany) Applicazione java (stand-alone) Permette la visualizzazione tree-like di ontologie nel linguaggio DAML+OIL Ha un browser per lesplorazione dellontologia e delle istanze e un browser Html che visualizza le parti di testo annotate. Implementato in Java, fornisce delle API dinterfaccia per lestensione tramite plugin. Le annotazioni avvengono mediante dragndrop (si seleziona una porzione del documento e si trascina un concetto o istanza) Input : – ontologia in DAML+OIL – pagina html Output : –Pagina Html con annotazioni inserite nell header –Istanze esportate (DAML+OIL) –Ontologia (DAML+OIL) –Ontologia + Istanze.

25 25 Esempio

26 26 MnM (KMI The open University, Dep. of CS University of Sheffield. UK) Applicazione java (stand-alone) Fornito di browser –Browser Html –Browser dellontologia Si basa su un algoritmo di apprendimento automatico (Amilcare) Annotazione semi-automatica Input: –ontologia in DAML/ DAML+OIL/ RDF –Pagina Html Output: –Le annotazioni prodotte sono Embedded: in un file xml copia della pagina html annotata (utilizzata da Amilcare per IE) Attached: un file espresso nello stesso formato dellontologia usata per annotare. Il collegamento con il file originale è realizzato tramite un ulteriore file espresso in un formato proprietario (con estensione.dymmy).

27 27 Esempio

28 28 Smore (University of Mariland) Applicazione java di (stand-alone) Fornisce Editor pagine html Editor di Ontologie (fornisce un collegamento alle esistenti ontologie su Internet per renderle utilizzabili allinterno della propria web-page) Lutente può classificare semanticamente il proprio insieme di dati con cui annotare, cioè marcare le frasi del documento in base al modello base Soggetto-predicato-oggetto. Input: –Reference Ontology espressa in RDF, DAML, DAML+OIL, OWL –Documento: Pagina html Output –File dataset rappresentate lontologia + istanze utilizzate per annotare –annotazione in RDF, DAML… (è possibile salvare sia lannotazione pura, sia il documento con annotazione embedded nellheader) Nota. E necessaria una minima conoscenza della sintassi e dei termini del RDF da parte dellutente.

29 29 Esempio

30 30 Cohse ( Depart. of C. S. Univ.of Manchester UK ) Eun plug-in di Mozilla, (barra delle applicazioni aggiuntiva) E possibile navigare la RO utilizzando linterfaccia fornita da OilEd, editor di ontologie in DAML+OIL –OilEd è sviluppato in Java, i componenti dellinterfaccia sono stati riusati dallannotatore. –Permette di scegliere un concetto in RO o di costruirne uno per composizione Permette di evidenziare porzioni di testo Annota attraverso concetti, lega le istanze ai concetti dellontologia attraverso il connettivo istanceOf Input: –RO: DAML+OIL –documenti html Output: –annotazione formale il DAML*OIL –Annotazione attached utilizzando Xpointer

31 31 Interfaccia di OilEd per navigare la RO Esempio

32 32 Melita ( Depart. of C. S. Univ. of Sheffield. UK). Melita è un dimostratore di annotazioni ontology-based Applicazione client-server Apprendimento automatico (Amilcare) Le annotazioni sono graficamente presentate in modi differenti in base al processo che le ha definite: annotazione manuale (definite da un utente) annotazioni automatica (suggerita da Amilcare) lutente può scegliere quale mantenere tra le due Intput RO:.sce (formato Amilcare),.ont (formato proprietario, di tipo logico Documenti testuali Output: File Xml Contenente tutte le annotazioni riguardanti un documenti annotati da un utente

33 33 Esempio Luoghi Unità temporali

34 34 Kim ( Ontotext Lab, Sirma AI, Bulgaria) E un plugin Internet Explorer. Prevede apprendimento automatico basato sul sistema Gate (utilizzato per la creazione di annotazioni a partire da linguaggio naturale) Le annotazioni sono memorizzate sul server e rese disponibili per realizzare recupero intelligente di informazioni Input: –RO espressa in RDF(S) OWL lite / o tassonomia –Documenti in formato txt, html, xml Ouput –l'annotazione è attacched

35 35 Esempio Date Nomi propri complessi

36 36 Classificazione dei tools esaminati rispetto ai criteri visti RisorsaDestinat. Posizionament o FormalitàRestriz. term. Elem Ann. Sviluppato presso OntomatHtmlComputerEmbedded (nellheader) Formale (DAML+OIL) Ontology- based Istanz e Univ. of Karlsruhe, Germany Mnm HtmlComputer Embedded (file XML), Attached tramite (file propr.) Formale (DAML+OIL, RDF) Ontology- based Istanz e KMI The open Un. - Depart. of CS Univ. of Sheffield. UK SmoreFoto, mail, html Computer Embedded (header) / (e- mail, Img.) Formale (RDF, DAML+OIL, OWL) Advised --- University of Mariland CohseDoc/ html ComputerAttached (Xpointer) Formale DAML+OIL Ontology- based Conce tti Depart. of CS Univ.of Manchester UK TrellisComputerAttachedFormale (OWL)Ontology- based ---USC Information Science Institute MelitaHtmlComputerattached (file XML) Formale (formato proprietario) Ontology- based (.ont.sce) Istanz e Depart. of CS Univ. of Sheffield. UK KimTxt,Html, xml ComputerAttacched (inserite in RO) Advised RO oppure tassonomia ---Ontotext Lab, Sirma AI, Bulgaria AnnoteaHtml/xmlComputer Human user Attached (XPointer) Informale: formattati RDF/XML Advised???W3C INRIA Rhône-Alpes W3C MIT/LCS


Scaricare ppt "1 Annotazione Semantica di risorse Web basata su ontologie di dominio."

Presentazioni simili


Annunci Google