L’Elaborazione del Linguaggio Naturale e i Linguaggi di Markup - dalla struttura al contenuto -

Slides:



Advertisements
Presentazioni simili
I Namespace Mario Arrigoni Neri.
Advertisements

1 OWL Mario Arrigoni Neri. 2 OWL – Web Ontology Language Estende RDF[S] con costrutti aggiuntivi per modellare realtà più complesse Contemporaneamente.
Introduzione ad XML Mario Arrigoni Neri.
SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.
A. FERRARI Alberto Ferrari. L'HyperText Markup Language (HTML) (traduzione letterale: linguaggio di marcatura per ipertesti) è un linguaggio usato per.
1 Introduzione ad XML. 2 Problemi con SGML Complesso da comprendere ed utilizzare Non è pensato per la rete: mancano link ipertestuali e specifiche grafiche.
Document Type Definition per XML Presentazione 8.1 Informatica Generale (Prof. Luca A. Ludovico)
International Society for Knowledge Organization Università Ca Foscari di Venezia Dipartimento di Informatica Matteo Ballarin SKOS Un sistema per lorganizzazione.
Modulo3 Linguaggi: RDF UNIVERSITA’ DI CAMERINO
La Rappresentazione della Conoscenza
Web semantico e logiche descrittive M. Simi, Cap 2 del "Description Logic Handbook" Lezioni di U.Straccia.
Il Sistema MOMIS Il progetto MOMIS (Mediator EnvirOnment for Multiple Information Sources) consiste nella realizzazione di un sistema intelligente d integrazione.
Peer to Peer DBMS: il sistema FOAF Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Università degli.
Università degli Studi di Modena e Reggio Emilia
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, La rappresentazione dellinformazione testuale e i linguaggi di codifica.
XML Prof. Alfredo Pulvirenti. XML XML (eXtensible Markup Language) è un meta linguaggio. Può essere definito come un insieme di regole e convenzioni che.
Comunicazione Multimediale Letizia Catarini
Intelligenza Artificiale 2 Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Intelligenza Artificiale 1 Gestione della conoscenza lezione 7 Prof. M.T. PAZIENZA a.a
Maria Teresa PAZIENZA a.a
Intelligenza Artificiale 1 Gestione della conoscenza lezione 8
Computer, Lingue ed Applicazioni Perché comprendere tramite gli elaboratori i contenuti testuali? I testi sono i veicoli principali di significato per.
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Basi di conoscenza: rappresentazione e ragionamento (2 - Reti semantiche, Frames) Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Basi di conoscenza: rappresentazione e ragionamento (2 - Reti semantiche, Frames) Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Conoscenza e ragionamento Prof. M.T. PAZIENZA a.a
XML Prof. Barbara Pernici Politecnico di Milano. Introduzione a XML.
Linguaggi di marcatura e fogli stile Presentazione del corso.
Architettura del World Wide Web
Seminari di ingegneria del software
Chomsky La grammatica/sintassi è una proprietà della mente
Semantica di Tarski.
Unità Didattica 2 I Linguaggi di Programmazione
Linguaggi di markup1 LINGUAGGI DI MARKUP. Linguaggi di markup2 Documenti su Internet Internet permette (tra laltro) di accedere a documenti remoti In.
Modello E-R Generalizzazioni
INSIEMI NUMERABILI L’analisi matematica introduce il concetto di insieme numerabile come insieme i cui elementi possono essere “contati” ossia che possiede.
LINGUAGGI DI PROGRAMMAZIONE
Esercizio 1 Convertire il seguente DTD (esercizio 1 sui DTD) in XML Schema:
Informatica Umanistica A.A. 2009/2010 eXtensible Markup Language (XML)
Importanza DTD La DTD (Document Type Definition) consente di dichiarare in maniera univoca la struttura di markup mediante la definizione dello schema.
Chomsky La grammatica/sintassi è una proprietà della mente Distinta dalla capacità di comunicare E una facoltà autonoma ed innata La comunicazione è solo.
HyperText Markup Language 17-23/6/08 Informatica applicata B Cristina Bosco.
Che cosa è un sintagma?.
Descrizione Semantica ad Alto Livello di Ambienti Virtuali in X3D
Logiche descrittive M. Simi, Categorie e oggetti Molti dei ragionamenti che si fanno sono sulle categorie piuttosto che sugli individui Se.
SINTASSI.
“Seminari di Ingegneria del software”
Il World Wide Web Lidea innovativa del WWW è che esso combina tre importanti e ben definite tecnologie informatiche: Documenti di tipo Ipertesto. Sono.
Grammatiche, Linguaggio e Automi R. Basili TAL - a.a
Linguaggi per COMUNICARE
1 Ontology languages. Strato dei modelli LA SCELTA DEL LINGUAGGIO Una volta selezionati i componenti dell’ontologia occorre esprimerli in maniera esplicita,
Informatica Umanistica A.A. 2007/2008 LEZIONE 4 eXtensible Markup Language (XML) INTRODUZIONE.
DAL WEB AL SEMANTIC WEB Aspetti teorici e tecnologici Carmagnola Francesca Dipartimento Informatica C.so Svizzera 185, Torino
Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.
Intelligenza Artificiale 1 Gestione della conoscenza lezione 19 Prof. M.T. PAZIENZA a.a
Tecnologie di InternetDocument Type Definition Dott. Nicola Dragoni Document Type Definition  Document Type Definition (DTD)  Documento XML valido 
Carluccio Antonio Carluccio Alessandra Caricola Giovanni Vizzino Anna Università degli Studi di Bari.
Sapienza Università di Roma Sapienza Università di Roma Laurea specialistica in Ingegneria Informatica Seminari di Ingegneria del Software Traduzione di.
Metamodellazione in RDF Tesina del corso di Seminari di Ingegneria del Software Alberto Cerullo.
Cenni Su SGML, HTML, XML SGML (Standard Generalized Markup Language) è il padre di tutti i linguaggi "Markup" – Lo svantaggio è la "pesantezza" dei suoi.
Web semantico: Il recupero dell’informazione affidato alla macchina
Servizi Internet Claudia Raibulet
Come costruire sistemi di elaborazione del linguaggio naturale (NLP) Due paradigmi di riferimento –Basato sulla conoscenza (Knowledge Engineering, KE)
Intelligenza Artificiale Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Basi di dati distribuite Prof. M.T. PAZIENZA a.a
Web semantico e logiche descrittive M. Simi, Cap 2 del "Description Logic Handbook" Lezioni di U.Straccia.
Web semantico e logiche descrittive M. Simi, Cap 2 del "Description Logic Handbook" Lezioni di U.Straccia.
Aspetti Epistemologici dell’Informatica Prof.ssa Stefania Bandini Dott. Gianluca Colombo Dott. Luca Mizar Federici Dipartimento di Informatica, Sistemistica.
Oltre il web 2.0: il web semantico Seminario. World Wide Web ● Nasce nel 1991 al CERN di Ginevra Evoluzione: web dinamico ● Si basa su ● URL ● HTTP ●
Transcript della presentazione:

L’Elaborazione del Linguaggio Naturale e i Linguaggi di Markup - dalla struttura al contenuto -

2 Sommario L’Elaborazione del Linguaggio Naturale e i linguaggi di markup Il markup e i linguaggi di markup Annotazione linguistica di testi: –XML (eXtensible Markup Language) –Esempi di testi annotati Definizione di ontologie: –RDF (Resource Description Framework) –OWL (Ontology Web Language)

3 L’Elaborazione del Linguaggio Naturale e i linguaggi di markup (LdM) ELN per LdM LdM per ELN annotazione automatica di testi mediante tecniche di Elaborazione del Linguaggio Naturale annotazione linguistica di testi; rappresentazione del contenuto per recupero dell’informazione;

4 I linguaggi di markup con “markup” si intende “marcatura”, “annotazione” (“to mark up” = “segnare”) i linguaggi di markup (LdM) sono utilizzati per rappresentare un documento “marcando” alcuni suoi elementi costituenti; Tramite il markup è possibile strutturare un testo e permettere l’accesso ai suoi contenuti.

5 Rappresentazione di dati strutturati Con i LdM è possibile dare una struttura all’informazione e renderla più facilmente recuperabile ed interpretabile: Il Signore degli Anelli, di John Ronald Reuel Tolkien, Bompiani. titolo autore editore

6 XML - eXtensible Markup Language XML (come HTML) è un sottoinsieme di SGML (Standard Generalized Markup Language); in XML tutto ciò che è compreso tra parentesi angolate è un etichetta, o tag; XML è “estensibile”: consente di definire i propri tag, contrariamente ad HTML che fornisce solo tag statici (,,,, ecc.).

7 Esempio di markup XML Il Signore degli Anelli, di John Ronald Reuel Tolkien, Bompiani. Il Signore degli Anelli John R. R. Tolkien Bompiani … markup XML

8 XML - DTD Per definire la struttura di un documento XML è necessario creare uno schema chiamato DTD (Document Type Definition) al quale il documento XML sarà associato. Nel nostro caso: <!DOCTYPE biblioteca [ ]> uno o più elementi uno ed un solo elemento

9 I Linguaggi di markup per l’annotazione linguistica di testi E’ possibile annotare un testo a diversi livelli: –tipografico o fonologico; –lessicale; –morfologico; –sintattico; –semantico; –pragmatico.

10 Annotazione sintattica (1) –es: “Frodo sedette su una roccia.” Frodo sedette su una roccia Frase Sint.NomSint.Ver Nome Verbo Sint.Prep Prep Sint.Nom ArtSostant. Frodo sedette su unaroccia

11 Annotazione sintattica (2) Possibile su due tipi di informazione: categorie: annotazione di stringhe in base alla categoria sintattica (sintagma nominale, sintagma preposizionale, ecc.) dipendenze: relazioni tra elementi annotati che riflettono i loro ruoli sintattici (soggetto, oggetto)

12 Annotazione sintattica (3) In base alle categorie sintattiche: “The big dog chased the cat” [[NP The big dog NP] [VP chased [NP the cat NP] VP]] S NPVP NAdjArtVNP ArtN Thebig dog chased thecat

13 Annotazione sintattica (4) In base alle dipendenze: “The big dog chased the cat” 1.The3 2.big3 3.dogSubj4 4.chasedMain V 5.the6 6.catObj4 The big dog chased the cat

14 Un esempio di annotazione XML: testi letterari (1) Obiettivo: realizzare un sistema per l’estrazione di conoscenza da un testo letterario; E’ necessario costruire una base di conoscenza che contenga: –una metarappresentazione del testo; –una ontologia del contesto semantico. Testo in esame: “La Divina Commedia”.

15 Un esempio di annotazione XML: testi letterari (2) Il sistema deve essere capace di rispondere a domande di questo tipo: –Quanti e quali sono i ghibellini e quanti e quali i guelfi presenti nella Cantica Inferno della Divina Commedia? –Quante e quali figure della mitologia classica vengono evocate nell’Inferno? –Classificare l’atteggiamento di Dante verso un personaggio in base alle caratteristiche del personaggio.

16 La Base di Conoscenza metarappresentazione del testo ontologia narrazioni dialoghi topografia personaggi

17 La meta-rappresentazione del testo narrazione I Nel mezzo del cammin… mi ritrovai per una selva … Quando vidi costui nel … dialogo Dante Virgilio … Dante Virgilio “Miserere di me qual che tu sii, od ombra od omo certo!” … …

18 L’ontologia: schema NOME COGNOME NOTO COME TIPO (Storico / Letterario / Creatura) Storico: - EPOCA (es. Medioevo, Antichità Greca, ecc.) - CATEGORIA (es. Politico, Ecclesiastico, ecc.) - SOTTOCATEGORIA (es. Capo Ghibellino, ecc.) - POSIZIONE POLITICA (es. Guelfo, Ghibellino, ecc.) - NOTE BIOGRAFICHE (avvenimenti, ecc.) - NOTE Letterario: - AMBITO DI APPARTENENZA (es. Mitologia classica, Bibbia, ecc.) - CATEGORIA - SOTTOCATEGORIA - NOTE Creatura: - RUOLO - SIGNIFICATO ALLEGORICO

19 L’ontologia: XML Manente degli Uberti Farinata Storico Medioevo Politico Capo ghibellino Ghibellino 1239 diventa capo del partito ghibellino Firenze ……….. Ulisse Letterario Mitologia classica Eroe greco Re di Itaca Lonza Creatura ostacolare l’ascesa di Dante al colle della salvezza lussuria ……………

20 Limiti di XML rappresentazione della semantica limitata: –alla struttura (ad albero) del documento, –alla marcatura degli elementi (le foglie). XML permette di descrivere risorse e renderle leggibili da una macchina (machine readable) ma non comprensibili (machine understandable).

21 RDF modello generale per fare delle "asserzioni semantiche" su oggetti Web; sintassi basata su XML; un oggetto Web (pagina, documento, ecc.) è detto risorsa ed è identificabile tramite un URI (Uniform Resource Identifier);

22 RDF - asserzioni i dati sono descritti da asserzioni ; un’asserzione è composta da : –una risorsa (pagina web, un intero sito, un libro, o qualunque cosa dotata di URI); –una proprietà (titolo, data, tipo, ecc.); –un valore (stringa, numero, un’altra risorsa, ecc.)

23 RDF - esempio (1) Supponiamo di modellare questa asserzione: –“La persona di nome Marino Franzosi, è autore di Marino autore nome

24 RDF - esempio (2) Marino autore nome proprietà risorsa (URI del sito) risorsa (e valore) (URI dell’autore) valore

25 Schemi RDF (RDF-S) permettono di specificare quali proprietà possono comparire nelle asserzioni RDF; specificano le relazioni tra proprietà; dichiarano classi di risorse; permettono di rappresentare reti semantiche sul web in cui: –nodi: URI –archi: rdfs:Class rdfs:Property rdfs:subClassOf

26 Primo passo verso creazione di ontologie Reti semantiche sul web Cirillo miagolare zoologi regno animale regno animale gatto felino è unè sa appartiene studiato da Class Property subClassOf

27 OWL (Web Ontology Language) è un linguaggio per definire ontologie sul web – ontologia: rappresentazione della natura degli oggetti analizzati e delle relative interrelazioni; permette di esplicitare e rendere elaborabile automaticamente l’informazione contenuta nei documenti; è basato sulla Logica Descrittiva; è un’evoluzione del precedente DAML+OIL.

28 OWL e il Semantic Web XML RDF OWL fornisce la sintassi per documenti strutturati: nessuna rappresentazione del significato permette la modellazione di oggetti (risorse) e la specifica di relazioni tra di essi. Semantic Web permette di rappresentare proprietà e caratteristiche più complesse per classi e relazioni più vincoli

29 Documenti XML, RDF e OWL documenti XML documenti RDF documenti OWL Non tutti i documenti XML sono documenti RDF, perché non rispettano certe restrizioni sintattiche; Analogamente non tutti i documenti RDF sono documenti OWL; Tutti sono comunque documenti XML sintatticamente corretti.

30 Esempio di definizione di ontologia con OWL si vuol definire una ontologia di “vini”, a partire dalle seguenti “classi di base” (root classes): –Winery (Cantina) –Region (Regione) –Consumable thing (Cosa consumabile)

31 Thing OWL: classi di base Winery Region ConsumableThing sto definendo una classe OWL assegno un nome alla classe il nome della classe classe più generale

32 OWL: sottoclassi... ConsumableThing PotableLiquid La classe “PotableLiquid” è definita come sottoclasse di “ConsumableThing”:

33 Region Gli individui sono i membri delle classi; Possiamo introdurre un individuo dicendo che è membro di una certa classe: –es: “CentralCoastRegion” è membro della classe “Region”: OWL: individui CentralCoastRegion

34 Thing Ontologia ottenuta (1) Region PotableLiquid CentralCoastRegion Winery ConsumableThing

35 In OWL è possibile importare ontologie, supponiamo di importare l’ontologia “food” nella quale sia stata definita la classe “Grape” (uva) in qualche modo e: 1.Definiamo “WineGrape” come sottoclasse di “Grape” e 2.Definiamo l’individuo “CabernetSauvignonGrape” come membro della classe “WineGrape”: Classi importate Classe “Grape” dell’ontologia importata “food”

36 Thing Ontologia ottenuta (2) Region PotableLiquid CentralCoastRegion Winery ConsumableThing Grape WineGrape CabernetSauvignonGrape

37... PotableLiquid Wine La classe “Wine” è definita come sottoclasse di “PotableLiquid”: 1 a definizione di “vino”

38 Thing Ontologia ottenuta (3) Region PotableLiquid CentralCoastRegion Winery ConsumableThing Grape WineGrape CabernetSauvignonGrape Wine

39 OWL: proprietà Una proprietà OWL è una relazione binaria; ogni proprietà è specificata da un dominio (domain) e un codominio (range) Es: definiamo la proprietà “madeFromGrape” per associare vini ad uva da frutta: nome della proprietà dominio codominio è possibile definire delle sottoproprietà, ad es. “madeFromGrape” potrebbe essere una sottoproprietà di “madeFrom”. and

40 2 a definizione di “vino” A questo punto è possibile definire il vino come “un liquido potabile prodotto da almeno un tipo di uva da vino”: 1... and classe senza nome (anonymous) che rappresenta l’insieme delle cose con almeno una proprietà “madeFromGrape”

41 La classe “Wine” Thing Region PotableLiquid Winery ConsumableThing Grape WineGrape Wine madeFromGrape

42 Con OWL è possibile inoltre Dotare le proprietà di caratteristiche (transitività, simmetria, inversione, ecc.); Dotare le proprietà di restrizioni (di valore, di numero, ecc.); Dichiarare relazioni di equivalenza tra individui; Definire classi complesse (unione, intersezione, complemento, disgiunzione, ecc.) Utilizzare l’ontologia come “Base di Conoscenza” dotata di meccanismi di inferenza.