Risorse Computazionali per il Web Semantico

Slides:



Advertisements
Presentazioni simili
Analisi e progettazione
Advertisements

La polisemia nei thesauri: il caso dei termini filosofici
International Society for Knowledge Organization Università Ca Foscari di Venezia Dipartimento di Informatica Matteo Ballarin SKOS Un sistema per lorganizzazione.
19/02/2002LITA, Milano1 Oncology over Internet (O2I) Paolo Romano, Istituto Nazionale per la Ricerca sul Cancro, Genova
Web semantico e logiche descrittive M. Simi, Cap 2 del "Description Logic Handbook" Lezioni di U.Straccia.
1 Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento.
Il Sistema MOMIS Il progetto MOMIS (Mediator EnvirOnment for Multiple Information Sources) consiste nella realizzazione di un sistema intelligente d integrazione.
Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea in Ingegneria Informatica Integrazione di WordNet Domains.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Ontologie Lessicali Multilingua:
TW Analisi dei documenti n Classificazione dei componenti n Selezione dei componenti, costruzione della gerarchia, dei blocchi informativi e degli elementi.
Intelligenza Artificiale Linguaggio naturale
Intelligenza Artificiale 2 Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Intelligenza Artificiale Strutture e strategie per risolvere problemi complessi Prof. M.T. PAZIENZA a.a
Intelligenza Artificiale 1 Gestione della conoscenza lezione 7 Prof. M.T. PAZIENZA a.a
Intelligenza Artificiale 2 Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Intelligenza Artificiale Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Intelligenza Artificiale Semantica del linguaggio naturale
Sistemi basati su conoscenza Prof. M.T. PAZIENZA a.a
Maria Teresa PAZIENZA a.a
Intelligenza Artificiale 1 Gestione della conoscenza lezione 8
Computer, Lingue ed Applicazioni Perché comprendere tramite gli elaboratori i contenuti testuali? I testi sono i veicoli principali di significato per.
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale Prof. M.T. PAZIENZA a.a
Introduzione alle reti semantiche R. Basili. Sistemi basati su conoscenza Fanno uso di una rappresentazione esplicita del: –Mondo/Ambiente –Dominio di.
Intelligenza Artificiale 1 Gestione della conoscenza Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Conoscenza e ragionamento Prof. M.T. PAZIENZA a.a
Apprendimento Automatico: Elaborazione del Linguaggio Naturale
Modeling, managing and accessing e-content Linguistic Computing Laboratory Prof. Paola Velardi.
Architettura del World Wide Web
Unità Didattica 2 I Linguaggi di Programmazione
Metodologie di Annotazione Semantica per la Rappresentazione della Conoscenza nellambito dei Beni Culturali Paola Velardi Dipartimento di Informatica Università
informatica di base per le discipline umanistiche
Modello E-R Generalizzazioni
Informatica giuridica Informatica e lingua del diritto Nicola Palazzolo Anno Accademico 2006/2007.
LINGUAGGI DI PROGRAMMAZIONE
Comprensione di lettura Profilo di competenza Fine quinta
Corso SSIS 2004 – Modulo lingue straniere Software per linsegnamento della lingua straniera Jeffrey Earp – ITD/CNR 2004.
Che cos’è l’annotazione di un corpus?
Descrizione Semantica ad Alto Livello di Ambienti Virtuali in X3D
PROGETTO REGIONALE ELLE – EMERGENZA LINGUA- II SEMINARIO DISTRETTUALE DI RAVENNA – Ravenna, 22 novembre 2010 Pianificazione attività di Istituto Parte.
ACCESS Introduzione Una delle necessità più importanti in informatica è la gestione di grandi quantità di dati. I dati possono essere memorizzati.
Tesi di Laurea in Ingegneria Informatica
Che cos’è Il Quadro comune europeo di riferimento?
Linguaggi per COMUNICARE
1 Ontology languages. Strato dei modelli LA SCELTA DEL LINGUAGGIO Una volta selezionati i componenti dell’ontologia occorre esprimerli in maniera esplicita,
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a
1 Progetto di italiano per il polo pugliese ROSARIO COLUCCIA Bari, 6 maggio 2013.
DAL WEB AL SEMANTIC WEB Aspetti teorici e tecnologici Carmagnola Francesca Dipartimento Informatica C.so Svizzera 185, Torino
Sistemi basati su conoscenza Linguaggio naturale: grammatiche Prof. M.T. PAZIENZA a.a
Elaborazione del linguaggio naturale CFG: esercizi Maria Teresa PAZIENZA a.a
Intelligenza Artificiale 1 Gestione della conoscenza lezione 19 Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Interazioni tra ontologie e lessici Prof. M.T. PAZIENZA a.a
Linguaggi e Modelli dei dati e della conoscenza “rappresentazione della conoscenza” docenti Maria Teresa PAZIENZA Fabio Masimo ZANZOTTO a.a
L’analisi del contenuto Doppia funzione dell’analisi del contenuto: -Può essere un tipo di ricerca specifico -Può essere una tecnica di ricerca Come TECNICA.
1 Università degli Studi di Pisa Facoltà di Scienze Matematiche Fisiche e Naturali Corso di Laurea in Informaticaa Corso di Intelligenza Artificiale: Trattamento.
Linguistica computazionale: task sul linguaggio naturale Cristina Bosco 2015 Informatica applicata alla comunicazione multimediale.
Il progetto Turin University Treebank: corpora e NLP Cristina Bosco Dipartimento di Informatica Università di Torino Corso di informatica applicata alla.
L'analisi dei testi per la realizzazione del Web Semantico: quali gli strumenti e le applicazioni Paolo Poto Expert System Spa.
Servizi Internet Claudia Raibulet
Intelligenza Artificiale 2 Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a
Come costruire sistemi di elaborazione del linguaggio naturale (NLP) Due paradigmi di riferimento –Basato sulla conoscenza (Knowledge Engineering, KE)
Intelligenza Artificiale Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Tecnologie della lingua Human Language Technology (HLT)
Istituzioni di linguistica
Corso integrato di Matematica, Informatica e Statistica Informatica di base Linea 1 Daniela Besozzi Dipartimento di Informatica e Comunicazione Università.
Web semantico e logiche descrittive M. Simi, Cap 2 del "Description Logic Handbook" Lezioni di U.Straccia.
La Comprensione frasale
Web semantico e logiche descrittive M. Simi, Cap 2 del "Description Logic Handbook" Lezioni di U.Straccia.
Transcript della presentazione:

Risorse Computazionali per il Web Semantico Roberto Navigli Alcune slide provengono dalla scuola estiva EUROLAN 2003 19/09/2003

Agenda Il Web Semantico Lessici computazionali Focus on: Classificazioni Focus on: SIMPLE FrameNet

Il Web Semantico Obiettivo: Trasformare il WWW in una KB comprensibile alla macchina Web Semantico Ontologie Knowledge Markup Agenti Intelligenti Applicazioni Documenti Database

L’Onda Semantica

6 sfide per il WS (Benjamins et al. 2002) Disponibilità del contenuto Disponibilità di ontologie Multilingualità Scalabilità (organizzazione, memorizzazione, ricerca della conoscenza) Visualizzazione (≠ ipertesto) Stabilità dei linguaggi del WS (standardizzazione) Human Language Technology (HLT)

Lessici computazioniali e Human Language Technologies I lessici computazionali forniscono una conoscenza delle parole comprensibile alla macchina La rappresentazione è esplicita Il significato è collegato alla morfologia e alla sintassi della parola E’ possibile creare collegamenti lessicali multilingua

Lessici computazionali e HLT (2) Risorse critiche per i sistemi di NLP: Frame di sottocategorizzazione sintattica per il parsing Semantic selectional preferences per la riduzione dell’ambiguità Classi semantiche per WSD, semantic tagging ecc. Componenti chiave delle HLT: Lessici monolingua – IE, QA, ecc. Lessici multilingua – MT, CLIR, ecc.

Ontologie e lessici computazionali Access to Content HLT Semantic Web Ontologies Computational Lexicons ?

Ontologie “la specifica esplicita di una concettualizzazione” (Gruber, 1993) “includono il vocabolario, le interconnessioni semantiche e alcune semplici regole di inferenza e logica” (Hendler, 2001)

Ontologie “linguistiche” Sistemi di simboli che rappresentano i concetti codificati da espressioni in linguaggio naturale (unità lessicali, termini, ecc.) Specificano le classi semantiche raggruppando termini simili a livello semantico Usano un linguaggio di rappresentazione semantica OBJECT EVENT LOCATION ARTIFACT ANIMAL ENTITY VEHICLE MAMMAL BEACH CONCERT dog, cat, horse car, van, truck beach piano concert, rock concert spiaggia

Tipologie di lessici computazionali Monolingua vs multilingua General purpose vs domain specific Tipo di contenuto (Morfo)sintattico Semantico Misto Terminologico

Lessici computazionali sintattici Le informazioni lessicali sono contenute in frame di sottocategorizzazione (ComLex, PAROLE ecc.) I frame sintattici includono: Un certo numero di argomenti Le rispettive categorie sintattiche (PP, NP, ecc.) Vincoli lessicali sugli argomenti (es. PP deve avere in testa una preposizione) Un ruolo funzionale per ogni argomento (Subj, Obj, ecc.) hit [V: (Subj: NP) (Objd: NP)] answer [N: (Obji: PP_to)]

Lessici computazionali semantici Rappresentano il significato di una parola Distinguono differenti sensi di una parola Catturano le inferenze (essere umano  essere animato) Rappresentano similarità, relatedness ecc. (es. banca, conto, denaro sono concetti relativi alla finanza)

Lessici computazionali semantici Basati su reti concettuali WordNet (Miller, Fellbaum et al.) hierarchy/taxonomy EuroWordNet (Vossen et al.) heterarchy Basati su frame Mikrokosmos (Nirenburg, Mahesh et al.) FrameNet (Fillmore et al.) Ibridi SIMPLE (Calzolari, Lenci et al.)

PAROLE-SIMPLE (ILC CNR Pisa – Calzolari, Lenci et al.) 12 lessici di base monolingua costruiti secondo un modello armonizzato Estesi a livello nazionale Combinazione di informazioni sintattiche e semantiche Frame di sottocategorizzazione sintattica Tipo semantico (“ontology”) Frame semantici collegati alla sintassi Ruoli semantici Selectional preferences Ecc. Relazioni semantiche Pustejovsky’s “quali roles” Polisemia regolare Eventi

Elementi base del lessico monolingua Ciascun layer individua un’unità base di descrizione lessicale morphological layer MU basic unit to describe the inflectional and derivational morphological properties of the word syntactic layer SynU basic unit to describe the syntactic behavior of the MU semantic layer SemU basic unit to describe the semantic properties of the MU

Architettura di SIMPLE Ontology Lexical Templates Language Independent Module Greek lexicon Italian lexicon Catalan lexicon Italian lexicon PAROLE Syntax SemU Semantic Frame (semantic roles, etc.) Semantic Relations Event Structure Polysemy etc.

SIMPLE relazioni semantiche Top Formal Constitutive Agentive Telic Is_a Is_a_part_of Property Created_by Agentive_cause Indirect_telic Activity ... Contains ... Instrumental Is_the_habit_of Used_for Used_as

SIMPLE una rete semantica <fabbricare> make Ala (wing) Agentive SemU: 3232 Type: [Part] Part of an airplane Agentive <volare> fly Used_for Is_a_part_of <aeroplano> airplane Isa SemU: 3268 Type: [Part] Part of a building Isa <parte> part Used_for Isa SemU: D358 Type: [Body_part] Organ of birds for flying <edificio> building Is_a_part_of Is_a_part_of SemU: 3467 Type: [Role] Role in football <giocatore> player <uccello> bird Isa

SIMPLE Frame semantici il difensore di Berlusconi (Berlusconi's defender) il difensore del Milan (the Milan fullback) Difensore N SemU: 4125 Type: [Role] Defender agent nominalization PREDDifendere#1 <Arg1>, <Arg2> SemU: 3526 Type: [Role] Fullback <squadra> team Is_a_member_of

Frame disambiguation L’identificazione del contributo semantico di un NP richiede l’accesso alla rappresentazione del contenuto semantico delle teste nominali La “struttura semantica” della testa nominale determina la relazione semantica espressa da un PP che modifica l’NP: La pagina del libro (part-of) Il difensore del Milan (member-of) Il suonatore di liuto (telic) Il tavolo di legno (made-of)

SIMPLE esempi semantic relations ontology semantic frame

Lexical acquisition bottleneck Il lessico italiano di SIMPLE codifica circa 6000 concetti Disomogeneo Incompleto Non è disponibile L’utilizzo non è consigliato dagli stessi autori (ILC – CNR di Pisa) Acquisizione automatica della conoscenza lessicale FrameNet GOSSIP! GOSSIP! GOSSIP!

FrameNet (ICSI, U-Colorado – Fillmore, Narayanan, Jurafsky et al.) Fase I (1997-2000) Basi concettuali, impiego di strumenti preesistenti, Perl Fase II (2000-2003) Scalabilità, utilizzo di DB SQL, strumenti scritti in Java Applicazioni pilota

I frame e la comprensione umana Ipotesi: la gente comprende nuovi fatti effettuando operazioni mentali sulla base di ciò che già conosce. Tale conoscenza è descrivibile in termini di pacchetti di informazione chiamati frame FrameNet può fornire tale conoscenza Le rappresentazioni di FrameNet fanno da complemento a ontologie e lessici

In cosa consiste FrameNet Caratterizzazione dei frame Individuazione delle parole che riguardano un frame Sviluppo di una terminologia descrittiva Estrazione di frasi di esempio Annotazione (manuale) degli esempi selezionati Descrizione del frame

Il processo Le frasi contenenti una certa parola sono estratte dal corpus in esame e rese disponibili per l’annotazione Gli studenti (!) selezionano le espressioni che identificano i ruoli semantici delle frasi e li etichettano con il nome dei ruoli del frame Informazioni grammaticali sulle frasi etichettate sono estratte automaticamente

Alcune annotazioni (to appoint – nominare)

Lista parziale di parole per un frame Verbi: pay, spend, cost, buy, sell, charge Nomi: cost, price, payment Adjectives: expensive, cheap

Significato e sintassi I vari verbi che evocano un frame introducono gli elementi del frame in modi differenti Informazioni analoghe possono essere espresse in posti diversi della frase secondo il verbo utilizzato

She bought some carrots from the greengrocer for a dollar. Customer Vendor from BUY for Goods Money

She paid a dollar to the greengrocer for some carrots. Customer Vendor to PAY for Goods Money

She paid the greengrocer a dollar for the carrots. Customer Vendor PAY for Goods Money

She spent a dollar on the carrots. Customer Vendor SPEND on Goods Money

The greengrocer sold some carrots to her for a dollar. Customer Vendor to SELL for Goods Money

The greengrocer sold her some carrots for a dollar. Customer Vendor SELL for Goods Money

The greengrocer charged a dollar for a bunch of carrots. Customer Vendor CHARGE for Goods Money

The greengrocer charged her a dollar for the carrots. Customer Vendor CHARGE for Goods Money

A bunch of carrots costs a dollar. Customer Vendor COST Goods Money

A bunch of carrots cost her a dollar. Customer Vendor COST Goods Money

FrameNet Fact Sheet 500 frame 7700 unità lessicali 130.000 frasi annotate Interconnessioni tra i frame (ereditarietà, sottoframe, “using”) Potrebbero essere mappate su relazioni ontologiche Multilingual FrameNets (spagnolo, tedesco, giapponese) Disponibile!