La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Semantica Maria Teresa PAZIENZA a.a. 2006-07. Programma Breve introduzione allNLP Linguaggi Naturali e Linguaggi Formali Complessità Morfologia Teoria:

Presentazioni simili


Presentazione sul tema: "Semantica Maria Teresa PAZIENZA a.a. 2006-07. Programma Breve introduzione allNLP Linguaggi Naturali e Linguaggi Formali Complessità Morfologia Teoria:"— Transcript della presentazione:

1 Semantica Maria Teresa PAZIENZA a.a

2 Programma Breve introduzione allNLP Linguaggi Naturali e Linguaggi Formali Complessità Morfologia Teoria: Morfologia del Linguaggio Naturale Strumenti: Automi e Trasduttori Analisi Morfologica: con automi e trasduttori Part of Speech Tagging Teoria: Le classi morfologiche Strumenti a Analisi: modelli a regole e statistici Sintassi Teoria: Sintassi del Linguaggio Naturale Strumenti: CFG Analisi Sintattica: parsing top-down, bottom-up, Early Semantica Introduzione Distributional Lexical Semantics Sentence Semantics Info

3 NLP - Analisi semantica Capire il significato di una frase è unoperazione necessaria per andare al di là della frase stessa, per inserire il suo significato allinterno di un contesto condiviso nella comunicazione, per poter rispondere a domande relative al dominio di conoscenza coinvolto dalla frase (o domanda) stessa. Lanalisi semantica è fondamentale in questa fase a supporto del ragionamento e si basa sulla rappresentazione formale del significato della frase. Per capire il significato di una frase non è necessario aver realizzato completamente le fasi di analisi morfologica e sintattica della frase stessa; si può utilizzare anche la rappresentazione della conoscenza di dominio

4 NLP - Analisi semantica Capire il significato di una frase e ragionare su Necessario un approccio sistematico e formale per collegare la rappresentazione del significato della frase con tutti i fatti e gli eventi del mondo che esistono (ovvero sono rappresentati nella base di conoscenza relativa) Un sistema potrà allora fare inferenza, ovvero: ragionare a partire dalla frase fare deduzioni valide rispetto sia alla rappresentazione formale del significato della frase in ingresso sia alla conoscenza di base del sistema stesso.

5 NLP - Analisi semantica La comprensione del significato di una espressione linguistica richiede conoscenza linguistica e non-linguistica (conoscenza del mondo e/ del dominio): tale significato è espresso da strutture formali (rappresentazione del significato della frase che supporta, facilitando lanalisi semantica) La sintassi e la semantica di queste rappresentazioni saranno fornite da appositi linguaggi per la rappresentazione del significato. Espressione linguistica->analisi semantica- >comprensione del significato->supporto al ragionamento

6 Rappresentazione del significato La rappresentazione del significato può avvenire in linguaggi formali diversi (FOPC calcolo dei predicati, reti semantiche, diagrammi delle dipendenze concettuali, frames, etc), che usano strutture di simboli per esprimere il significato della frase specifica (così come di un generico evento dello stesso tipo)

7 Rappresentazione del significato Capire il significato di una frase (es. una domanda) significa usare una rappresentazione formale per determinare la relazione esistente tra il significato della frase ed il mondo in cui tale frase ha senso. Implementare un algoritmo di verifica: matching tra la rappresentazione della specifica frase in ingresso e le rappresentazioni esistenti nella base di conoscenza di riferimento, che costituiscono la conoscenza del mondo

8 Rappresentazione del significato A causa della ricchezza espressiva del linguaggio naturale, si possono avere più espressioni linguistiche (frasi diverse) che esprimono lo stesso fatto; di conseguenza si avranno rappresentazioni formali diverse. I Giapponesi amano la moda italiana La moda italiana è amata dai Giapponesi I Giapponesi impazziscono per la moda italiana Si dice che i Giapponesi amino la moda italiana E a tutti noto che i Giapponesi amino la moda italiana …..

9 Rappresentazione del significato Non sempre tutte le rappresentazioni formali coesistono: in tal caso non tutte trovano il matching nella base di conoscenza (mondo di riferimento), si va incontro a situazioni di indeterminatezza e vaghezza dellinterpretazione del significato. Una soluzione a tale problema: assegnare a tutte le rappresentazioni lo stesso significato. Forma canonica: stessa rappresentazione associata ad espressioni linguistiche con uguale significato

10 Rappresentazione del significato Non sempre si può rispondere ad una domanda, ad una richiesta di informazione con un approccio basato sul pattern matching; in molti casi si deve ricorrere a fasi di concettualizzazione (un metalivello rispetto a quello linguistico) che sono possibili se il linguaggio di rappresentazione del significato supporta luso di variabili. Gli stranieri amano la moda italiana Domanda : I Giapponesi amano la moda italiana?

11 Significato e linguaggio Riconoscere le relazioni che esistono tra i concetti (associati a diverse parole) e le componenti frasali di ciascuna espressione linguistica I verbi (predicati) assumono un ruolo rilevante imponendo vincoli sulla struttura grammaticale e sulla posizione di altri elementi (argomenti) che devono accompagnarli nella struttura sintattica di una frase Identificare il significato completo di una frase come risultato della composizione del significato dei singoli elementi linguistici in ingresso (i costituenti del parser sintattico).

12 Significato e linguaggio I Giapponesi amano la moda italiana NP V NP Il predicato ha due argomenti di tipo nominale NP Il primo argomento precede il verbo ed assume il ruolo di soggetto (colui che compie lazione espressa dal verbo) Il secondo argomento segue il verbo ed assume il ruolo di oggetto (che subisce lazione verbale)

13 Significato e linguaggio Regolarità nei comportamenti degli elementi associati ai verbi (classi di verbi) possono assumere un significato particolare ed indicare un ruolo semantico specifico Le strutture verbali di sottocategorizzazione evidenziano il legame tra le strutture superficiali (sintattiche) ed il ruolo semantico che esse assumono nella rappresentazione del significato di una frase

14 Significato e linguaggio I verbi (classi di) possono imporre delle restrizioni sulla tipologia degli argomenti retti (frasi nominali, frasi preposizionali, …); es. gli elementi delle frasi nominali presenti nella struttura sintattica possono assumere valore solo in alcune categorie concettuali (selectional restriction)

15 Significato e linguaggio In una frase non sono solo i verbi a reggere le strutture argomentali predicative: le preposizioni possono essere considerate dei predicati con 2 argomenti: il primo argomento è lentità che la preposizione pone in (una qualche) relazione con il secondo argomento Giovanni comprò unautomobile di prestigio

16 Significato e linguaggio Ulteriori strutture possono esprimere legami predicativi tra argomenti: Fare una presentazione-ppt per la lezione di 2 ore di Intelligenza Artificiale di domani Lazione non è esplicitata esclusivamente dal verbo (fare), bensì dal sostantivo che regge (nominalizzazione) Il predicato (presentare) è associato al termine (presentazione-ppt) e regge 4 argomenti

17 Significato e linguaggio I linguaggi per la rappresentazione del significato devono poter specificare la semantica delle strutture predicative argomentali (predicate- argument structures) che asseriscono che relazioni specifiche hanno luogo tra i diversi concetti sottostanti i costituenti (parole e frasi) che compongono una frase. Grazie a queste strutture argomentali si realizza un significato unico (unificante) tra le varie componenti della frase.

18 Predicate-argument structure sintesi Predicati soprattutto verbi, frasi verbali, frasi preposizionali, frasi (V, VP, PP, S) talvolta nomi e frasi nominali (N, NP) Argomenti soprattutto nomi, strutture nominali, frasi nominali, frasi preposizionali (N, NP, PP) anche altre forme in relazione al contesto

19 Calcolo dei predicati FOPC richiami Fornisce solide basi computazionali per supportare le operazioni di matching, per fare inferenza, e non pone molti vincoli su come rappresentare le entità coinvolte. Il mondo è composto da oggetti, proprietà di oggetti e relazioni tra oggetti. Grazie alla nozione di termine si possono rappresentare oggetti di varia tipologia (funzioni, costanti, variabili) cui possono essere associati i nomi degli elementi del dominio in esame. Le funzioni possono anche essere considerate come predicati ad un unico argomento. Le variabili permettono di fare delle affermazioni sia relativamente ad entità non note, sia relativamente a classi di entità. I quantificatori (esistenziale ed universale) associati alle variabili permettono di assegnare significato ad una generica entità o ad una classe

20 Calcolo dei predicati FOPC I predicati permettono di asserire, tramite un nome, la relazione esistente tra un numero predefinito di elementi di uno specifico dominio. I Giapponesi amano la moda italiana Amare(Giapponesi,ModaItaliana) Rappresentazioni di frasi complesse possono essere realizzate introducendo dei connettivi logici. I Giapponesi amano la moda italiana e fotografano monumenti Amare(Giapponesi,ModaItaliana) Λ Fotografare(Giapponesi,Monumenti)

21 Calcolo dei predicati FOPC Le entità espresse grazie al calcolo dei predicati assumono un significato in base alla corrispondenza con il mondo che si sta modellando; ciascuna formula logica può assumere un valore (vero, falso). Una formula logica è vera se è presente nella base di conoscenza o se può essere dedotta da altre formule della base di conoscenza. Linterpretazione delle formule avviene in relazione alle tavole di verità dei connettivi logici

22 Analisi semantica Gli approcci computazionali allanalisi semantica si riferiscono al processo in base a cui le diverse rappresentazioni del significato di una frase vengono composte per poi essere poste in corrispondenza dei vari elementi linguistici. Necessità di usare sorgenti di conoscenza diversificate a supporto della rappresentazione del significato; tra esse: 1.i significati delle parole 2.i significati associati alle strutture sintattiche 3.la conoscenza della struttura del discorso 4.conoscenza del contesto 5.conoscenza (almeno) di base del dominio

23 Analisi semantica guidata dalla sintassi Le frasi sono composte da parole ciascuna delle quali assume un significato (principio di composizionalità). Le parole si organizzano tra loro secondo regole specifiche e relazionano tra loro per formare una frase con un determinato significato. Io vedo ciò che mangio Io mangio ciò che vedo Il significato di una frase non è basato esclusivamente sulle parole che la compongono, ma deve tener conto dellordine con cui compaiono, dei raggruppamenti esistenti, e delle interrelazioni; nellanalisi semantica basata sulla sintassi la composizionalità dei significati terrà quindi conto delle diverse componenti sintattiche e delle relazioni esistenti.

24 Analisi semantica guidata dalla sintassi Lanalizzatore semantico elaborerà il risultato dellanalisi sintattica nelle diverse (ambigue) risultanze con un (probabile) incremento dellambiguità. Le ambiguità residue potranno essere risolte grazie sia alla conoscenza di dominio che di contesto che permetteranno di selezionare la rappresentazione (più) corretta.

25 Esempio AyCaramba serves meat Viene descritto levento del servire che richiede lesistenza di qualcuno che serva e di qualcosa che sia servito.

26 Analisi composizionale

27 Augmented Rules Ciò può essere realizzato by attaching semantic formation rules alle regole sintattiche della CFG. Esempi di augmented rules dove ciascun α è un costituente sintattico della regola. Ovvero: La semantica che viene associata ad A può essere calcolata da qualche funzione applicata alla semantica delle parti di A.

28 Augmented Rules Gli attachment sono costituiti da istruzioni che specificano come calcolare il significato della frase A.sem dai significati dei suoi costituenti, ovvero dallattivazione della funzione f su qualche sottoinsieme degli attachment semantici dei costituenti di A.

29 Analisi composizionale

30 Example AyCaramba serves meat Easy parts… NP -> PropNoun NP -> MassNoun PropNoun -> AyCaramba MassNoun -> meat These attachments consist of assigning constants and copying semantics from children up to parents. Attachments {PropNoun.sem} {MassNoun.sem} {AyCaramba} {Meat }

31 Esempio AyCaramba serves meat

32 VP domina sia serves che meat. E necessario incorporare il significato della NP nel significato del verbo e assegnare la rappresentazione risultante alla VP.sem Ciò consiste nel sostituire la variabile y con il termine logico meat come secondo argomento del ruolo Served dellevento Serves

33 Esmpio AyCaramba serves meat Possiamo ora combinare composizionalmente quanto fatto per i vari costituenti sintattici E necessario incorporare il significato sia della NP che della VP nel significato della frase e assegnare la rappresentazione risultante alla S Ciò consiste nel sostituire la variabile x con il termine logico AyCaramba come secondo argomento del ruolo Server dellevento Serves

34 Esempio notazione lambda estensione FOPC S -> NP VP VP -> Verb NP Verb -> serves {VP.sem(NP.sem)} {Verb.sem(NP.sem) Ciò consiste nel prendere la semantica di un figlio ed applicarla come una funzione alla semantica dellaltro figlio

35 Composizionalità forte La semantica del tutto (la frase) è stata derivata solamente dalla semantica delle singole componenti/parti (i.e. noi ignoriamo cosa ci sia nelle altre parti dellalbero).

36 Esempio complesso Dovè la complessità? Quale ruolo assume Harry?

37 Esempio complesso La VP per told è VP -> V NP Vpto Quale dovrebbe essere il suo attachment semantico? –Associare la funzione semantica collegata a Vpto con la semantica della NP; ciò fa emergere Harry come lattore (goer) dellazione dellandare. –Associare la semantica di V alla semantica della NP; ciò fa emergere Harry come loggetto (tellee) dellazione del dire Quindi il risultato delle associazioni ci fornisce il giusto valore delle cose dette. V.Sem(NP.Sem, Vpto.Sem(NP.Sem))

38 Esempio (a) Consideriamo gli attachment per VP VP -> Verb NP NP (gave Mary a book) VP -> Verb NP PP (gave a book to Mary) Assumiamo che le rappresentazioni del significato di entrambe siano le stesse. Associando una valenza forte al lessico, i VP attachments sono: VP.Sem(NP.Sem, NP.Sem) VP.Sem(NP.Sem, PP.Sem)

39 Esempio (b) Associando una valenza forte alla sintassi noi potremmo avere qualcosa del genere VP -> V NP NP V.sem ^ Recip(NP1.sem) ^ Object(NP2.sem) VP -> V NP P V.Sem ^ Recip(PP.Sem) ^ Object(NP1.sem) Ovvero il verbo contribuisce da solo al predicato, la grammatica conosce i ruoli.

40 Se si integra lanalisi semantica nel parser mentre è in funzione … + Si possono usare i constraint semantici per eliminare interpretazioni sintattiche senza senso - Si assegna una rappresentazione del significato ai costituenti che non prendono parte nella maniera corretta alla analisi sintattica Integrazione

41 Frasi con quantificazioni Consideriamo la frase inglese A restaurant serves meat. assumiamo che A restaurant possa essere rappresentato come con la notazione lambda si ha

42 Termini complessi Permettere al sistema composizionale di utilizzare rappresentazioni (come oggetti con le parti) del tipo: Complex-Term

43 Conversione Termini complessi vengono racchiusi (embedded) allinterno di predicati. Quindi vengono fatti emergere opportunamente per ridistribuire le componenti della rappresentazione P( ) diventa Quantifier var body connective P(var)

44 Esempio

45 Quantificatori e connetivi logici Se si è in presenza del quantificatore esistenziale, allora il connettivo è ^ (and) Se si è in presenza del quantificatore universale, allora il connettivo è -> (implicazione)

46 (più) Termini complessi La tecnica della conversione sposta i quantificatori fuori e prima dellinizio della forma logica … Ciò causa ambiguità se cè più di un termine complesso allinterno della stessa frase.

47 Ambiguità dei quantificatori Consideriamo la frase Every restaurant has a menu che può avere più di un significato : ogni ristorante ha un menù –oppure esiste qualche (mega) menù e tutti i ristoranti hanno quel menù

48 Ambiguità dello scopo del quantificatore

49 Ambiguità Questo problema è simile al problema dell attachment delle frasi preposizionali (prepositional phrase attachment ) Il numero delle possibili interpretazioni cresce esponenzialmente con il numero di termini complessi presenti nella frase In assenza di soluzioni generali, ciò che possiamo fare è utilizzare metodi deboli (weak methods) per preferire una interpretazione ad unaltra

50 Non-composizionalità Nel linguaggio corrente esistono molti casi in cui non ha senso applicare il principio della composizionalità, il significato (mal definito) del termine non può essere derivato dal significato delle sue componenti/parti –Idiomi, giochi di parole, espressioni ironiche o sarcastiche, metafore, richieste indirette, …

51 Non-composizionalità Occhio di bue, prendere al volo lofferta, di palo in frasca, due piccioni con una fava, cadere dalle nuvole, la grande guerra, etc… In molte di queste… costruzioni il significato dellespressione come unico evento è a seconda dei casi –totalmente scorrelato dal significato delle singole parti –correlato in qualche modo oscuro e molto vago

52 Esempio La punta delliceberg Di questa frase possiamo dire varie cose; trattasi di 1.Una frase specifica con un significato particolare 2.Una frase flessibile sintatticamente e lessicalmente con un significato particolare 3.Una frase flessibile sintatticamente e lessicalmente con un significato parzialmente composizionale 4.…

53 Esempio Si consideri la frase: Enron is the tip of the iceberg. NP -> the tip of the iceberg Non va proprio bene… per esempio… –the tip of Mrs. Fords iceberg –the tip of a 1000-page iceberg –the merest tip of the iceberg E cosa dire di –Thats just the icebergs tip.

54 Esempio NP -> the tip of the iceberg Ciò che sembra che ci serva è qualcosa del tipo NP -> una NP iniziale con tip come sua head seguita da una successiva PP con of come sua head e che abbia iceberg come head della sua NP e che permetta modificatori del tipo merest, Mrs. Ford, e 1000-page per modificare le forme semantiche rilevanti

55 Analisi semantica robusta Le grammatiche tradizionali generalmente non riflettono i contenuti semantici in maniera diretta ed esplicita; le strutture sintattiche prodotte spesso non sono utili per effettuare lanalisi semantica utilizzando il principio della composizionalità; infatti: –elementi con un ruolo semantico chiave sono spesso distribuiti allinterno dellalbero sintattico rendendo molto complessa la composizionalità –gli alberi sintattici contengono molti costituenti sintattici che non hanno alcun ruolo nellelaborazione semantica –la generalità informativa di molti costituenti sintattici produce attchment semantici che possono creare rappresentazioni semantiche prive o quasi di significato

56 Analisi semantica robusta Per risolvere questo problema si può agire in modi diversi per migliorare lefficienza delle operazioni: estendendo il ruolo delle grammatiche (con lintroduzione delle espressioni lambda e dei termini complessi,) riscrivendo la grammatica per riflettere la semantica

57 Esempio -distribuzione di elementi con significato allinterno dellalbero -molti nodi non rilevanti per il significato della frase

58 Esempio - costituenti sintattici ad un giusto livello di generalità per la sintassi, ma troppo vaghi semanticamente Si consideri la regola per il termine complesso (some) Italian food Nominal->Adj Nominal {λx Nominal.sem(x)^AM(x,Adj.sem)} lapplicazione di un tale attachment produce questa rappresentazione: x Isa(x,Food) AM(x,Italian) che non sta ad indicare linterpretazione sottintesa cibo preparato in un modo particolare e speciale

59 Grammatiche semantiche Le grammatiche semantiche (sviluppate per lanalisi del dialogo in sistemi di Q/A con un vocabolario ristretto e complessità grammaticale limitata) vanno nella direzione di supportare lanalisi composizionale; (regole CFG con un set di terminali). Le regole (scritte per soddisfare le necessità della semantica piuttosto che della sintassi) ed i costituenti della grammatica corrispondono esattamente alle entità ed alle relazioni del dominio analizzato Il termine grammatica semantica si riferisce alla motivazione delle regole della grammatica + si generano esattamente le regole semantiche che servono - è necessario sviluppare una nuova grammatica per ciascun nuovo dominio

60 Grammatiche semantiche Esempio Si consideri una possibile regola per rispondere ad una richiesta di informazione del tipo Request I want to go to eat FoodType TimeExpr { some attachment } Per Italian food potremmo usare la regola FoodType -> Nationality FoodType che stabilisce che il tipo di cibo deve essere collegato alla caratteristica nazionale

61 Grammatiche semantiche –Regole difficilmente riusabili in contesti diversi –Possibile overgenerazione; per esempio il termine Canadian restaurant non viene usato nella stessa accezione di Italian food, bensì nel senso di ristorante in Canada La motivazione del significato è al di là delle parole, è nel dominio culturale dei cibi

62 Estrazione di informazione da testi IE Nei sistemi per lestrazione di informazione da testi siamo interessati a riconoscere solo informazioni specifiche: si richiede un approccio diverso Tali sistemi devono gestire –Frasi reali (e quindi arbitrariamente lunghe e complesse) –Una semantica superficiale Liste piatte di coppie attributo-valore XML/SGML

63 Esempi Analisi di articoli di quotidiani, notizie di agenzia per lidentificazione di uno specifico insieme di eventi di interesse Analisi di siti web alla ricerca di prodotti, prezzi, etc Questi testi hanno caratteristiche peculiari: Frasi lunghe, sintassi complessa (e talvolta incorretta) autori diversi, …

64 Sistemi di IE I sistemi di IE sono in genere basati su una cascata di automi per riconoscere fenomeni specifici e tralasciare parti non rilevanti del testo anlizzato Vengono riconosciuti elementi di sintassi/semantica isolati dal contesto e quindi usati in una fase successiva di processing fino ad ottenere il risultato finale Il risultato finale dellelaborazione è un insieme di relazioni e valori che vengono successivamnete memorizzati in una base di dati

65 Esempio (MUC) Bridgestone Sports Co. said Friday it has set up a joint venture in Taiwan with a local concern and a Japanese trading house to produce golf clubs to be shipped to Japan. The joint venture, Bridgestone Sports Taiwan Co., capitalized at 20 million new Taiwan dollars, will start production in January 1990 with production of 20,000 iron and metal wood clubs a month.

66 Esempio Bridgestone Sports Co. said Friday it has set up a joint venture in Taiwan with a local concern and a Japanese trading house to produce golf clubs to be shipped to Japan. The joint venture, Bridgestone Sports Taiwan Co., capitalized at 20 million new Taiwan dollars, will start production in January 1990 with production of 20,000 iron and metal wood clubs a month.

67 Esempio Bridgestone Sports Co. said Friday it has set up a joint venture in Taiwan with a local concern and a Japanese trading house to produce golf clubs to be shipped to Japan. The joint venture, Bridgestone Sports Taiwan Co., capitalized at 20 million new Taiwan dollars, will start production in January 1990 with production of 20,000 iron and metal wood clubs a month.

68 Esempio Bridgestone Sports Co. said Friday it has set up a joint venture in Taiwan with a local concern and a Japanese trading house to produce golf clubs to be shipped to Japan. The joint venture, Bridgestone Sports Taiwan Co., capitalized at 20 million new Taiwan dollars, will start production in January 1990 with production of 20,000 iron and metal wood clubs a month.

69 FASTUS Output (Hobbs 1997)

70 Cascata di processi

71 Punti rilevanti Il riconoscimento delle named entities di un testo permette di riconoscere nomi di persone, organizzazioni, luoghi, etc. Le named entities vengono riconosciute in modo robusto con metodi riutilizzabili in applicazioni diverse

72 Punti rilevanti E tutte le altre componenti del testo? Possono essere ignorate! –Non servono per le successive fasi di processing e quindi non è necessario elaborarle

73 Punti rilevanti Lapproccio metodologico dei sistemi di IE funziona in quanto ci si pone in un contesto applicativo limitato –Si ricerca solo un insieme limitato di item che può quindi apparire in un insieme limitato di regole

74 Esempio reale The White House said President Bush has approved duty-free treatment for imports of certain types of watches that arent produced in significant quantities in the U.S., the Virgin Islands and other U.S. possessions. WSJ Markup Example

75 Elaborazione del linguaggio naturale Le presentazioni sugli argomenti di elaborazione del linguaggio naturale fanno in alcuni passi riferimento ad alcune presentazioni dei colleghi prof. Fabio Massimo Zanzotto e dottor Marco Pennacchiotti, del dottor Patrick Pantel (ISI-USC), oltre che ad alcune parti del libro: Speech and Language Processing, Prentice Hall, 2000, autori D.Jurafsky, J. H. Martin.


Scaricare ppt "Semantica Maria Teresa PAZIENZA a.a. 2006-07. Programma Breve introduzione allNLP Linguaggi Naturali e Linguaggi Formali Complessità Morfologia Teoria:"

Presentazioni simili


Annunci Google