Elaborazione del linguaggio naturale morfologia, FSA, FST, POS esercizi Maria Teresa PAZIENZA a.a
FSA ESERCIZIO 1 1.Disegnare (se esistono) gli FSA che riconoscono/generano i seguenti linguaggi regolari: La={ac,abc,abbc,abbbc, …} Lb={ac,abb} Lc= {ac,acdc,acdcdc, …} Ld= {ac,ab,acdc,abdb,abdc,acdb,acdcdc, …} 2.Scrivere le transition table relative agli FSA
FSA 1.Scrivere un FSA che riconosca espressioni “monetarie” del tipo: “uno euro”, “due euro”, “venti tre euro”, “venti uno ero dieci cent”, “trenta due euro trenta quattre centesimi”, “due cent”…. Il cui vocabolario sia ={uno, due, tre,…dieci,venti,…,euro,cent} 2.Scrivere la relativa state-transition table 3.Scrivere l’espressione regolare associata all’FSA ESERCIZIO 2
FSA 1.Scrivere un FSA che riconosca sintagmi nominali per l’Inglese, ovvero: - nomi propri (es. “John”) - nomi comuni preceduti da articoli e eventualmente da un numero variabile di aggettivi (es. “the new yellow table”) - combinazione di sintagmi dei due punti precedenti preceduti da preposizoni (es. “the new yellow table of John”) 2.Scrivere la relativa state-transition table ESERCIZIO 3
FSA per la morfologia 1.Scrivere un FSA che riconosca la morfologia derivazionale degli aggettivi inglesi, ovvero: Un aggettivo può avere come prefisso negante “un-” Un aggettivo può avere forma comparativa, superlativa e avverbiale (rispettivamente i suffissi –er,-est,-ly) 2.Aggiungere all’FSA il seguente fatto: Esistono alcuni aggettivi “irregolari” che non possono prendere “un-” e “-ly” (es: big, cool) 3.Integrare il lessico: regolari: “clear, happy”, irregolari: “big,cool” ESERCIZIO 4
Soluzione esercizio un-adj_reg -er -est -ly adj_reg Clear Happy LESSICO
ESERCIZIO 4 2 a 0124 un-adj_reg -er -est -ly 3 adj_irr -er -est Soluzione esercizio adj_regadj_irr Clear Happy Big cool LESSICI
ESERCIZIO 4 2 b 0125 un-adj_reg -er -est -ly 4 adj_irr -er -est 3 adj_reg Soluzione esercizio adj_regadj_irr Clear Happy Big cool LESSICI
Identificazione dei morfemi A 1.Scrivere l’ FST che modelli la morfologia dei nomi singolari/plurali prendendo in considerazione la regola ortografica dell’ y-replacement: -y cambia in –ie prima della –s ES: berry berries B 1.Scrivere l’ FST che modelli la morfologia dei verbi presente/passato prendendo in considerazione la regola ortografica della k-insertion, sapendo che: In generale la forma passata si forma dal presente apponendo come suffisso la particella –ed (ES: press press-ed) La k-inserion prevede che ai verbi terminanti in vocale+c sia aggiunta la k (ES: panic panic + k +ed) ESERCIZIO 5
A s:s 3 :+ 2 other :y i: e: 45 :+ s:s :i 6 :e Soluzione esercizio 5 ESERCIZIO 5
B d:d 3 :+ 2 cons:cons k: voc:voc c:c 45 :+ :: 6 e:e 6 d:d :: ESERCIZIO 5 Soluzione esercizio 5
POS Tagging: Chaos ESERCIZIO 6 Verificare quale intepretazioni di POS tagging Chaos produrrebbe avendo in input le seguenti frasi: a.“La vecchia porta la sbarra” b.“I maestri di Platone furono critici” Analizzando il processi nelle sue diverse fasi: 1.Ricerca nel lessico delle parole 2.Utilizzo delle regole lessicali per le parole non presenti nel lessico 3.Disambiguazione: scelta del POS tag più frequente 4.Utilizzo delle regole contestuali
Suggerimenti per esercizi ESERCIZIO 6 Per la migliore comprensione degli argomenti svolti nelle presentazioni NLP 1,2,3 si suggerisce di cimentarsi anche con gli esercizi del libro Speech and Language Processing, Prentice Hall, 2000, autori: D.Jurafsky, J. H. Martin In particolare: Capitolo 2, esercizi n. 2.1, 2.3, 2.4, 2.5, 2.6, 2.8, 2.10 Capitolo 3, esercizi n. 3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.8, 3.9 Capitolo 8, esercizi n. 8.1, 8.2, 8.3, 8.6 facoltativo Chiunque sia interessato, può, ovviamente, aumentare il numero di esercizi del libro su cui cimentarsi e/o chiedere al docente ulteriori testi.