Elaborazione del linguaggio naturale morfologia, FSA, FST, POS esercizi Maria Teresa PAZIENZA
FSA ESERCIZIO 1 1.Disegnare (se esistono) gli FSA che riconoscono/generano i seguenti linguaggi regolari: La={ac,abc,abbc,abbbc, …} Lb={ac,abb} Lc= {ac,acdc,acdcdc, …} Ld= {ac,ab,acdc,abdb,abdc,acdb,acdcdc, …} 2.Scrivere le transition table relative agli FSA
Soluzione esercizio q0q0 q0q0 q2q2 q2q2 q1q1 q1q1 ESERCIZIO 1 La = {ac,abc,abbc,abbbc, …} Lb = {ac,abb} q0q0 q0q0 q1q1 q1q1 ESERCIZIO 1 q3q3 q3q3 q2q2 q2q2 B A
Soluzione esercizio ESERCIZIO 1 Lc = {ac,acdc,acdcdc, …} q0q0 q0q0 q2q2 q2q2 q1q1 q1q1 q3q3 q3q3 c Ld = {ac,ab,acdc,abdb,abdc,acdb,acdcdc, …} q0q0 q0q0 q2q2 q2q2 q1q1 q1q1 d b D C
Soluzione esercizio INPUT STATEabc q0q0 q1q1 00 q1q1 0q1q1 q2q2 q2q2 000 ESERCIZIO 2 TRANSITION TABLE A INPUT STATEabc q0q0 q1q1 00 q1q1 0q3q3 q2q2 q2q2 000 q3q3 0q2q2 0 TRANSITION TABLE B
Soluzione esercizio INPUT STATEabcd q0q0 q1q1 000 q1q1 00q2q2 0 q2q2 000q3q3 q3q3 00q2q2 0 ESERCIZIO 2 TRANSITION TABLE C INPUT STATEabcd q0q0 q1q1 000 q1q1 0q2q2 q2q2 0 q2q2 000q1q1 TRANSITION TABLE D
ESERCIZIO 1 Soluzione alternativa esercizio Ld = {ac,ab,acdc,abdb,abdc,acdb,acdcdc, …} abcd 01/// 1/23/ 2///1 3///1 Transition table Regex Ld = a(b|c)(d(b|c))*
FSA 1.Scrivere un FSA che riconosca espressioni “monetarie” del tipo: “uno euro”, “due euro”, “venti tre euro”, “venti uno euro dieci cent”, “trenta due euro trenta quattro centesimi”, “due cent”…. Il cui vocabolario sia ={uno, due, tre,…dieci,venti,…,euro,cent} 2.Scrivere la relativa state-transition table 3.Scrivere l’espressione regolare associata all’FSA ESERCIZIO 2
Soluzione esercizio Es 2
FSA 1.Scrivere un FSA che riconosca sintagmi nominali per l’Inglese, ovvero: - nomi propri (es. “John”) - nomi comuni preceduti da articoli e eventualmente da un numero variabile di aggettivi (es. “the new yellow table”) - combinazione di sintagmi dei due punti precedenti preceduti da preposizioni (es. “the new yellow table of John”) 2.Scrivere la relativa state-transition table ESERCIZIO 3
FSA per la morfologia 1.Scrivere un FSA che riconosca la morfologia derivazionale degli aggettivi inglesi, ovvero: Un aggettivo può avere come prefisso negante “un-” Un aggettivo può avere forma comparativa, superlativa e avverbiale (rispettivamente i suffissi –er,-est,-ly) 2.Aggiungere all’FSA il seguente fatto: Esistono alcuni aggettivi “irregolari” che non possono prendere “un-” e “-ly” (es: big, cool) 3.Integrare il lessico: regolari: “clear, happy”, irregolari: “big,cool” ESERCIZIO 4
Soluzione esercizio un-adj_reg -er -est -ly adj_reg Clear Happy LESSICO
ESERCIZIO 4 2 a 0124 un-adj_reg -er -est -ly 3 adj_irr -er -est Soluzione esercizio adj_regadj_irr Clear Happy Big cool LESSICI
ESERCIZIO 4 2 b 0125 un-adj_reg -er -est -ly 4 adj_irr -er -est 3 adj_reg Soluzione esercizio adj_regadj_irr Clear Happy Big cool LESSICI
Identificazione dei morfemi A 1.Scrivere l’ FST che modelli la morfologia dei nomi singolari/plurali prendendo in considerazione la regola ortografica dell’ y-replacement: -y cambia in –ie prima della –s ES: berry berries B 1.Scrivere l’ FST che modelli la morfologia dei verbi presente/passato prendendo in considerazione la regola ortografica della k-insertion, sapendo che: In generale la forma passata si forma dal presente apponendo come suffisso la particella –ed (ES: press press-ed) La k-inserion prevede che ai verbi terminanti in vocale+c sia aggiunta la k (ES: panic panic + k +ed) ESERCIZIO 5
A s:s 3 :+ 2 other :y i: e: 45 :+ s:s :i 6 :e Soluzione esercizio 5 ESERCIZIO 5
B d:d 3 :+ 2 cons:cons k: voc:voc c:c 45 :+ :: 6 e:e 6 d:d :: ESERCIZIO 5 Soluzione esercizio 5
POS Tagging: Chaos ESERCIZIO 6 Verificare quali interpretazioni di POS tagging Chaos produrrebbe avendo in input le seguenti frasi: a.“La vecchia porta la sbarra” b.“I maestri di Platone furono critici” Analizzando il processi nelle sue diverse fasi: 1.Ricerca nel lessico delle parole 2.Utilizzo delle regole lessicali per le parole non presenti nel lessico 3.Disambiguazione: scelta del POS tag più frequente 4.Utilizzo delle regole contestuali
Suggerimenti per esercizi Per la migliore comprensione degli argomenti svolti nelle presentazioni NLP 1,2,3 si suggerisce di cimentarsi anche con gli esercizi del libro Speech and Language Processing, Prentice Hall, 2000, autori: D.Jurafsky, J. H. Martin In particolare: Capitolo 2, esercizi n. 2.1, 2.3, 2.4, 2.5, 2.6, 2.8, 2.10 Capitolo 3, esercizi n. 3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.8, 3.9 Capitolo 8, esercizi n. 8.1, 8.2, 8.3, 8.6 facoltativo Chiunque sia interessato, può, ovviamente, aumentare il numero di esercizi del libro su cui cimentarsi e/o chiedere al docente ulteriori testi.