La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Modelli di Calcolo e Lingue R. Basili TAL - a.a. 2005-2006.

Presentazioni simili


Presentazione sul tema: "Modelli di Calcolo e Lingue R. Basili TAL - a.a. 2005-2006."— Transcript della presentazione:

1 Modelli di Calcolo e Lingue R. Basili TAL - a.a

2 Sommario Motivazioni Motivazioni Cenni di Linguistica Cenni di Linguistica Alcune nozioni computazionali Alcune nozioni computazionali

3 Motivazioni Un sistema di TAL fa riferimento a: Un sistema di TAL fa riferimento a: –Dati che rappresentano fenomeni linguistici Astrazioni (o teorie) linguistiche Astrazioni (o teorie) linguistiche Formalismi o Codifiche Formalismi o Codifiche –Paradigmi (o astrazioni) del calcolo Grammatiche e Automi Grammatiche e Automi Algebre Logiche Algebre Logiche Modelli quantitativi Modelli quantitativi Modelli induttivi Modelli induttivi –Algoritmi per la analisi Lessicale, Grammaticale e Semantica

4 Motivazioni (2) Una tipica architettura del TAL Una tipica architettura del TAL

5 TAL: Una tipica architettura Analisi Lessicale Analisi Sintattica Analisi Semantica An. Pragmatica / Applic. Lessico Grammatica Modello del mondo Modello della applicazione testo Tokens+ features Struttura frase Interpretazione/Azione Forma Logica

6 Motivazioni (3) In questa sezione del programma ci interessiamo a definire un vocabolario per lapprofondimento (di alcuni) dei temi sopra elencati In questa sezione del programma ci interessiamo a definire un vocabolario per lapprofondimento (di alcuni) dei temi sopra elencati Elementi di Linguistica Elementi di Linguistica Elementi di Informatica Elementi di Informatica Applicazioni Applicazioni

7 Modelli e Algoritmi Modelli: Astrazioni e formalismi per esprimere diversi tipi di strutture linguistiche. Modelli: Astrazioni e formalismi per esprimere diversi tipi di strutture linguistiche. –Automi (FSA, traduttori, modelli di markov) –Sistemi formali di regole (grammatiche context-free, sistemi di feature) –Logica (calcolo dei predicati ed inferenza) –Modelli Probabilistici di quelli sopra elencati Algoritmi usati per manipolare le rappresentazioni e creare altre strutture. Algoritmi usati per manipolare le rappresentazioni e creare altre strutture. –Alg. Di Ricerca (A*, programmazione dinamica) –Apprendimento Induttivo etc etc

8 Elementi di Linguistica Livello morfologico, sintattico e semantico Livello morfologico, sintattico e semantico La nozione di grammatica La nozione di grammatica Grammaticalità e significato Grammaticalità e significato Fenomeni e Proprietà Grammaticali Fenomeni e Proprietà Grammaticali Il Lessico Il Lessico

9 Linguistica: la prospettiva Interna/Internalistica Noam Chomsky, Syntactic Structures, Noam Chomsky, Syntactic Structures, Linguistica interna: studio del linguaggio come capacità cognitiva dellindividuo. Oggetto dello studio è la dimensione psicologica e biologica del linguaggio. Linguistica interna: studio del linguaggio come capacità cognitiva dellindividuo. Oggetto dello studio è la dimensione psicologica e biologica del linguaggio. Oggetti di studio sono -la lingua come conoscenza (lingua interna) -la facoltà del linguaggio (Saussure) o l istinto del linguaggio (Darwin). Oggetti di studio sono -la lingua come conoscenza (lingua interna) -la facoltà del linguaggio (Saussure) o l istinto del linguaggio (Darwin). La linguistica interna classica: lo studio del linguaggio come specchio della mente nella filosofia razionalista. La linguistica interna classica: lo studio del linguaggio come specchio della mente nella filosofia razionalista.

10 Contributi della LI La linguistica interna della seconda metà del XX secolo ha introdotto La linguistica interna della seconda metà del XX secolo ha introdotto –modelli teorici precisi –con un certo grado di profondità deduttiva –verificabili empiricamente Lo studio del linguaggio nello stile galileiano. Lo studio del linguaggio nello stile galileiano.

11 Obbiettivi Domande fondamentali del programma della grammatica generativa, la linea di ricerca principale della moderna linguistica interna: Domande fondamentali del programma della grammatica generativa, la linea di ricerca principale della moderna linguistica interna: 1.Che cosè la conoscenza della lingua materna? (Competenza) 2.Come la si mette in opera nelluso del linguaggio? (Esecuzione/Performance) 3.Come la si acquisisce nellinfanzia? (Acquisizione della facoltà di linguaggio) 4.Come è rappresentata fisicamente nel cervello?

12 CREATIVITA E RICORSIVITA La creatività delluso linguistico normale come problema centrale della linguistica interna 1.costante novità degli enunciati prodotti e compresi 2. carattere non deterministico ma appropriato del comportamento linguistico del parlante.

13 Ricorsività Qualunque parlante è in grado di capire e produrre un numero illimitato di frasi Qualunque parlante è in grado di capire e produrre un numero illimitato di frasi La conoscenza della lingua non è la memorizzazione di una lista La conoscenza della lingua non è la memorizzazione di una lista Stima delle frasi possibili in francese per L=10 parole: (M. Gross) Stima delle frasi possibili in francese per L=10 parole: (M. Gross) W. von Humboldt: la lingua fa un uso infinito di mezzi finiti W. von Humboldt: la lingua fa un uso infinito di mezzi finiti

14 Ricorsività: PdI La conoscenza della lingua è conoscenza di un sistema di regole che possono generare un numero potenzialmente illimitato di frasi La conoscenza della lingua è conoscenza di un sistema di regole che possono generare un numero potenzialmente illimitato di frasi Principio di Induzione (G. Peano): Principio di Induzione (G. Peano): 1) 1 appartiene a N 1) 1 appartiene a N 2) se X appartiene a N, allora X + 1 appartiene a N 2) se X appartiene a N, allora X + 1 appartiene a N 3) nientaltro appartiene a N 3) nientaltro appartiene a N Es (1+1)+1 ((1+1)+1)+1 ……… Es (1+1)+1 ((1+1)+1)+1 ………

15 Ricorsività e Linguaggio Ricorsività: proprietà che hanno certe regole formali di potersi riapplicare indefinitamente sul loro stesso risultato Ricorsività: proprietà che hanno certe regole formali di potersi riapplicare indefinitamente sul loro stesso risultato Esempi di ricorsività nelle lingue naturali Esempi di ricorsività nelle lingue naturali –Ho incontrato Gianni, Francesco, Piero, Maria,…. –Mario ha risposto ala zia del cugino dello zio del figlio di …

16 Ricorsività e Linguaggio (2) –Il fratello [dellamico [del cugino [di un collega [di….]]]] –Credo [che Mario abbia detto [che la gente pensi [che qualcuno tema [che…]]]] –Ho incontrato [lautore [che ha scritto [il libro [che ha entusiasmato [la giuria [che ha assegnato [il premio [che…..]]]]]]]] La conoscenza della lingua è il possesso tacito di un sistema di regole ricorsive che generano frasi (grammatica generativa) La conoscenza della lingua è il possesso tacito di un sistema di regole ricorsive che generano frasi (grammatica generativa)

17 Grammatica e Sostituibilità Piero ama Pina Piero ama Pina La mamma nutre Piero La mamma nutre Piero Il cane morde il gatto Il cane morde il gatto N = {Piero,Pina, la mamma, il cane, il gatto} N = {Piero,Pina, la mamma, il cane, il gatto} V = {ama,nutre,morde} V = {ama,nutre,morde} : N x V x N oppure N V N : N x V x N oppure N V N

18 Grammatica e Sostituibilità La formalizzazione La formalizzazione N V N N V N si legge Ogni espressione che esprime la sequenza di un elemento dellinsieme N di eun elemento dellinsieme V e dellelemento dellinsieme N definisce un costituente valido nellinsieme delle frasi si legge Ogni espressione che esprime la sequenza di un elemento dellinsieme N di eun elemento dellinsieme V e dellelemento dellinsieme N definisce un costituente valido nellinsieme delle frasi Ha quindi un carattere Ha quindi un carattere –descrittivo –procedurale

19 Grammatica e Sostituibilità (2) Vantaggi: Vantaggi: –Maggiore livello di astrazione –Formalismo algebrico per controllare il dato linguistico (empirico) –Formalismo che esprime sistematicamente la ricorsività, ad es. NP Art NPA NP Art NPA NPA N | Adj NPA | NPA PP NPA N | Adj NPA | NPA PP

20 Sostituibilità e Ricorsività Il primo figlio di Pino … =>Il primo figlio di Pino … => ( (Il) Art ( (primo) Adj ( ((figlio) N ) NPA (di Pino) PP ) NPA ) NPA ) NP ( (Il)Art ( (primo)Adj ( (primo)Adj ( ( (figlio)N )NPA ( (figlio)N )NPA (di Pino)PP (di Pino)PP )NPA )NPA )NP )NP

21 Problemi e limitazioni La soluzione iniziale non copre La soluzione iniziale non copre –Piero e Pina amano la mamma Questo per due motivazioni Questo per due motivazioni –Lessicali: amano N –Sintattiche: la coordinazione non e prevista dalla ggrammatica => V = V {amano} ={ama,nutre,morde,amano} => V = V {amano} ={ama,nutre,morde,amano} => N V N | N e N V N => N V N | N e N V N

22 Problemi e limitazioni La nuova grammatica overgenera: La nuova grammatica overgenera: Infatti ritiene come ammissibili Infatti ritiene come ammissibili –Pino e Anna ama la mamma –Pino amano la mamma Cio che non viene rappresentato e il numero e laccordo in numero tra i soggetti delle frasi ed il verbo Cio che non viene rappresentato e il numero e laccordo in numero tra i soggetti delle frasi ed il verbo

23 Soluzioni Associare agli elementi lessicali i loro tratti (ad esempio genere e numero) Associare agli elementi lessicali i loro tratti (ad esempio genere e numero) –Determinare quindi classi di elementi grammaticali che sono caratterizzate dagli stessi tratti (Nsing/Nplur, V1Sing/…/V3plur) Restringere le regole della grammatica a considerare solo le classi compatibili ( Nsing V3sing N ) Restringere le regole della grammatica a considerare solo le classi compatibili ( Nsing V3sing N )

24 Tratti linguistici Sono espressi/definiti dal lessico Sono espressi/definiti dal lessico –V3sing ama, V3plur amano Definiscono caratteristiche morfo-sintattiche degli elementi di una lingua Definiscono caratteristiche morfo-sintattiche degli elementi di una lingua Sono loggetto della analisi morfologica Sono loggetto della analisi morfologica Possono essere ambigui Possono essere ambigui –V1sing sia, V2sing sia, V3sing sia

25 DATI EMPIRICI 1. Corpus di produzioni naturali 1. Corpus di produzioni naturali 2. Giudizi metalinguistici 2. Giudizi metalinguistici 3. Esperimenti di comprensione (cronometria mentale,…) 3. Esperimenti di comprensione (cronometria mentale,…) 4. Esperimenti di produzione (ripetizione,…) 4. Esperimenti di produzione (ripetizione,…) 5. Studio delle patologie (dello sviluppo, acquisite…) 5. Studio delle patologie (dello sviluppo, acquisite…) 6. Tecniche di neuroimmagine (ERP, PET, fMRI,…) 6. Tecniche di neuroimmagine (ERP, PET, fMRI,…)

26 Grammaticalita (1) La signora ha comprato il giornale (2) *Il ha giornale la comprato signora (3) *Signora comprare giornale (4) Colorless green ideas sleep furiously (N. Chomsky) (5) * Green sleep colorless furiously ideas (6) I pirotti carulizzano elatticamente (R.Carnap) (7) *carulizzano i elatticamente pirotti La nozione di grammaticalità è distinta dalla nozione di avere un senso: ci sono frasi agrammaticali a cui assegnamo facilmente un senso (come (3)), e frasi grammaticali a cui non possiamo assegnare un senso (come (6)), ma che distinguiamo agevolmente da sequenze arbitrarie di parole come (7). La nozione di grammaticalità è distinta dalla nozione di avere un senso: ci sono frasi agrammaticali a cui assegnamo facilmente un senso (come (3)), e frasi grammaticali a cui non possiamo assegnare un senso (come (6)), ma che distinguiamo agevolmente da sequenze arbitrarie di parole come (7).

27 Ambiguita (8) Gianni guardava la ragazza con il binocolo (ambigua) (8) Gianni guardava la ragazza con il binocolo (ambigua) (9) Gianni la guardava con il binocolo (non ambigua) (9) Gianni la guardava con il binocolo (non ambigua) (10) Gianni conosceva la ragazza con il binocolo (non amb.) (10) Gianni conosceva la ragazza con il binocolo (non amb.) (15) Ogni uomo ama sua madre (ambigua) (15) Ogni uomo ama sua madre (ambigua) (16) Sua madre ama ogni uomo (non ambigua) (16) Sua madre ama ogni uomo (non ambigua)

28 Sinonimia (17) Gianni ha aiutato Piero (17) Gianni ha aiutato Piero (18) Piero è stato aiutato da Gianni (sinonima) (18) Piero è stato aiutato da Gianni (sinonima) (19) Piero ha aiutato Gianni (non sinonima) (19) Piero ha aiutato Gianni (non sinonima)

29 Contraddittorieta E Inappropriatezza (21) # Gianni ha ucciso il cane, che però non è morto (21) # Gianni ha ucciso il cane, che però non è morto (22) # Ieri mattina uscirò alle sette (22) # Ieri mattina uscirò alle sette (…) (…)

30 Modelli Il linguaggio è suono con senso. Quindi sapere una lingua vuol dire avere la capacità di Il linguaggio è suono con senso. Quindi sapere una lingua vuol dire avere la capacità di 1.rappresentarsi internamente i suoni 2.rappresentarsi internamente i sensi 3.associare rappresentazioni di suoni e di sensi su un dominio illimitato.

31 Modelli (2) I. approssimazione: I segni linguistici come entità bifacciali. I. approssimazione: I segni linguistici come entità bifacciali. Un primo passo è lidea tradizionale che le espressioni linguistiche sono entità a due facce. Un primo passo è lidea tradizionale che le espressioni linguistiche sono entità a due facce. Secondo Saussure i segni linguistici sono costituiti da un significante e da un significato, associati arbitrariamente. Secondo Saussure i segni linguistici sono costituiti da un significante e da un significato, associati arbitrariamente. Questo approccio consente la costruzione di teorie sistematiche del lessico, ma non rende ancora conto della creatività, della capacità di creare infinite combinazioni di segni. Questo approccio consente la costruzione di teorie sistematiche del lessico, ma non rende ancora conto della creatività, della capacità di creare infinite combinazioni di segni.

32 Modelli (3) II. approssimazione: Lessico e sintassi. II. approssimazione: Lessico e sintassi. Quindi, un modello della competenza linguistica deve specificare almeno: Quindi, un modello della competenza linguistica deve specificare almeno: –a. Un lessico. –b. Un sistema di computazioni mentali. Vale a dire, un sistema di regole mentali che calcolino strutture mettendo insieme elementi del lessico per formare unità via via più complesse. –c. Interfacce: porte attraverso le quali il sistema mentale per il linguaggio scambia informazioni con i sistemi cognitivi non specificamente linguistici: i sistemi articolatorio-percettivo e i sistemi di pensiero.

33 Modelli (4) Quindi, sapere una lingua vuol dire possedere un sistema di calcolo mentale che computa strutture, rappresentazioni mentali di entità linguistiche: parole, frasi, testi, ecc. Quindi, sapere una lingua vuol dire possedere un sistema di calcolo mentale che computa strutture, rappresentazioni mentali di entità linguistiche: parole, frasi, testi, ecc. In questo modo di vedere le cose, il nucleo computazionale del sistema è la sintassi ricorsiva, che consente di generare infinite strutture. In questo modo di vedere le cose, il nucleo computazionale del sistema è la sintassi ricorsiva, che consente di generare infinite strutture. Lidea della mente computazionale si è rivelata esportabile ad altri ambiti della cognizione, le capacità cognitive si sono rivelate accessibili allo studio come capacità computazionali specifiche di certi domini: linguaggio, ragionamento, visione, presa di decisioni, controllo motorio, ecc. (modularità). Lidea della mente computazionale si è rivelata esportabile ad altri ambiti della cognizione, le capacità cognitive si sono rivelate accessibili allo studio come capacità computazionali specifiche di certi domini: linguaggio, ragionamento, visione, presa di decisioni, controllo motorio, ecc. (modularità).

34 Modelli (5) III. approssimazione: Livelli gerarchizzati di analisi. III. approssimazione: Livelli gerarchizzati di analisi. Un ulteriore raffinamento di questo modello deve tener conto del fatto che anche il lessico ha una suo struttura interna esprimibile in termini di inventari e computazioni; ritroviamo questa articolazione su almeno tre livelli gerarchizzati: Un ulteriore raffinamento di questo modello deve tener conto del fatto che anche il lessico ha una suo struttura interna esprimibile in termini di inventari e computazioni; ritroviamo questa articolazione su almeno tre livelli gerarchizzati:

35 Livelli Linguistici Fonologia Fonologia –Fonemi (unità minime con valore distintivo, costituite di tratti distintivi): pari – Bari, fino – vino, cara – gara… –Regole di combinazione dei fonemi: tre - *rte,… Morfologia Morfologia –a. Morfemi (unità minime con significato autonomo) –b. Regole di formazione delle parole Sintassi Sintassi –a. Parole –b. Regole di formazione dei sintagmi

36 Livelli Linguistici (2) Semantica Si distribuisce sulla morfologia e la sintassi Linterpretazione semantica rispetta il principio di composizionalità:Linterpretazione semantica rispetta il principio di composizionalità: il significato di una unità di ordine superiore è funzione dei significati dei suoi componenti di ordine inferiore e della struttura – [[in-[[evita-]-bil-]]-mente] –[ Gianni [ aiuta Maria ]] –[ Maria [ aiuta Gianni ]] quindi, larbitrarietà del segno riguarda le entità atomiche dotate di significato, i morfemi, non le entità complesse. quindi, larbitrarietà del segno riguarda le entità atomiche dotate di significato, i morfemi, non le entità complesse.

37 Livelli Linguistici (3) Fonetica. Lo studio delle proprietà fisiche e fisiologiche dei suoni del linguaggio. Acustica Articolatoria Fonetica. Lo studio delle proprietà fisiche e fisiologiche dei suoni del linguaggio. Acustica Articolatoria Pragmatica. Lo studio delluso delle strutture linguistiche per la comunicazione, linterazione sociale, il fare cose con le parole (Austin) Pragmatica. Lo studio delluso delle strutture linguistiche per la comunicazione, linterazione sociale, il fare cose con le parole (Austin)

38 Sintesi Un sistema di TAL gestisce dati (ed algoritmi) basati su astrazioni (teorie) linguistiche e su concetti informatici Un sistema di TAL gestisce dati (ed algoritmi) basati su astrazioni (teorie) linguistiche e su concetti informatici I livelli linguistici principali (nella analisi delle lingue scritte) sono I livelli linguistici principali (nella analisi delle lingue scritte) sono –Livello morfologico –Livello sintattico –Livello semantico –Livello pragmatico

39 Sintesi (2) Nel livello sintatico e stato introdotta la nozione di Nel livello sintatico e stato introdotta la nozione di –grammatica formale e –grammatica a struttura sintagmatica –Grammatiche a dipendenza Le grammatiche a struttura sintagmatica forniscono come risultato delle strutture dati dette alberi (di derivazione) Le grammatiche a struttura sintagmatica forniscono come risultato delle strutture dati dette alberi (di derivazione) Le grammatiche a dipendenze definiscono delle strutture di dati dette grafi (alle dipendenze) Le grammatiche a dipendenze definiscono delle strutture di dati dette grafi (alle dipendenze)

40 Sintesi (3) Sono utili le nozioni di Sono utili le nozioni di –Tratti linguistici come le proprietà associabili ai sintagmi individuali (es. Numero e genere) che determinano un grado maggiore di astrazione e semplificano la descrizione grammaticale –Le funzioni grammaticali Il lessico riunisce informazioni morfologiche, grammaticali e semantiche delle parole individuali Il lessico riunisce informazioni morfologiche, grammaticali e semantiche delle parole individuali Una catalogazione di tipo informatico del lessico costituisce un dizionario elettronico Una catalogazione di tipo informatico del lessico costituisce un dizionario elettronico

41 Sintesi (4) Se un dizionario segue un formalismo computazionale per la automazione di decisioni linguistiche (ad es. la verifica della concordanza in numero tra soggetto e verbo) allora esso puo definirsi un lessico computazionale Se un dizionario segue un formalismo computazionale per la automazione di decisioni linguistiche (ad es. la verifica della concordanza in numero tra soggetto e verbo) allora esso puo definirsi un lessico computazionale Alcuni esempi Alcuni esempi –Un lessico grammaticale in Prolog –Wordnet

42 Riferimenti Bibliografici Lyons, Introduzione alla Linguistica Teorica, II. Grammatica, Lyons, Introduzione alla Linguistica Teorica, II. Grammatica, –Capitoli 4.1, 4.2, 4.3, 6.1, 6.2, 8.1


Scaricare ppt "Modelli di Calcolo e Lingue R. Basili TAL - a.a. 2005-2006."

Presentazioni simili


Annunci Google