Eventualità e relazioni temporali:

Slides:



Advertisements
Presentazioni simili
Corso di LINGUA dei SEGNI ITALIANA (LIS)
Advertisements

Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta non guidata di un corpo rettangolare in un serbatoio Velocità e rotazione.
Presente e futuro della religiosità nel nord est DIFFERENZE TRA GENERAZIONI figli e padri italo de sandre 1ids.
Valutazione d’Istituto A.S. 2008/2009
1 MeDeC - Centro Demoscopico Metropolitano Provincia di Bologna - per Valutazione su alcuni servizi erogati nel.
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
Sommario Nelle lezioni precedenti abbiamo introdotto tutti gli elementi che formano un particolare tipo di linguaggio logico, denominato linguaggio predicativo.
Frontespizio Economia Monetaria Anno Accademico
Associazione Nazionale Medici Cardiologi Ospedalieri
1 Istruzioni, algoritmi, linguaggi. 2 Algoritmo per il calcolo delle radici reali di unequazione di 2 o grado Data lequazione ax 2 +bx+c=0, quali sono.
3. Processi Stocastici Un processo stocastico è una funzione del tempo i cui valori x(t) ad ogni istante di tempo t sono v.a. Notazione: X : insieme di.
Analisi Bivariata e Test Statistici
I MATEMATICI E IL MONDO DEL LAVORO
Considerazioni sullinserimento dei giovani nellINFN Gruppo di lavoro: S. Falciano, A. Kievsky, S. Leone e il rappresentante nazionale: E. Vigezzi Assemblea.
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Maria Teresa PAZIENZA a.a
Computer, Lingue ed Applicazioni Perché comprendere tramite gli elaboratori i contenuti testuali? I testi sono i veicoli principali di significato per.
Sistemi basati su conoscenza Conoscenza e ragionamento Prof. M.T. PAZIENZA a.a
Varianza campionaria Errore standard della varianza campionaria
Comunicazione e significato
Silvio e il Presidente del Consiglio: Il discorso di Berlusconi tra Parlamento e Piazza UNIVERSITÀ DEGLI STUDI DI PAVIA FACOLTÀ DI ECONOMIA, GIURISPRUDENZA,
ELEZIONI REGIONALI 2010 PRIMI RISULTATI E SCENARI 14 aprile 2010.
Canale A. Prof.Ciapetti AA2003/04
Corso di Informatica (Basi di Dati)
eliana minicozzi linguaggi1a.a lezione2
La pragmatica cognitiva (Airenti, Bara, Colombetti, 83) Teoria computazionale dei processi cognitivi implicati nella comunicazione Comunicazione come atto.
I lavoratori italiani e la formazione UNA RICERCA QUANTITATIVA SVOLTA DA ASTRA, IN COLLABORAZIONE CON DOXA, PER ANES (febbraio 2005)
Fondamentidi Programmazione Corso: Fondamenti di Programmazione Classe: PARI-DISPARI Docente: Prof. Luisa Gargano Testo: Aho, Ulman, Foundations of Computer.
Master universitario di II livello in Ingegneria delle Infrastrutture e dei Sistemi Ferroviari Anno Accademico 2012/2013 Cultura dimpresa, valutazione.
La partita è molto combattuta perché le due squadre tentano di vincere fino all'ultimo minuto. Era l'ultima giornata del campionato e il risultato era.
MP/RU 1 Dicembre 2011 ALLEGATO TECNICO Evoluzioni organizzative: organico a tendere - ricollocazioni - Orari TSC.
Cos’è un problema?.
Gli italiani e il marketing di relazione: promozioni, direct marketing, digital marketing UNA RICERCA QUANTITATIVA SVOLTA DA ASTRA RICERCHE PER ASSOCOMUNICAZIONE.
Lezione 4 Probabilità.
STILI DI APPRENDIMENTO ED EVOLUZIONE INTERFACCE
ESAME DI STATO conclusivo del primo ciclo di istruzione La prova a carattere nazionale ITALIANO Quadro di riferimento.
Intelligenza Artificiale - AA 2001/2002 Logica formale (Parte 2) - 1 Intelligenza Artificiale Breve introduzione alla logica classica (Parte 2) Marco Piastra.
Intelligenza Artificiale
Che cos’è l’annotazione di un corpus?
CHARGE PUMP Principio di Funzionamento
Settimana: 3-7 marzo Orariolunedimartedi Mercoledi 5 Giovedi 6 Venerdi lezione intro alla fis mod DR lezione intro alla fis mod DR.
Chomsky La grammatica/sintassi è una proprietà della mente Distinta dalla capacità di comunicare E una facoltà autonoma ed innata La comunicazione è solo.
Riassumendo le teorie sulla comunicazione
“QUESTIONARIO SUL GRADIMENTO”
Q UESTIONI ETICHE E BIOETICHE DELLA DIFESA DELLA VITA NELL AGIRE SANITARIO 1 Casa di Cura Villa San Giuseppe Ascoli Piceno 12 e 13 dicembre 2011.
ISTITUTO COMPRENSIVO TORREGROTTA REPORT DATI QUESTIONARIO Alunni Scuola Primaria Classe V A.S.2012/2013.
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE.
TECNOLOGIE DELLINFORMAZIONE E DELLA COMUNICAZIONE PER LE AZIENDE Materiale di supporto alla didattica.
ISTITUTO COMPRENSIVO “G. BATTAGLINI” MARTINA FRANCA (TA)
COMMISSIONE VALUTAZIONE
Gli internauti italiani e il consumo di informazioni tramite media classici e new media UNA RICERCA QUANTITATIVA SVOLTA DA ASTRA RICERCHE PER LORDINE DEI.
Statistica economica (6 CFU) Corso di Laurea in Economia e Commercio a.a Docente: Lucia Buzzigoli Lezione 5 1.
GEOGRAFIA DEI NUMERI Accademia dei Lincei - Roma 18 Ottobre2011
Un trucchetto di Moltiplicazione per il calcolo mentale
Bus, mon amour! Autobus e Investimenti
21 marzo 2002 (ri-)Avvisi: Giovedi 28 marzo la lezione e sospesa. Nuovo indirizzo di Spedire messaggi e esercizi solo.
SINTASSI.
Prima rilevazione sullo stato di attuazione della riforma degli ordinamenti nelle istituzioni scolastiche in LOMBARDIA Attuazione del D.L. 59/2003 a.s.
14 marzo 2002 Avvisi:.
Esempi risolti mediante immagini (e con excel)
Fondamenti di Programmazione
IL LINGUAGGIO VERBALE.
NO WASTE Progetto continuità scuola primaria scuola secondaria Salorno a.s. 2013_
Prospettive della frutticoltura italiana nel contesto europeo e mondiale Introduzione statistica Carlo Fideghelli MACFRUT Cesena, 25 settembre 2014.
Informazione su alcuni aspetti della situazione sociale dell’Arcidiocesi Demografia Famiglia Religione Istruzione Economia Ufficio Problemi sociali E.
DAL WEB AL SEMANTIC WEB Aspetti teorici e tecnologici Carmagnola Francesca Dipartimento Informatica C.so Svizzera 185, Torino
Sistemi basati su conoscenza Linguaggio naturale: grammatiche Prof. M.T. PAZIENZA a.a
Informatica Introduzione alle basi di dati Lezione 2 Scienze e tecniche psicologiche dello sviluppo e dell'educazione, laurea magistrale Anno accademico:
Intelligenza Artificiale 1 Gestione della conoscenza lezione 19 Prof. M.T. PAZIENZA a.a
Transcript della presentazione:

Eventualità e relazioni temporali: riflessioni linguistiche, modelli computazionali e prototipi Tommaso Caselli tommaso.caselli@ilc.cnr.it Eventualità, Temporalità, Testualità - Pavia 19, Novembre 2009

Motivazioni Le entità linguistiche all’interno dei testi sono ancorate, per loro natura, al tempo. “the particular conceptualization of temporality that underlies language is by no means obvious" [Steedman 1997: 897]. La comprensione e il trattamento del tempo all’interno del testo/discorso ha un ruolo importante: per compiere delle inferenze e a ragionare sul mondo e sui suoi cambiamenti; per migliorare la comprensione di numerosi fenomeni linguistici come la struttura del discorso e la risoluzione di anafore lessicali di tipo associativo; per superare alcuni limiti delle applicazioni di TAL, nel nostro caso, algoritmi per Question-Answering (Open Domain e Domain Specific), Information Retrieval, Information Extraction, Summarization. Rinnovato interesse studio relazioni temporali tra gli eventi in un testo/discorso (creazione di corpora e schemi di annotazione, e.g. TimeML e TimeBank, Pustejovsky et al., 2003)

Sommario Ontologia Temporale - eventualità e tempo: rappresentazione, formalizzazione e connessione Relazioni temporali: definizione, contributo all’interpretazione del testo/discorso, fonti di informazione (triggers) Teorie linguistiche e approcci computazionali per il trattamento della temporalità A step forward: modello empirico per trattamento automatico della temporalità Annotare la temporalità: TimeML, ISO-TimeML, It-TimeML

Eventualità Eventualità: eventi e stati eventi: entità dinamiche che descrivono cambiamenti nel mondo (veri, falsi, possibili, necessari …) Stati: entità non-dinamiche che descrivono la validità di una data situazione per un periodo di tempo t Eterogeneità vs. Omogeneità (Krifka, 1989) Ogni sottoparte dell’entità X NON è anche una denotazione di X Individuabili + Enumerabili Relazioni merologiche Ogni sottoparte dell’entità X E’ ANCHE una denotazione di X

Eventualità Eventualità: eventi e stati eventi: entità dinamiche che descrivono cambiamenti nel mondo (veri, falsi, possibili, necessari …) Stati: entità non-dinamiche che descrivono la validità di una data situazione per un periodo di tempo t Eterogeneità vs. Omogeneità (Krifka, 1989) Eventi e Stati sono PRIMITIVI ONTOLOGICI proprietà distintive e rappresentazioni logiche autonome Evento: inizio e fine Evento (e) Stato (s)

Eventualità (2) Eterogeneità e proprietà merologiche  possibilità di individuare sottoclassi di eventi [+/- durativo]: distanza tra punto iniziale e finale  entità spazio-temporali N.B. NON ESISTONO EVENTI ISTANTANEI  esplodere: ha punto iniziale e punto finale. Eterogeneità e proprietà merologiche  [+/- telicità] (Krifka, 1989) Natural end point, quantized  Marco è andato al negozio Arbitrary end point, strictly cumulative  Marco corre

Eventualità (3) Eventi = struttura tripartita (Moens-Steedman, 1988; Passonneau, 1988) Attività di -V arbitrario = atelico “naturale”/obbligatorio = telico

Eventualità (3) Eventi = struttura tripartita (Moens-Steedman, 1988; Passonneau, 1988) Attività di -V arbitrario = atelico “naturale”/obbligatorio = telico

Tempo & Entità Temporali Assioma direzionalità interna del tempo: se è vero che l’evento e ha avuto luogo nel Passato rispetto alla mia posizione attuale t, allora è vero che per qualsiasi altra mia posizione t’, e è nel Passato rispetto a t’ Tempo: Durata Prospettiva temporale Successione

ISTANTI e INTERVALLI sono PRIMITIVI ontologici Tempo & Entità Temporali (2) Le entità temporali a livello ontologico sono considerate “misure” speciali del tempo (fisico!) e che possono essere associate alle eventualità (ciò che accade o vale nel mondo). ISTANTI e INTERVALLI sono PRIMITIVI ontologici Le entità temporali possono avere un inizio e una fine: definizione di intervallo aperto, chiuso, semi-aperto Intervallo proprio = intervallo chiuso, con punti iniziali e finali

Tempo & Entità Temporali (3) Tra i due primitivi sussistono delle relazioni esprimibili e formalizzate dal seguente predicato : Interno(t, T) ≡ Istante(t) ۸ Intervallo(T) Venerdi sera alle 20.00 Caratteristica distintiva dell’ontologia temporale è quella avere un ordinamento interno: Prima (T1, T2)  corrisponde a una delle proprietà distintive del tempo Per ogni entità temporale T1, T2, se T1 precede T2, allora esistono due istanti t1 e t2, tali che t1 è l’istante finale di T1 e t2 è l’istante iniziale di T2, e t1 precede t2 Relazione di precedenza è: antiriflessiva asimmetrica transitiva

Relazioni tra intevalli Tempo & Entità Temporali (4) La relazione di precedenza è primaria Relazioni tra intevalli

Tempo & Entità Temporali (4) La relazione di precedenza è primaria Relazioni tra istanti

Tempo & Entità Temporali (4) La relazione di precedenza è primaria Relazioni tra istanti e intervalli

Tempo & Entità Temporali (4) La relazione di precedenza è primaria set chiuso di relazioni in grado di formalizzare tutte le possibili relazioni temporali tra due entità; le relazioni sono “transitive”: questo permette di scoprire (inferire) relazioni possibili tra più entità (temporal closure); si può imporre delle restrizioni sulle relazioni possibili tra due entità.

Tempo & Entità Temporali (4) La relazione di precedenza è primaria A < B & B < C  A < C set chiuso di relazioni in grado di formalizzare tutte le possibili relazioni temporali tra due entità; le relazioni sono “transitive”: questo permette di scoprire (inferire) relazioni possibili tra più entità (temporal closure); si può imporre delle restrizioni sulle relazioni possibili tra due entità.

Modellizzazione: connettere eventualità e tempo Connettere eventualità e tempo  prima modellizzazione per l’analisi (formale) delle relazioni temporali tra le entità dell’ontologia temporale definizione delle eventualità in logica temporale funzioni α e ω assicurano l’accessibilità dei punti iniziali e finali delle eventualità: intervalli di rappresentazione sono finiti Tempo è denso: tra 2 entità temporali è sempre possibile identificarne una terza Linearità stretta del tempo (retta) introduzione del predicato holds, meccanismo responsabile dell’ancoraggio temporale delle eventualità 13 relazioni temporali tra eventi durativi e tra intervalli (Allen, 1983) e 8 relazioni temporali tra eventi non-durativi ed eventi durativi e con entità temporali (evento non-durativo = assenza di punti/momenti interni) (Allen-Hayes, 1989); 5 relazioni tra istanti, 5 relazioni tra intervalli e istanti

Ordinamento Temporale Eventi: Teoria Relazione Temporale  processo inferenziale che si attiva in base a precisi principi semantici e pragmatici NON è un’implicazione convenzionale di tipo pragmatico. Relazione Temporale è il risultato della combinazione di informazioni contestuali e linguistiche: è ottenuta a partire da un input pertinente e il cui processo di decodifica è arricchito con informazioni di tipo contestuale che danno vita a un effetto cognitivo positivo, contribuendo di fatto a determinare il contenuto informativo di un enunciato o frase; è un’esplicatura, che esprime “explicitly communicated content” [Sperber-Wilson, 2004: 260]. Termini della teoria della Pertinenza

Ordinamento Temporale Eventi: Teoria (2) Relazioni Temporali sono stabili. Tipologia di relazioni: tra gli eventi e le espressioni temporali (temporal anchoring of events): - Marco è partito lunedì. tra gli eventi all’interno del discorso (temporal ordering of events): - Gruppi di punk si sono barricati[ev1] iniziando il consueto lancio[ev2]di sassi e molotov. tra due espressioni temporali: - Quando è stata Pasqua lo scorso anno? Momento di riferimento deve essere sempre recuperabile, o in maniera esplicita o implicita. Deve essere distinto dal Localizzatore Temporale.

Ordinamento Temporale Eventi: Teoria (3) RELAZIONI TEMPORALI: ancoraggio & ordinamento RELAZIONI TEMPORALI E LINGUA NATURALE: elementi lessicali: - SEGNALATORI; e.g. dopo, prima di, a, per, entro… elementi di sistema: - TEMPO VERBALE (tense): distinzione tra interpretazione assoluta (combinazione di E, R ed S) e nel testo (combinazione di E, R, S e A) - ASPETTO: - ASPETTO GRAMMATICALE (viewpoint) - ASPETTO LESSICALE elementi pragmatici: - STRUTTURA DEL DISCORSO - CONOSCENZE DEL MONDO Immagine 3.4 TESI OBIETTIVO: identificare un ordine di salienza informativa delle fonti di informazione coinvolte e in quali condizioni ogni fonte di informazione è necessaria e sufficiente per “computare” una relazione temporale

Ordinamento Temporale Eventi: Teoria (3) RELAZIONI TEMPORALI: ancoraggio & ordinamento RELAZIONI TEMPORALI E LINGUA NATURALE: elementi lessicali: - SEGNALATORI; e.g. dopo, prima di, a, per, entro… elementi di sistema: - TEMPO VERBALE (tense): distinzione tra interpretazione assoluta (combinazione di E, R ed S) e nel testo (combinazione di E, R, S e A) - ASPETTO: - ASPETTO GRAMMATICALE (viewpoint) - ASPETTO LESSICALE elementi pragmatici: - STRUTTURA DEL DISCORSO - CONOSCENZE DEL MONDO Immagine 3.4 TESI OBIETTIVO: identificare un ordine di salienza informativa delle fonti di informazione coinvolte e in quali condizioni ogni fonte di informazione è necessaria e sufficiente per “computare” una relazione temporale

Ordinamento Temporale Eventi: Teoria (4) Ordinamento temporale eventi in un testo: I quattro sono stati riconosciuti colpevoli[e1] di aver preparato[e2] ed eseguito[e3] l' attentato che il 26 febbraio del 1993 fece esplodere[e4] una potentissima carica di esplosivo nel garage dei più alti grattacieli di New York. Dato il testo come in a), ognuno di noi è in grado di ricostruire l’ordine degli eventi così come rappresentato nella figura. Limite anafora temporale: invertendo ordine tra e2 ed e3 rispetto al primo esempio, appare chiaro che non l’ordinamento temporale può essere dato dalle relazioni tra i momenti di riferimento dei due eventi (e2 ed e3). Già nei primi lavori si è cercato di superare alcuni limiti di questo appoccio facendo affidamento su altri tipi di informazione, come aktionsaart del verbo, l’aspetto semantico del tempo verbale, la relazione tra tipo di evento e M.R dell’evento precedente, ma sono tutte info. di tipo linguistico che non sono sufficienti a spiegare l’ordinamento degli eventi invertendo e2 con e3 a livello superficiale della frase. Limiti SDRT: presupposta discourse knowledge  processo comprensione di un testo/discorso è incrementale e on-line; nessuna relazione discorsiva, né tantomeno relazioni temporali, possono essere inferite per default, ma sono il frutto di un inferenze basate su precisi principi semantici e paragmatici. Parlare di relazioni temporali di default è come parlare di espressioni linguistiche intrinsecamente anaforiche, cioè un non-sense Anafora Temporale (Partee, 1984): tempi verbali hanno valore anaforico rispetto a un momento di riferimento (M.R.) precedente; le relazioni tra i vari momenti di riferimento sono responsabili dell’ordinamento temporale eventi

Ordinamento Temporale Eventi: Teoria (4) Ordinamento temporale eventi in un testo: I quattro sono stati riconosciuti colpevoli[e1] di aver eseguito[e3] e preparato[e2] l' attentato che il 26 febbraio del 1993 fece esplodere[e4] una potentissima carica di esplosivo nel garage dei più alti grattacieli di New York. Dato il testo come in a), ognuno di noi è in grado di ricostruire l’ordine degli eventi così come rappresentato nella figura. Limite anafora temporale: invertendo ordine tra e2 ed e3 rispetto al primo esempio, appare chiaro che non l’ordinamento temporale può essere dato dalle relazioni tra i momenti di riferimento dei due eventi (e2 ed e3). Già nei primi lavori si è cercato di superare alcuni limiti di questo appoccio facendo affidamento su altri tipi di informazione, come aktionsaart del verbo, l’aspetto semantico del tempo verbale, la relazione tra tipo di evento e M.R dell’evento precedente, ma sono tutte info. di tipo linguistico che non sono sufficienti a spiegare l’ordinamento degli eventi invertendo e2 con e3 a livello superficiale della frase. Limiti SDRT: presupposta discourse knowledge  processo comprensione di un testo/discorso è incrementale e on-line; nessuna relazione discorsiva, né tantomeno relazioni temporali, possono essere inferite per default, ma sono il frutto di un inferenze basate su precisi principi semantici e paragmatici. Parlare di relazioni temporali di default è come parlare di espressioni linguistiche intrinsecamente anaforiche, cioè un non-sense Limite Anafora Temporale: troppo affidamento su informazioni di tipo esclusivamente linguistico;

Ordinamento Temporale Eventi: Teoria (5) Numerosi lavori hanno cercato di mettere in luce quali risorse o fonti di informazione sono attive quando inferiamo l’ordinamento temporale degli eventi, includendo: avverbi temporali; tempo verbale; aspetto; azionalità; Assenza di un quadro completo sull’interazione tra questi elementi principi discorsivi (struttura del discorso e relazioni retoriche); convenzioni pragmatiche; conoscenze comuni condivise. Punti fermi: valore referenziale del tempo verbale; i tempi verbali sono fonte di informazione primaria per il riconoscimento delle relazioni temporali; contributo dell’informazione “contestuale”; relazioni temporali sono inferenze prodotte dal parlante nel processo di incrementale di comprensione del discorso.

Il Modello Computazionale – Dati empirici 2 esperimenti: Esperimento 1: 29 soggetti (nessuno con conoscenze di linguistica); 52 coppie di frasi (33 estratte da un corpus + 19 variate) situazione sperimentale altamente controllata Esperimento 2: 6 soggetti (studenti universitari in linguistica); 33 coppie di frasi; situazione sperimentale parzialmente controllata TASK: identificare la relazione temporale tra 2 eventi (verbali) messi in evidenza; 5 relazioni predefinite: PRECEDENZA, SUCCESSIONE, SIMULTANEITA’, SOVRAPPOSIZIONE (overlap), NESSUNA RELAZIONE identificare la fonte di informazione ritenuta più saliente (responsabile del riconoscimento della relazione temporale); diversa granularità in base al background dei soggetti Variazione nella granularità delle fonti di informazione

Il Modello Computazionale – Dati empirici 2 esperimenti: Esperimento 1: 29 soggetti (nessuno con conoscenze di linguistica); 52 coppie di frasi (33 estratte da un corpus + 19 variate) situazione sperimentale altamente controllata Esperimento 2: 6 soggetti (studenti universitari in linguistica); 33 coppie di frasi; situazione sperimentale parzialmente controllata TASK: identificare la relazione temporale tra 2 eventi (verbali) messi in evidenza; 5 relazioni predefinite: PRECEDENZA, SUCCESSIONE, SIMULTANEITA’, SOVRAPPOSIZIONE (overlap), NESSUNA RELAZIONE identificare la fonte di informazione ritenuta più saliente (responsabile del riconoscimento della relazione temporale); diversa granularità in base al background dei soggetti Variazione nella granularità delle fonti di informazione ESPERIMENTO 1: TEMPO VERBALE ESPRESSIONI DI TEMPO NON SPECIFICATO

Il Modello Computazionale – Dati empirici 2 esperimenti: Esperimento 1: 29 soggetti (nessuno con conoscenze di linguistica); 52 coppie di frasi (33 estratte da un corpus + 19 variate) situazione sperimentale altamente controllata Esperimento 2: 6 soggetti (studenti universitari in linguistica); 33 coppie di frasi; situazione sperimentale parzialmente controllata ESPERIMENTO 2: TEMPO VERBALE ESPRESSIONI DI TEMPO SEGNALATORI ASPETTO (viewpoint) SEMANTICA (aspetto lessicale + conoscenze del mondo) NON SPECIFICATO TASK: identificare la relazione temporale tra 2 eventi (verbali) messi in evidenza; 5 relazioni predefinite: PRECEDENZA, SUCCESSIONE, SIMULTANEITA’, SOVRAPPOSIZIONE (overlap), NESSUNA RELAZIONE identificare la fonte di informazione ritenuta più saliente (responsabile del riconoscimento della relazione temporale); diversa granularità in base al background dei soggetti Variazione nella granularità delle fonti di informazione

Il Modello Computazionale – Dati empirici (2) RICONOSCIMENTO RELAZIONI TEMPORALI: 0.49 < K < 0.58 I dati empirici hanno messo in evidenza: un aumento dell’accordo con: espressioni di tempo (K = 0.69) cambiamenti di tempo verbale “forte” (K = 0.80; K = 0.70) segnalatori (K = 0.73) uso di relazioni temporali a grana grossa, ottenute in base alla definizione di vicinanza concettuale (K = 0.25; K 0.36 vs. K = 0.65) l’inversione dell’ordine di presentazione degli eventi non ha influenze sull’accordo e sul tipo di relazioni temporali, a meno che non esistano relazioni logiche tra gli eventi o siano presenti elementi altamente coesivi (anafore lessicale associative) in posizioni inaspettate il riconoscimento di una struttura discorsiva è essenziale per riconoscere l’esistenza di una relazione temporale

Il Modello Computazionale – Dati empirici (3) POLISEMIA TEMPORALE ESPERIMENTO 1 Prec. Succ. Sovrap. Simult. Nessuna relazione Passato Composto – Passato Composto 45.01% 21.70% 7.52% 25.66% 54.44% Passato Composto – Trapassato I 6.55% 89.67% 1.79% 3.33% Trapassato I – Passato Composto 100% 0% Passato Composto – Imperfetto 3.94% 47.13% 32.82% 15.35% 24.44% Imperfetto – Passato Composto 7.32% 1.47% 84.34% 7.9% 6.67% Imperfetto – Imperfetto 7.14% 10.71% 28.58% 53.57% 1.11% Passato Composto – Presente_passivo 41.36% 34.54% 3.63% 20% 10% Fonti informazione

Il Modello Computazionale – Dati empirici (3) POLISEMIA TEMPORALE ESPERIMENTO 2 Prec. Succ. Sovrap. Simult. Nessuna relazione Passato Composto – Passato Composto 56.67% 8.33% 21.67% 66.67% Passato Composto – Trapassato I 24.14% 72.41% 0% Trapassato I – Passato Composto 100% Passato Composto – Imperfetto 3.33% 26.67% 33.33% 36.67% Imperfetto – Imperfetto Passato Composto – Presente_passivo 50% 16.67% Passato Composto – Futuro Semplice Futuro Semplice – Passato Composto Fonti informazione

Il Modello Computazionale – Dati empirici (4) SALIENZA FONTI INFORMAZIONE E “ORDINE APPLICAZIONE” ESPERIMENTO 1 Fonti informazione

Il Modello Computazionale – Dati empirici (4) SALIENZA FONTI INFORMAZIONE E “ORDINE APPLICAZIONE” ESPERIMENTO 1 ESPERIMENTO 2 Fonti informazione

Il Modello Computazionale – Dati empirici (4) SALIENZA FONTI INFORMAZIONE E “ORDINE APPLICAZIONE” ESPERIMENTO 2 Fonti informazione

Il Modello Computazionale – Dati empirici (5) SALIENZA FONTI INFORMAZIONE E “ORDINE APPLICAZIONE” Espressioni di tempo, quando localizzano gli eventi, sono più salienti del tempo verbale Il tempo verbale è più saliente solo in presenza di sequenze con tempi verbali diversi  semantica temporale dei tempi verbali, e assenza di informazioni più specifiche Aspetto più saliente in sequenze che coinvolgono l’imperfetto Semantica: più saliente solo in sequenze con stesso tempo verbale diversa tipologia di eventualità (evento - stato)  ASPETTO LESSICALE stessa tipologia di eventualità (evento - evento)  FATTORI PRAGMATICI E CONOSCENZE DEL MONDO

Il Modello Computazionale – Dati empirici (6) DIVERSA SALIENZA INFORMATIVA VARIE FONTI restrizioni su autonomina delle varie fonti di informazione il riconoscimento di relazioni temporali: TEMPO VERBALE: fonte primaria; autonomo se sequenze temporali diverse; ESPRESSIONI TEMPORALI: localizzatori ed essenziale se in relazione tra di loro SEGNALATORI: se impliciti, informazione ancillare; se espliciti, essenziali ASPETTO (viewpoint e aspetto lessicale): essenziali se gli eventi hanno informazioni diverse FORMULA ORDINE SALIENZA: CONOSCENZA DEL MONDO (SEGNALATORI IMPLICITI TEMPO ASPETTO ASPETTO LESSICALE ESPRESSIONI TEMPORALI SEGNALATORI ESPLICITI)

Il Modello Computazionale – Architettura Possibilità di astrarre rappresentazione eventi  trattamento unitario nomi eventivi Segnalatori in margine (Appendice A)

Il Modello Computazionale – Architettura (2) MODELLO BASATO SUI DATI EMPIRICI  struttura del modello rispecchia la scala di salienza delle fonti di informazione attivazione dei componenti responsabili del riconoscimento delle relazioni tra eventi basata su restrizioni e preferenze (componente per il tempo verbale modulo 3) VARIABILITA’ DELLA GRANULARITA’ DELLE RELAZIONI TEMPORALI in base alle informazioni presenti nel testo/discorso e alla realizzazione delle eventualità modello e funzionamento sono indipendenti da lingua specifica composizione modulare garantisce sempre un output

Annotare la temporalità – schemi di annotazione MUC7 (1998) TIMEX (2000) ACL WS on Temporal and Spatial Information Processing (2001) Setzer’s Ph.D. Dissertation (2001) TIDES: TIMEX2 v.1.01 –valutazione in ACE, (2001) TERQAS: TimeML v.1.0 (2001) LREC WS on Annotation Standards for Temporal Information in Natural Language (2002) TimeML and DAML-Time (2003) TERN evaluation (2004) TimeML v.1.2.1 (2006) ISO-TimeML – SemAf (2006 - ongoing) It-TimeML v. 1.0 (2008) Dire perché si annota. Annotazioni sono punto di partenza per sistemi automatici di apprendimento. Regole per annotare, standard su linguaggio e schemi.

Annotare la temporalità – TimeML, ISO-TimeML, It-TimeML TimeML & ISO-TimeML sono due linguaggi di annotazione in grado di rendere esplicita l’informazione temporale all’interno di un testo/discorso. Vantaggi: separazione netta per la rappresentazione di eventi e di espressioni temporali, proponendo metodi di classificazione indipendenti dalla lingua in analisi; è in grado di rappresentare sia il temporal anchoring che l’event ordering Adattamento per l’Italiano It-TimeML (Caselli, 2008)

Annotare la temporalità – TimeML, ISO-TimeML, It-TimeML TimeML & ISO-TimeML sono due linguaggi di annotazione in grado di rendere esplicita l’informazione temporale all’interno di un testo/discorso. Modifiche per l’estensione dei tags EVENT e TIMEX3 Vantaggi: separazione netta per la rappresentazione di eventi e di espressioni temporali, proponendo metodi di classificazione indipendenti dalla lingua in analisi; è in grado di rappresentare sia il temporal anchoring che l’event ordering Adattamento dei valori per gli attributi TENSE e ASPECT; in particolare: introduzione del valore IMPERFECT; uso del valore PERFECTIVE sia per il compiuto che per l’aoristo Introduzione dell’attributo MOOD, per il trattamento del condizionale e del congiuntivo, e V_FORM, per dar conto delle diverse forme verbali Mappatura delle classi di eventi con i tipi semantici di PARLE/SIMPLE/CLIPS: miglioramento riconoscimento di eventi e loro classificazione; introduzione di un layer semantico di informazione per rappresentazione dell’event structure Adattamento per l’Italiano It-TimeML (Caselli, 2008)

Annotare la temporalità – TimeML, ISO-TimeML, It-TimeML TimeML & ISO-TimeML sono due linguaggi di annotazione in grado di rendere esplicita l’informazione temporale all’interno di un testo/discorso. Modifiche per l’estensione dei tags EVENT e TIMEX3 Vantaggi: separazione netta per la rappresentazione di eventi e di espressioni temporali, proponendo metodi di classificazione indipendenti dalla lingua in analisi; è in grado di rappresentare sia il temporal anchoring che l’event ordering Adattamento per l’Italiano It-TimeML (Caselli, 2008)

Annotare la temporalità – TimeML, ISO-TimeML, It-TimeML TimeML & ISO-TimeML sono due linguaggi di annotazione in grado di rendere esplicita l’informazione temporale all’interno di un testo/discorso. Modifiche per l’estensione dei tags EVENT e TIMEX3 Vantaggi: separazione netta per la rappresentazione di eventi e di espressioni temporali, proponendo metodi di classificazione indipendenti dalla lingua in analisi; è in grado di rappresentare sia il temporal anchoring che l’event ordering Adattamento dei valori per gli attributi TENSE e ASPECT; in particolare: introduzione del valore IMPERFECT; uso del valore PERFECTIVE sia per il compiuto che per l’aoristo Adattamento per l’Italiano It-TimeML (Caselli, 2008)

Annotare la temporalità – TimeML, ISO-TimeML, It-TimeML TimeML & ISO-TimeML sono due linguaggi di annotazione in grado di rendere esplicita l’informazione temporale all’interno di un testo/discorso. Modifiche per l’estensione dei tags EVENT e TIMEX3 Vantaggi: separazione netta per la rappresentazione di eventi e di espressioni temporali, proponendo metodi di classificazione indipendenti dalla lingua in analisi; è in grado di rappresentare sia il temporal anchoring che l’event ordering Adattamento dei valori per gli attributi TENSE e ASPECT; in particolare: introduzione del valore IMPERFECT; uso del valore PERFECTIVE sia per il compiuto che per l’aoristo Introduzione dell’attributo MOOD, per il trattamento del condizionale e del congiuntivo, e V_FORM, per dar conto delle diverse forme verbali Adattamento per l’Italiano It-TimeML (Caselli, 2008)

Annotare la temporalità – TimeML, ISO-TimeML, It-TimeML TimeML & ISO-TimeML sono due linguaggi di annotazione in grado di rendere esplicita l’informazione temporale all’interno di un testo/discorso. Modifiche per l’estensione dei tags EVENT e TIMEX3 Vantaggi: separazione netta per la rappresentazione di eventi e di espressioni temporali, proponendo metodi di classificazione indipendenti dalla lingua in analisi; è in grado di rappresentare sia il temporal anchoring che l’event ordering Adattamento dei valori per gli attributi TENSE e ASPECT; in particolare: introduzione del valore IMPERFECT; uso del valore PERFECTIVE sia per il compiuto che per l’aoristo Introduzione dell’attributo MOOD, per il trattamento del condizionale e del congiuntivo, e V_FORM, per dar conto delle diverse forme verbali Mappatura delle classi di eventi con i tipi semantici di PARLE/SIMPLE/CLIPS: miglioramento riconoscimento di eventi e loro classificazione; introduzione di un layer semantico di informazione per rappresentazione dell’event structure Adattamento per l’Italiano It-TimeML (Caselli, 2008)

Annotare la temporalità – verso l’Italian TimeBank Corpus dell’ Italian TimeBank 149 articoli di quotidiano (Italian TreeBank and PAROLE) 63.397 tokens comparabile per contenuto e dimensioni alla TimeBank (Pustejovsky et al. 2003) 5 annotatori – tirocinanti C.L. Informatica Umanistica 2 giudici – annotatori esperti Sviluppo di PROCEDURE per l’annotazione

Annotare la temporalità – verso l’Italian TimeBank (2) so far… Annotazione eventi (estensione) K = 0.83 Annotazione espressioni di tempo (estensione) K = 0.97 Annotazione segnalatori K = 0.89 Creazione data set per TempEval 2010 (33.000 tokens)

Bibliografia Riferimenti internet Allen, J. 1983. Mainatinig knowledge about intervals. Communications of ACM, 26(11), 842-843 Allen, J. & Hayes, P. 1989. Moments and points in an interval-based temporal logic. Computational Intelligence, 5(3), 225-238 Bertinetto, P.M. 1986. Tempo, Aspetto e Azione nel verbo italiano. Il sistema dell’indicativo. Accademia della Crusca, Firenze Caselli, T. 2009. Basi cognitive per l’ordinamento temporale degli eventi. In V. Cardella, D. Bruni (edt), Cervello, linguaggio e società. Atti del convegno CODISCO 2008, Squlibri, Roma, 277-286 Freska, C. 1992. Temporal reasoning based on semi-intevals. Artificial Intelligence, 54, 199-227 Hobbs, J. & Pan, F. 2004. An ontology of time in the semantic web. ACM Transaction on Asian Language Information Processing, 3(1), 66-85 Krifka, M. 1989. Nominal reference, temporal constitution and quantification in event semantics. In R. Bartsch, J. Van Benthem and P. van Emde Boas (eds), Semantics and Contextual Expressions, Dordrecht:Foris. Pustejovsky, J., Knippen, R., Littman, J & Saurì, R. 2003. TimeML: Robust specification of event and temporal expressions in text. Fifth International Workshop on Computational Semantics – IWCS-5 Steedman, M. 1997. Temporality. In J. Van Benthem and A. ter Meulen (eds), Handbook of Logic and Language, Elsevier Science, 895-938 Riferimenti internet ISO Language Resource Management, http://www.tc37sc4.org/ TimeML, http://www.timeml.org/site/index.html