Trattamento Automatico delle Lingue R. Basili a.a. 2009-2010.

Slides:



Advertisements
Presentazioni simili
I Linguaggi di programmazione
Advertisements

Intelligenza artificiale
Intelligenza Artificiale 1
Laurea Magistrale in Informatica Percorso: Metodi e Modelli (M & M) a.a. 2007/2008.
Linguaggi di Programmazione e compilatori
Informazioni sul Corso
Corso di Informatica e Laboratorio
Elementi di Informatica
Intelligenza Artificiale Linguaggio naturale
Elaborazione del linguaggio naturale automi & morfologia Maria Teresa PAZIENZA a.a
Maria Teresa PAZIENZA a.a
Intelligenza Artificiale 1 Gestione della conoscenza lezione 8
Computer, Lingue ed Applicazioni Perché comprendere tramite gli elaboratori i contenuti testuali? I testi sono i veicoli principali di significato per.
Intelligenza Artificiale 1 Gestione della conoscenza Prof. M.T. PAZIENZA a.a
Apprendimento Automatico: Elaborazione del Linguaggio Naturale
Lezione introduttiva Sistemi tecnologici e informazione on line Proff. Carlo Medaglia, Elena Valentini, Domenico Ventriglia Roma, 4 marzo 2010.
Linguaggio FONETICA SEMANTICA SINTASSI PRAGMATICA.
Corso di Abilità Relazionali
Corso di Abilità Relazionali
Tecnologia dei Servizi Grid e cloud computing - Lezione Lezione ottobre 2009 Il materiale didattico usato in questo corso è stato mutuato.
Decisione e Complessità Psicologia Sociale A.A Rosaria Conte Laboratory of Agent Based Social Simulation (LABSS) ISTITUTO.
Chomsky La grammatica/sintassi è una proprietà della mente
Marco CristaniTeoria e Tecniche del Riconoscimento1 Notizie preliminari Introduzione Facoltà di Scienze MM. FF. NN. Università di Verona A.A
Modelli simulativi per le Scienze Cognitive
MULTICULTURALITÁ E APPRENDIMENTO LINGUISTICO (M-Z)
Linguistica generale, parte II a.a Orari Lunedì ore 14-16, aula A Martedì ore 11-13, aula A Mercoledì ore 9-11, aula E Martedì 21: Aula Magna.
informatica di base per le discipline umanistiche
informatica di base per le discipline umanistiche
Programmare Introduzione alla programmazione ovvero Che ci faccio in questaula?? Paolo Bernardi.
Informatica a.a. 2009/2010 Modulo B - Corso di Laurea Triennale in Tecnologie per la Conservazione ed il Restauro.
INSIEMI NUMERABILI L’analisi matematica introduce il concetto di insieme numerabile come insieme i cui elementi possono essere “contati” ossia che possiede.
Intelligenza Artificiale
Che cos’è l’annotazione di un corpus?
Elementi di Informatica Simone Scalabrin a.a. 2008/2009.
Chomsky La grammatica/sintassi è una proprietà della mente Distinta dalla capacità di comunicare E una facoltà autonoma ed innata La comunicazione è solo.
Espressione polirematica
“Colorless green ideas sleep furiously.”
Università del Salento Facoltà di Ingegneria Corso di Basi di dati I a.a
Università del Salento Facoltà di Ingegneria Corso di Basi di dati I a.a
Laboratorio di Informatica Dott.ssa Elisa Tiezzi Dott.ssa Elisa Mori
Maria Piscitelli Firenze, 3 dicembre 2010
Modelli di Calcolo e Lingue
Grammatiche, Linguaggio e Automi R. Basili TAL - a.a
Informatica Grafica sez. A-G
Algoritmi e Strutture dati a.a. 2013/2014 Informazioni sul corso
Fondamenti di Programmazione
PROGRAMMAZIONE DISCIPLINARE DOCENTE: PELLEGRINETTI ENRICA
(L-LIN/01-Glottologia e Linguistica) Linguistica
Elaborazione del linguaggio naturale CFG: esercizi Maria Teresa PAZIENZA a.a
1 Semantic Web Docente: Federica Cena Dipartimento Informatica
1 Informazioni sull’esame §Esame orale su tutti gli argomenti trattati a lezione §Seminario: studio di un argomento avanzato, tipicamente di un formalismo.
Intelligenza Artificiale 1 Gestione della conoscenza lezione 19 Prof. M.T. PAZIENZA a.a
PROGRAMMAZIONE DISCIPLINARE CLASSI SECONDE A.S MATERIA:ITALIANO DOCENTE: PELLEGRINETTI ENRICA.
Programmazione Web Presentazione del corso /2015.
Fondamenti dell’Informatica A.A Prof. Vincenzo Auletta1 Presentazione del Corso Fondamenti dell’Informatica Docente Prof. Vincenzo Auletta.
Elaborazione del linguaggio naturale automi & morfologia Maria Teresa PAZIENZA a.a
Linguistica computazionale: task sul linguaggio naturale Cristina Bosco 2015 Informatica applicata alla comunicazione multimediale.
Semantica approcci computazionali Maria Teresa PAZIENZA a.a
Intelligenza Artificiale 2 Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
INTELLIGENZA ARTIFICIALE
Come costruire sistemi di elaborazione del linguaggio naturale (NLP) Due paradigmi di riferimento –Basato sulla conoscenza (Knowledge Engineering, KE)
Intelligenza Artificiale Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Linguaggio come processo cognitivo
Tecnologie della lingua Human Language Technology (HLT)
Linguistica computazionale: come accedere all’informazione codificata nel linguaggio naturale (seconda parte) Cristina Bosco 2014 Informatica applicata.
La ricerca in campo educativo. Problemi e metodi
La Comprensione frasale
 L’insegnamento comunicativo della lingua poggia su: -Bisogni concreti degli alunni -La difesa dell’insegnamento esplicito delle strategie -Il rispetto.
Aneta Chmiel Università della Slesia Istituto di Filologia Romanza Cattedra di Italianistica.
Didattica e libri di testo Elisa Corino DLM 2016.
Transcript della presentazione:

Trattamento Automatico delle Lingue R. Basili a.a

Obbiettivi del Corso Introduzione al trattamento dei fenomeni linguistici al calcolatore Introduzione al trattamento dei fenomeni linguistici al calcolatore Applicazioni del TAL Applicazioni del TAL Metodi e tecnologie principali del TAL Metodi e tecnologie principali del TAL –Progettazione grammatiche –Uso di XML Laboratorio di TAL Laboratorio di TAL –Analisi morfosintattica al calcolatore –Analisi semantica –Annotazioni di corpora

Propedeuticita Nozioni elementari di algebra e logica Nozioni elementari di algebra e logica Corsi: Corsi: –Abilità Informatiche –Modelli e Linguaggi dei Dati e della Conoscenza

Orario delle lezioni MARTEDI MARTEDI –Ufficio Docente h: 10:00-13:00 GIOVEDI GIOVEDI –Ufficio Docente h: 10:00-13:00 VENERDI VENERDI –Ufficio Docente h: 15:00-18:00 Inviare un mail al docente decidendo quando (tra il martedi ed il Giovedi) preferireste la prima lezione di ogni settimana. Inviare un mail al docente decidendo quando (tra il martedi ed il Giovedi) preferireste la prima lezione di ogni settimana.mail

Lezioni, Esercitazioni e Tutoraggio Lezioni su aspetti metodologici del corso Lezioni su aspetti metodologici del corso Esercitazioni su argomenti trattati durante le lezioni e di preparazione allesame ed al progetto finale Esercitazioni su argomenti trattati durante le lezioni e di preparazione allesame ed al progetto finale Ricevimento: Ogni Venerdi al termine della lezione Ricevimento: Ogni Venerdi al termine della lezione

Testi di Riferimento J. Lyons, Introduzione alla Linguistica Teorica Sez II e III, Universale Laterza,1978. J. Lyons, Introduzione alla Linguistica Teorica Sez II e III, Universale Laterza,1978. D. Jurafsky, J. H. Martin, Speech and Language Processing: an Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, Prentice-Hall, 2000 D. Jurafsky, J. H. Martin, Speech and Language Processing: an Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, Prentice-Hall, 2000 G. Chierchia, S. McConnell-Ginet-, Significato e Grammatica: una introduzione alla semantica, Il Mulino, G. Chierchia, S. McConnell-Ginet-, Significato e Grammatica: una introduzione alla semantica, Il Mulino, Articoli scientifici di approfondimento Articoli scientifici di approfondimento

Organizzazione dellEsame finale Discussione orale su tutto il programma Discussione orale su tutto il programma Progetto Finale (alla fine del corso) su una delle linee Progetto Finale (alla fine del corso) su una delle linee –Analisi sintattica (analisi e annotazione dei dati) –Analisi semantica (analisi e annotazione dei dati) –Approfondimento a scelta (bibliografia estesa)

Uno Sguardo al Programma Introduzione al TAL Introduzione al TAL –Cenni di Storia dellElaborazione Automatica del Linguaggio Naturale (NLP). Applicazioni del TAL. Ricerca Automatica di Informazione. Traduzione Automatica. Comunicazione di Agenti Intelligenti. –Laboratorio: Le grammatiche formali; Annotazioni dei corpora; Il formalismo XML. TEI: una introduzione. Uso del linguaggio Prolog.

Uno Sguardo al Programma (2) Richiami di Linguistica Generale Richiami di Linguistica Generale –Linguistica Computazionale, AI e TAL. Morfologia, Sintassi e Semantica. Lessico e Sintassi. –Semantica: scopi della semantica. Lanalisi semantica e le teorie logico- deduttive. Semantica lessicale. Lessici computazionali. –La semantica basata sui frames. The Case for case (C. Fillmore). Il progetto Framenet.

Uno Sguardo al Programma (3) Trattamento dei fenomeni della Sintassi Trattamento dei fenomeni della Sintassi –Lanalisi morfologica e la sintassi. Il processo di etichettamento della morfosintassi (Part-of- Speech tagging). Approcci statistici ed approcci basati su regole al POS tagging. –Grammatiche formali e riconoscimento grammaticale. La gerarchia di Chomsky. Grammatiche libere dal contesto (Context-free grammars). Esempi di uso. –Laboratorio. Il Tree Tagger. Le grammatiche context-free in Prolog. Il parser CHAOS.

Uno Sguardo al Programma (4) Trattamento dei fenomeni semantici Trattamento dei fenomeni semantici –Dizionari semantici: Wordnet; Longman Dictionary of Contemporary English. Il problema del Word Sense disambiguation. –Interpretazione semantica. Modelli di rappresentazione semantica. Modelli cognitivi della semantica. –Frames. La Frame Semantics. Il progetto FrameNet. –Laboratorio. Uso di Wordnet. Il progetto Multiwordnet. Etichettatura semantica. Analisi della risorsa Framenet. Progetto: verso un Framenet per litaliano.

Uno Sguardo al Programma (5) Cenni alle Applicazioni del TAL Cenni alle Applicazioni del TAL –Information retrieval ed Information Extraction –Question Answering –Sistemi di Dialogo

Elaborazione di Linguaggio Scritto e Parlato al Calcolatore Cose? Cose? –Realizzare programmi in grado di completare processi linguistici come: Abilitare una comunicazione uomo-macchina Abilitare una comunicazione uomo-macchina Migliorare la comunicazione tra persone (ad es. MT) Migliorare la comunicazione tra persone (ad es. MT) Elaborare oggetti linguistici (ad es. Pagine Web, documenti o chiamate telefoniche) Elaborare oggetti linguistici (ad es. Pagine Web, documenti o chiamate telefoniche) –Esempi: Question Answering Question Answering Traduzione Automatica Traduzione Automatica Agenti che dialogano Agenti che dialogano

Quali conoscenze servono? HAL 9000, da 2001: A Space Odyssey HAL 9000, da 2001: A Space Odyssey Dave: Open the pod bay doors, Hal. Dave: Open the pod bay doors, Hal. HAL: Im sorry Dave, Im afraid I cant do that. HAL: Im sorry Dave, Im afraid I cant do that.

Quale la conoscenza di HAL? Riconoscimento e sintesi del linguaggio parlato Riconoscimento e sintesi del linguaggio parlato –Dizionari (pronuncia delle parole) –Fonetica (come riconoscere/produrre ciascun suono dellInglese) Comprensione della lingua Comprensione della lingua –Conoscenza delle parole dellInglese Cosa significano Cosa significano Come si combinano (cose un `pod bay door?) Come si combinano (cose un `pod bay door?) –Conoscenza della struttura sintagmatica Im I do, Sorry that afraid Dave Im cant Im I do, Sorry that afraid Dave Im cant

Quale la conoscenza di HAL? (2) Dialogo e pragmatica Dialogo e pragmatica –open the door e una richiesta (non una affermazione o una ricerca di informazioni) –Rispondere e un atto gentile anche se si e pianificato di uccidere. –E bene mostrarsi cooperativi (Im afraid, I cant…) –Cosa significa `that in `I cant do that? Presino un sistema telefonico di prenotazione aerea richiede approssimativamente la stessa conoscenza Presino un sistema telefonico di prenotazione aerea richiede approssimativamente la stessa conoscenza

Question Answering Cosa significa porta? Cosa significa porta? In quale anno e nato Mozart? In quale anno e nato Mozart? Quante erano le provincie italiane sino al 1995? Quante erano le provincie italiane sino al 1995? Cera uno sconto sullacquisto dei libri di linguistica da Amazon ieri? Cera uno sconto sullacquisto dei libri di linguistica da Amazon ieri? Cosa pensano gli scienziati riguardo alla legalizzazione della clonazione? Cosa pensano gli scienziati riguardo alla legalizzazione della clonazione?

Modelli e Algoritmi Modelli: Astrazioni e formalismi per esprimere diversi tipi di strutture linguistiche. Modelli: Astrazioni e formalismi per esprimere diversi tipi di strutture linguistiche. –Automi (FSA, traduttori, modelli di markov) –Sistemi formali di regole (grammatiche context-free, sistemi di feature) –Logica (calcolo dei predicati ed inferenza) –Modelli Probabilistici di quelli sopra elencati Algoritmi usati per manipolare le rappresentazioni e creare altre strutture. Algoritmi usati per manipolare le rappresentazioni e creare altre strutture. –Alg. Di Ricerca (A*, programmazione dinamica) –Apprendimento Induttivo etc etc

Linguaggio, Pensiero e Comprensione Il Test di Turing Il Test di Turing La domanda Può una macchina pensare? puo essere resa operativa. La domanda Può una macchina pensare? puo essere resa operativa. Versione operativa: Versione operativa: –2 persone ed un computer –Una persona interroga via rete laltra E il computer –La macchina deve convincerla di essere umano –La seconda persona deve fare la stessa cosa!

Eliza: Weizenbaum (1966) User: You are like my father in some ways. User: You are like my father in some ways. ELIZA: What resemblance do you see ELIZA: What resemblance do you see User: You are not very aggressive but I think you dont want me to notice that. User: You are not very aggressive but I think you dont want me to notice that. ELIZA: What makes you think I am not aggressive ELIZA: What makes you think I am not aggressive User: You dont argue with me User: You dont argue with me ELIZA: Why do you think I dont argue with you ELIZA: Why do you think I dont argue with you User: You are afraid of me User: You are afraid of me ELIZA: Does it please you to believe I am afraid of you ELIZA: Does it please you to believe I am afraid of you ( check at: ) ( check at: )

Esempio di trattamento di testo Trova tutte le occorrrenze della parola il in un testo. Trova tutte le occorrrenze della parola il in un testo. –/il/ Perde molti esempi in maiuscolo –/[iI]l/ Restituisce mille o Ildebrando Restituisce mille o Ildebrando –/\b[Ii]l\b/

Errori nel riconoscimento Abbiamo eliminato due tipi di errori Abbiamo eliminato due tipi di errori –Il reperimento di stringhe che non dovevanoi essere trovate (Iliade, mille) Falsi Positivi Falsi Positivi –Il mancato riconosimento di stringhe corrette (ad es, Il poliziotto..) Falsi negativi Falsi negativi

Errori (2) Cio e vero in generale nel TAL. Cio e vero in generale nel TAL. Ridurre lerrore significa cercare due miglioramenti antagonisti: Ridurre lerrore significa cercare due miglioramenti antagonisti: –Milgiorare la accuratezza (meno falsi positivi) –Migliorare la copertura (meno falsi negativi).