Come costruire sistemi di elaborazione del linguaggio naturale Fornire le conoscenze necessarie per elaborare dati linguistici –Acustico-fonetiche (input.

Slides:



Advertisements
Presentazioni simili
Michele A. Cortelazzo Morfologia 1.
Advertisements

LA LINGUA LATINA FONETICA : studia i suoni delle parole (pronuncia)
Inizio… Linguaggi Linguaggi di programmazione Linguaggi di programmazione Linguaggi di programmazione Linguaggi di programmazione Linguaggi Formali Linguaggi.
Laboratorio linguistico L’articolo di giornale
La comunicazione.
Guida alla traduzione Mission impossible?. Una traduzione è.. la sintesi finale di una complessa serie di operazioni: analisi del testoanalisi del testo.
Istituzioni di linguistica
Uno strumento per lannotazione e la modellizzazione prosodica di enunciati marcati per un sistema di sintesi vocale Andrea Panizza Francesca Tini Brunozzi.
LA RA RIO BO TO FO LO CO GI NO
Requisiti per l’apprendimento della lettura e della scrittura
Dal concreto al concreto. GRAMMATICA RIFLESSIONELINGUISTICA REGOLE COMPETENZALINGUISTICA COMPETENZALINGUISTICA REGOLE.
Leggere - Capire - Produrre
Computer, Lingue ed Applicazioni Perché comprendere tramite gli elaboratori i contenuti testuali? I testi sono i veicoli principali di significato per.
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale Prof. M.T. PAZIENZA a.a
Istituzioni di linguistica
Scuola Secondaria di 1° Grado - Classe I F - Favara
Dallo sviluppo del linguaggio all’apprendimento della letto-scrittura
Il lessico Lessico: insieme delle parole di una lingua (astratto)
La correzione degli errori
MULTICULTURALITÁ E APPRENDIMENTO LINGUISTICO (M-Z)
Mentre lerrore grammaticale è generalmente attribuito a ignoranza della lingua e facilmente scusato, lerrore pragmatico non viene percepito.
4^ - 5^ scuola primaria 1^-2^-3^scuola secondaria di primo grado
Inconsapevoli, respiriamo la lingua come l’aria e la produciamo
Linguaggio: sistema di comunicazione che permette di trasmettere informazioni (significati) attraverso dei comportamenti (segnali) che devono essere interpretati.
PADRONANZA LINGUISTICA
Che cos’è l’annotazione di un corpus?
Istituzioni di linguistica a.a Federica Da Milano
…. mare c’è un golfo, dove ho assistito …. bellissimi tramonti.
Corsi di laurea in Storia Napoli, 27 febbraio 2008 Università degli Studi di Napoli Federico II Porte Aperte.
Lingua italiana per stranieri
Morfosyntax italštiny III (3)
Espressione polirematica
La correzione degli errori
PROGETTO REGIONALE ELLE – EMERGENZA LINGUA- II SEMINARIO DISTRETTUALE DI RAVENNA – Ravenna, 22 novembre 2010 Pianificazione attività di Istituto Parte.
Gianfranco Zampolini Progetto per il corso di: Linguaggi e Modelli Computazionali LS EM Linguaggio per la Descrizione di un Evento Musicale.
LA VALUTAZIONE DEL TESTO SCRITTO RIFLESSIONI E PROPOSTE DI LAVORO
Dislessia e disturbi specifici dell’apprendimento
MORFOLOGIA.
Maria Piscitelli Firenze, 3 dicembre 2010
4. Per intervenire … Le attività Gli esercizi con Hot Potatoes d. ¡Hola! Me presento... Il testo proposto segue esattamente lo schema e le fasi dei.
Discipline linguistiche
Il Comparativo di maggioranza
IL LINGUAGGIO VERBALE.
PROGRAMMAZIONE DISCIPLINARE DOCENTE: PELLEGRINETTI ENRICA
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a
Michele A. Cortelazzo Morfologia 1.
Michele A. Cortelazzo Morfologia 1.
Sistemi basati su conoscenza Linguaggio naturale: grammatiche Prof. M.T. PAZIENZA a.a
(L-LIN/01-Glottologia e Linguistica) Linguistica
SINTESI FUNZIONALI ALLA STESURA DEL LAVORO FINALE.
Ambiguità Le lingue sono, per loro natura ambigue e sfumate:
Intelligenza Artificiale 1 Gestione della conoscenza lezione 19 Prof. M.T. PAZIENZA a.a
PROGRAMMAZIONE DISCIPLINARE CLASSI SECONDE A.S MATERIA:ITALIANO DOCENTE: PELLEGRINETTI ENRICA.
Componente Lessicale Scopi –Riconoscere gli elementi lessicali –Assegnare agli elementi lessicali informazioni sulla loro categoria grammaticale –Risolvere.
Sistemi basati su conoscenza Linguaggio naturale: semantica Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a
Istituzioni di linguistica a.a. 2009/10 Federica Da Milano.
Come costruire sistemi di elaborazione del linguaggio naturale (NLP) Due paradigmi di riferimento –Basato sulla conoscenza (Knowledge Engineering, KE)
Linguaggio come processo cognitivo
Tecnologie della lingua Human Language Technology (HLT)
LA FRASE SEMPLICE M. Dardano – P. Trifone, Grammatica italiana con nozioni di linguistica, Zanichelli, Bologna, III ed.
Comprensione frasale Garden Path theory
 L’insegnamento comunicativo della lingua poggia su: -Bisogni concreti degli alunni -La difesa dell’insegnamento esplicito delle strategie -Il rispetto.
L’interlingua Interlingua: il termine si usa a partire dalle proposte di Selinker (1972) per definire quella lingua che non è né LM, né LE, ma una lingua.
Elementi di linguistica italiana. Le strutture dell italiano.
ITALIANO (classe 4^ Borsi) Ordine temporale PRIMA E DOPO.
Coesione E’ difficile dare una definizione cronologica della preistoria. Di solito la preistoria si fa terminare con l’inizio di forme organizzate di vita.
Lucrezia pedrali a.s.2007/2008 LINGUA ITALIANA Dalla scuola dell’infanzia alla scuola primaria.
Che cos’è la linguistica?
COME SI SCRIVE? Errori ortografici più comuni in italiano!
Transcript della presentazione:

Come costruire sistemi di elaborazione del linguaggio naturale Fornire le conoscenze necessarie per elaborare dati linguistici –Acustico-fonetiche (input orale) –(tipo)grafiche (input scritto) –Morfologiche –Sintattiche –Semantiche –Conoscenza del mondo

Fasi del processo Riconoscitore di forme (tokenization) Categorizzazione (tagging) Analisi sintattica Analisi semantica

INPUT ORALESCRITTO RICONOSCIMENTO DI FONEMI RICONOSCITORE DI FORME CATEGORIZZAZIONE ANALISI LESSICALE ANALISI SINTATTICA INTERPRETAZIONE SEMANTICA RICONOSCIMENTO DI CARATTERI

ANALISI LESSICALE RICONOSCERE LE PAROLE DI UN ENUNCIATO O DI UN TESTO E’ UN COMPITO IMPORTANTE –RICONOSCIMENTO DI FORME (tokens) –ASSEGNAMENTO DI CATEGORIE LESSICALI (tags)

Tokenization Segmentazione di un documento in unità significative –Parole - babbo, cane, casa, mangio... –Locuzioni – Banca d’Italia, a pronta presa... –Sigle – CNR, INPS, CGIL... –Punteggiatura –Numeri arabi e romani –Date – , 1 gennaio –Indirizzi di posta elettronica – romaincendiata.ir –Numeri telefonici

Tokenization Processo importante che permette di individuare le unità lessicali e i confini di frase necessari per la comprensione Dalla qualità del risultato di questo processo dipende il successo dei risultati delle operazioni successive

Tokenization problemi Considerare convenzioni grafiche e tipografiche che differiscono da lingua a lingua Inglese: o’clock, Peter’s, first-rate,etc. Italiano: tasso d’interesse, auto-analisi, parlagli, - Come stai? - gli chiesi Francese: chemin-de-fer, as-tu, Spagnolo: hierba buena, digame,

Tokenization problemi STRUTTURA LESSICALE Italiano: collocazione dei pronomi personali atoni dirtelo, mangiamocela Tedesco: parole composte traumdeutung Arabo: collocazione dell’articolo determinativo alqasa

Tokenization Riconoscimento di date tener conto dei vari stili con i quali è possibile scrivere una data: –25 aprile 1945, – , –25/4/1945, – Venticinque aprile millenovecentoquarantacinque

Automa per riconoscimento data Numero {1,…,31} Numero {1,..,12} Puntegg {-,.,/} If prima Numero Puntegg {-,.,/} Numero Parola {(uno,primo),…,trentuno} Parola {gennaio,,…,dicembre} Parola {‘stringa numero’}

Selezionare le unità del testo Lunedì 25 maggio u.s., la Banca d’Italia ha abbassato il tasso d’interesse di due punti, portandolo dall’8 al 6%. Soddisfazione tra i ceti produttivi che vedono nuove prospettive per il rilancio dell’economia. Entusiasta reazione della Borsa.

Categorizzazione Categorizzare, a partire dalla segmentazione precedente, assegnando alle unità individuate le seguenti categorie grammaticali: –Sostantivo, verbo, aggettivo, preposizione, articolo, ecc. Con l’indicazione dei parametri di flessione e coniugazione –genere, numero, persona, modo, tempo