Intelligenza Artificiale Semantica del linguaggio naturale

Slides:



Advertisements
Presentazioni simili
Il filo di arianna 2011: lo sviluppo della competenza semantico-lessicale Sintesi della scheda teorica.
Advertisements

Calcolo Relazionale.
Intelligenza Artificiale 1
DOCUMENTAZIONE DI SCHEMI E/R
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea in Ingegneria Informatica Integrazione di WordNet Domains.
Istituzioni di linguistica
Il ragionamento classico
Sistemi computazionali per il linguaggio naturale
Semantica approcci computazionali
Intelligenza Artificiale Linguaggio naturale
Intelligenza Artificiale 2 Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Conoscenza e ragionamento Prof. M.T. PAZIENZA a.a
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Intelligenza Artificiale Strutture e strategie per risolvere problemi complessi Prof. M.T. PAZIENZA a.a
Intelligenza Artificiale 1 Gestione della conoscenza lezione 7 Prof. M.T. PAZIENZA a.a
Semantica approcci computazionali
Sistemi basati su conoscenza Prof. M.T. PAZIENZA a.a
Maria Teresa PAZIENZA a.a
Intelligenza Artificiale 1 Gestione della conoscenza lezione 8
Computer, Lingue ed Applicazioni Perché comprendere tramite gli elaboratori i contenuti testuali? I testi sono i veicoli principali di significato per.
Semantica lessicale Maria Teresa PAZIENZA 1.
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Basi di conoscenza: rappresentazione e ragionamento (2 - Reti semantiche, Frames) Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Basi di conoscenza: rappresentazione e ragionamento (2 - Reti semantiche, Frames) Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Conoscenza e ragionamento Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Basi di conoscenza: rappresentazione e ragionamento Prof. M.T. PAZIENZA a.a
Apprendimento Automatico: Elaborazione del Linguaggio Naturale
Istituzioni di linguistica
Istituzioni di linguistica
Comprendere per riassumere, riassumere per comprendere
Lo sviluppo del linguaggio nel bambino
C. GIBELLI (I.S.A. DON MILANI) SSIS – DDI 2008/09 Competenze di letto- scrittura 10/10/08 COMPRENSIONE DEL TESTO (ANALISI DEL PRODOTTO LINGUISTICO METODOLOGIE.
Il lessico Lessico: insieme delle parole di una lingua (astratto)
Funzioni, Rappresentazioni e Coscienza
Chomsky La grammatica/sintassi è una proprietà della mente
Intelligenza Artificiale II Dimostrazione automatica di Teoremi
Ingegneria della conoscenza e sistemi esperti Dario Bianchi, 1999 Conoscenza e ragionamento Logica dei predicati del primo ordine.
Ingegneria della conoscenza e sistemi esperti Dario Bianchi, 1999 Logica dei predicati del primo ordine.
Informatica giuridica Informatica e lingua del diritto Nicola Palazzolo Anno Accademico 2006/2007.
PADRONANZA LINGUISTICA
LINGUAGGI DI PROGRAMMAZIONE
Chomsky La grammatica/sintassi è una proprietà della mente Distinta dalla capacità di comunicare E una facoltà autonoma ed innata La comunicazione è solo.
Alla scoperta del significato
_ ___ _ ______ _ _ _________.
CODIFICA DELLE EMOZIONI
SINTASSI.
Grammatiche, Linguaggio e Automi R. Basili TAL - a.a
IL LINGUAGGIO VERBALE.
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Linguaggio naturale: grammatiche Prof. M.T. PAZIENZA a.a
Ambiguità Le lingue sono, per loro natura ambigue e sfumate:
Componenti formali del linguaggio
Intelligenza Artificiale 1 Gestione della conoscenza lezione 19 Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza
SFC analitici /Russell 1 B. Russell: Atomismo logico Russell & Whitehead : - Nuova logica di ambito assai più vasto della logica classica La logica.
Semantica approcci computazionali Maria Teresa PAZIENZA a.a
L'analisi dei testi per la realizzazione del Web Semantico: quali gli strumenti e le applicazioni Paolo Poto Expert System Spa.
Sistemi basati su conoscenza Linguaggio naturale: semantica Prof. M.T. PAZIENZA a.a
AOT Lab Dipartimento di Ingegneria dell’Informazione Università degli Studi di Parma Intelligenza Artificiale Rappresentazione della Conoscenza e Ragionamento.
Intelligenza Artificiale 1 Gestione della conoscenza lezione 14 Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale (grammatica, semantica) Prof. M.T. PAZIENZA a.a
Come costruire sistemi di elaborazione del linguaggio naturale (NLP) Due paradigmi di riferimento –Basato sulla conoscenza (Knowledge Engineering, KE)
Intelligenza Artificiale Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Linguaggio come processo cognitivo
Basi di dati distribuite Prof. M.T. PAZIENZA a.a
La Comprensione frasale
 L’insegnamento comunicativo della lingua poggia su: -Bisogni concreti degli alunni -La difesa dell’insegnamento esplicito delle strategie -Il rispetto.
COMPRENSIONE, ANALISI E INTERPRETAZIONE DI UN TESTO POETICO
Parsing ricorsivo discendente Il parsing ricorsivo discendente (recursive descent parsing) è un metodo di tipo top-down che può essere facilmente codificato.
Che cos’è la linguistica?
Transcript della presentazione:

Intelligenza Artificiale Semantica del linguaggio naturale Prof. M.T. PAZIENZA a.a. 2004-2005 Grazie a Jim Martin e a Dan Jurafsky per molte di queste slides

Semantica La semantica è lo studio del significato di generiche espressioni linguistiche Modellare come il significato di un’espressione è collegato al significato di ciascuna frase, parola, ed al contesto in cui appare l’espressione

Evoluzione?!? Dapprima si studiano le parole (morfologia) Poi si analizzano le relazioni sintattiche tra di esse (sintassi) Quindi si cerca di lavorare sul significato; in molti casi il processo di analisi è inverso

Il significato Si può studiare il significato da tre prospettive diverse: il significato di singole parole (semantica lessicale) come questi significati si combinano per dare significato a singole frasi come questi significati si combinano per dare significato ad un testo o ad un discorso

Il significato Le parole di per sé non esprimono il significato del mondo, né ciò che uno sta pensando, né tantomeno ciò che pensano gli altri. Possono essere considerate delle sequenze lineari di termini tali che quando altre persone le leggono, o sentono, possono capirle e venire a conoscenza di ciò che noi pensiamo del mondo e che è stato espresso da quelle parole.

Rappresentazione del significato Si può usare lo stesso approccio che è stato usato per la sintassi e per l’analisi morfologica. Necessità di creare una rappresentazione delle informazioni linguistiche per catturare il significato di quelle stesse informazioni. A differenza degli alberi sintattici, queste rappresentazioni non sono descrizioni primarie delle strutture in ingresso. In genere esse sono contemporaneamente descrizioni dei significati delle espressioni linguistiche così come di alcuni stati del mondo Rappresentazione che permette o facilita l’elaborazione semantica

Elaborazione semantica Rappresentazioni che Permettono di ragionare relativamente alla loro verità (relazioni con un qualche mondo) Permettono di rispondere a domande basate sul loro contenuto Permettono di fare inferenze (rispondere a domande e determinare la verità delle cose che non sappiamo ancora)

Rappresentazione del significato Logica per esprimere il significato del linguaggio naturale Principio di composizionalità (il significato di una frase può essere ottenuto da operazioni composizionali sul significato delle sue parti) Un approccio computazionale alla comprensione del linguaggio deve porre in essere filtri sintattici e semantici ->Selectional restrictions

Selectional restrictions A ciascun “senso” di una parola è possibile associare markers semantici che specifichino features e condizioni sulle features dei sensi delle parole che possono combinarsi con questi ultimi. Un marker semantico può permettere di eliminare un’analisi sintattica che non la soddisfi. Marker semantici e selectional restrictions sono computazionalmente efficaci.

Comprensione del linguaggio Un qualunque modello di comprensione del linguaggio non può prescindere da un modello di rappresentazione della conoscenza Conoscenza del mondo versus conoscenza del dominio La conoscenza del dominio permette di scartare alcune interpretazioni di una frase perché fuori contesto. Gestione delle metafore.

Significato delle parole Non basta conoscere il significato delle parole per arguire il significato delle frasi Ruolo fondamentale dei verbi (template-like predicate argument structure) Numero degli argomenti Posizione e categoria sintattica Nome degli argomenti Nomi come costanti privi di significato

L’approccio teorico Cominceremo a guardare a La struttura esterna relazionale tra le parole (paradigmatica) La struttura interna delle parole che determina dove esse possano essere e cosa possano fare (syntagmatica)

Per cominciare… Cos’è una parola? tipo, token, stem, root, forme flessse, etc.... Lessema: un’entry in un lessico consistente in una coppia (forma, rappresentazione di un unico significato) Lessico: collezione di lessemi

Omonimia Lessemi che condividono la forma ma hanno significati distinti e non correlati miglio misura e miglio graminacea (omografe e omofone) pésca di pesci e pèsca frutto (omografe)

Polisemia Un singolo lessema con più significati associati ad esso. Moltissime parole hanno più di un significato (piano) Anche i verbi tendono ad essere polisemici (operare) La distinzione tra polisemia ed omonimia non è sempre facile (nè talvolta necessaria)

Relazioni Relazioni paradigmatiche Sinonimia Antonimia Iponimia Metonimia Metafora

Metafora e Metonimia Rappresentano casi specifici di polisemia Ho speso due ore su quell’esercizio. Metonimia La Casa Bianca ha annunciato ieri che... Questo capitolo parla della cinematica La mia auto beve molta benzina

Synonimia Due lessemi sono sinonimi se possono essere sostituiti in tutte le situazioni non alterando il significato della frase Parole che hanno lo stesso significato in alcuni (o in tutti) i contesti. giovane adolescente grande largo … automobile macchina …

Antonimia Parole che sono opposte rispetto ad un aspetto del loro significato, sono molto simili rispetto agli altri buio luce ragazzo ragazza caldo freddo su giù dentro fuori

Calcolo della similarità tra parole Per molte applicazioni è utile riconoscere parole che sono simili tra loro. Machine translation (to find near-synonyms) Information retrieval (per fare “query expansion”) Due modi per fare ciò: Calcolo automatico basato sulle distribuzioni di similarità Uso di un thesaurus che elenchi parole simili WordNet (per esmpio)

Iponimia/Iperonimia Iponimia: il significato di un lessema è un subset del significato di un altro Poichè i cani sono dei canidi cane è un iponimo di canide, mentre Canide è un iperonimo di cane Similmente, Automobile è un iponimo di veicolo, mentre Veicolo è un iperonimo di automobile

WordNet Databsa lessicale organizzato gerarchicamente On-line thesaurus + alcuni aspetti di un dizionario Versioni per altri linguaggi (EuroWordNet) Category Unique Forms # of Senses Noun 114,648 141,690 Verb 11,306 24,632 Adjective 21,436 31,015 Adverb 4,669 5808

Format of Wordnet Entries

WordNet Noun Relations

WordNet Verb and Adj Relations

WordNet Hierarchies

Struttura interna delle parole Per quanto attiene alla struttura interna delle parole, vediamo i seguenti aspetti: Ruoli tematici nei lessemi Selection restrictions sui ruoli tematici Semantica decomposizionale dei predicati Feature-structures per i nomi

Ruoli tematici I ruoli tematici sono delle gneralizzazioni dei ruoli specifici che occorrono con verbi specifici I.e. Takers, givers, eaters, makers, doers, killers, hanno tutti in comune -er (nella lingua inglese) Sono tutti agenti delle rispettive azioni Si può generalizzare su altri ruoli oppure ci si può limitare ad un set finito di tali ruoli.

Esmpi di Ruoli Tematici

Linking I ruoli tematici, le categorie sintattiche e le loro posizioni in più grandi strutture sinttiche, sono tutti interrelati in modi spesso complessi. Per esempio… AGENTS sono spesso soggetti In una regola VP->V NP NP, il primo NP è spesso un GOAL e il secondo un THEME

Ancora sul Linking John opened the door AGENT THEME The door was opened by John THEME AGENT The door opened THEME John opened the door with the key AGENT THEME INSTRUMENT

Inferenza Dato un evento espresso da un verbo che esprime un trasferimento, che cosa può essere inferito (dedotto) circa ciò che è etichettato con THEME rispetto a ciò che è etichettato con GOAL?

Problemi Cos’è esattamente un ruolo? Qual è il set corretto di ruoli da usare? I ruoli sono universali? I ruoli sono atomici? I.e. Agents Animate, Volitional, Direct causers, etc Possiamo etichettare automaticamente i costituenti sintattici con i ruoli tematici?

Selection Restrictions I want to eat someplace near campus Usando i ruoli tematici noi non possiamo dire ora che eat è un predicato che ha un AGENT e un THEME E cos’altro? Che AGENT deve essere capace di mangiare e THEME deve essere qualcosa che possa essere mangiato

Logical Statements Per eat… Eating(e) ^Agent(e,x)^ Theme(e,y)^Isa(y, Food)

Back to WordNet Uso degli iponimi di WordNet per codificare le selection restrictions

Selectional Restrictions come cattiva approssimazione di una semantica profonda Sfortunatamente i verbi sono polisemici ed il linguaggio naturale molto creativo … esempi del WSJ … … ate glass on an empty stomach accompanied only by water and tea you can’t eat gold for lunch if you’re hungry … get it to try to eat Afghanistan

Soluzioni Eat glass Eat gold Eat Afghanistan Questo è un evento di mangiare, così si può cambiare il modello di “mangiabile”. Eat gold La presenza della negazione permette al THEME di non essere “mangiabile” Eat Afghanistan Questo è veramente molto difficile, perchè non è “mangiabile” per niente.

Word Sense Disambiguation (WSD) Data una parola in un contesto, decidere quale senso della parola è assumibile come vero.

Selection Restrictions per WSD Le selectional rectritions possono essere utili per disambiguare: Argomenti ambigui in predicati non ambigui Predicati ambigui con argomenti non ambigui Ambiguità totale

Problemi Le selectional restrictions sono violate costantemente nel linguaggio Ciò non significa che le frasi siano scorrette, o da non preferirsi rispetto ad altre C’è bisogno di qualche processo di categorizzazione delle modalità con cui le selectional restrictions vengono violate