Interaction Models Group. Funzionalità Interaction Models Group Consente lestrazione della struttura grammaticale di una frase La struttura grammaticale.

Slides:



Advertisements
Presentazioni simili
Michele A. Cortelazzo Morfologia 1.
Advertisements

© 2007 SEI-Società Editrice Internazionale, Apogeo Unità D1 Architetture di rete.
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità A1 Introduzione a Java.
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità D1 Architetture di rete.
PHP.
Inizio… Linguaggi Linguaggi di programmazione Linguaggi di programmazione Linguaggi di programmazione Linguaggi di programmazione Linguaggi Formali Linguaggi.
1 Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento.
Re-engineering del wrapper XML Schema per il sistema MOMIS
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea in Ingegneria Informatica Integrazione di WordNet Domains.
La chiusura del dataset 2008: scadenze e procedure Gianluigi Ferrante - Valentina Minardi 6 Febbraio 2009 Istituto Superiore di Sanità
governare l’Information Overload
Sistemi computazionali per il linguaggio naturale
Intelligenza Artificiale Linguaggio naturale
Maria Teresa PAZIENZA a.a
Computer, Lingue ed Applicazioni Perché comprendere tramite gli elaboratori i contenuti testuali? I testi sono i veicoli principali di significato per.
Sistemi basati su conoscenza Comunicazione basata sul linguaggio naturale Prof. M.T. PAZIENZA a.a
Apprendimento Automatico: Elaborazione del Linguaggio Naturale
Lo sviluppo del linguaggio nel bambino
Tema 1: Integrazione di dati provenienti da sorgenti eterogenee
Gli Apprendimenti nella Disabilità uditiva e le Nuove Tecnologie
Chomsky La grammatica/sintassi è una proprietà della mente
Elementi di morfologia nominale
Unità Didattica 2 I Linguaggi di Programmazione
Informatica giuridica Informatica e lingua del diritto Nicola Palazzolo Anno Accademico 2006/2007.
La ricerca in rete e la comunicazione/collabor azione Laboratorio Le fonti e la ricerca nel web.
LINGUAGGI DI PROGRAMMAZIONE
AN FI Concetti. Linguaggi di alto livello u Hanno capacita' espressive superiori a quelle del linguaggio macchina u Suggeriscono concetti e modi.
Corso di PHP.
Strategie d’uso del computer nella didattica
Che cos’è l’annotazione di un corpus?
Chomsky La grammatica/sintassi è una proprietà della mente Distinta dalla capacità di comunicare E una facoltà autonoma ed innata La comunicazione è solo.
Fa parte del programma di apprendimento permanente che si propone di promuovere la cooperazione e la mobilità e di rafforzare la dimensione europea dellistruzione.
C APITOLO 6 © 2012 Giorgio Porcu – Aggiornamennto 22/02/2012 G ESTIRE D ATI E C ARTELLE DI LAVORO Excel Avanzato.
Progetto per l'apprendimento dell'Italiano, basato su tecnologie web e rivolto a studenti sinofoni Italiano per Cinesi.
Database & Information Retrieval
Descrizione Semantica ad Alto Livello di Ambienti Virtuali in X3D
Internet L’essenziale.
La gestione delle informazioni non strutturate Roma, 15 novembre 2007.
Espressione polirematica
Servizio Nazionale di Valutazione: il mandato Art. 1, c. 5, Legge 25 ottobre 2007, n. 176: dallanno scolastico 2007/08 il Ministro della Pubblica Istruzione.
FantaGoal Quando il calcio è di rigore… Fantasia Nicola Corso di Laurea in Informatica Università La Sapienza Roma A.A. 2003/2004.
SINTASSI.
UNA VERSIONE PER IL D.S.A..
Maria Piscitelli Firenze, 3 dicembre 2010
entra. Ricerca semplice inserire la parola click! Non occorre indicare la lingua !
PROGRAMMAZIONE DISCIPLINARE DOCENTE: PELLEGRINETTI ENRICA
Michele A. Cortelazzo Morfologia 1.
La riflessione sulla lingua nelle Indicazioni nazionali
Il Parallel Turin University Treebank Cristina Bosco – Manuela Informatica applicata alla comunicazione multimediale
(L-LIN/01-Glottologia e Linguistica) Linguistica
Elaborazione del linguaggio naturale CFG: esercizi Maria Teresa PAZIENZA a.a
Intelligenza Artificiale 1 Gestione della conoscenza lezione 19 Prof. M.T. PAZIENZA a.a
TALN Corpus-based computational linguistics Seminario del corso di Trattamento Automatico del Linguaggio Naturale (a. a – 2002) Daniele Barsocchi.
Un Sistema per la Redazione Assistita di Testi Giuridici Tesi di Laurea Specialistica in Informatica di Emiliano Giovannetti Un Sistema per la Redazione.
Come costruire sistemi di elaborazione del linguaggio naturale Fornire le conoscenze necessarie per elaborare dati linguistici –Acustico-fonetiche (input.
AURORA Amministrazioni unite per la redazione degli oggetti e delle registrazioni anagrafiche nel protocollo informatico PROGETTO AURORA Le raccomandazioni.
Corpora e linguistica computazionale Cristina Bosco Corso di Informatica applicata alla comunicazione multimediale
TECNOLOGIE PER LA DISABILITA’ UDITIVA
Linguistica computazionale e approcci corpus-based
Linguistica computazionale: task sul linguaggio naturale Cristina Bosco 2015 Informatica applicata alla comunicazione multimediale.
Il progetto Turin University Treebank: corpora e NLP Cristina Bosco Dipartimento di Informatica Università di Torino Corso di informatica applicata alla.
L'analisi dei testi per la realizzazione del Web Semantico: quali gli strumenti e le applicazioni Paolo Poto Expert System Spa.
Sistemi basati su conoscenza Linguaggio naturale: semantica Prof. M.T. PAZIENZA a.a
Come costruire sistemi di elaborazione del linguaggio naturale (NLP) Due paradigmi di riferimento –Basato sulla conoscenza (Knowledge Engineering, KE)
Tecnologie della lingua Human Language Technology (HLT)
Eprogram informatica V anno.
Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Fisiche, Informatiche e Matematiche Corso di Laurea in Informatica Progettazione e.
Comprensione frasale Garden Path theory
1 Lixto tools evaluations for HTML data Integration in Momis Lixto tools evaluations for HTML data Integration in Momis Università degli Studi di Modena.
Parsing ricorsivo discendente Il parsing ricorsivo discendente (recursive descent parsing) è un metodo di tipo top-down che può essere facilmente codificato.
Transcript della presentazione:

Interaction Models Group

Funzionalità Interaction Models Group Consente lestrazione della struttura grammaticale di una frase La struttura grammaticale è la base per ulteriori elaborazioni (traduzione automatica, estrazione del significato, question answering, …)

Funzionalità Esempio: risultato dellanalisi della frase In quale città si svolge il TOSM? Target della query Criteri di selezione Relazione coinvolta Interaction Models Group

Funzionalità Interaction Models Group Permette di effettuare lanalisi su interi file di testo. Il file viene selezionato dallutente e il risultato viene salvato in un file con estensione.tut

Uninfrastruttura linguistica Lanalizzatore sintattico fornisce la struttura delle frasi, a cui si possono applicare ulteriori processi. Esso ha costituito la base per vari progetti In particolare, è stato utilizzato per linterpretazione di query in linguaggio naturale, utilizzando unontologia come base per lestrazione del significato Ontologia (in informatica): Rappresentazione in forma di grafo della conoscenza su un dominio applicativo Interaction Models Group

Uninfrastruttura linguistica Interaction Models Group Il Progetto Europeo HOPS query in linguaggio parlato query in linguaggio scritto Database (in formati eterogenei) degli eventi culturali a Torino, Barcellona, Camden (Londra) gestione del dialogo utente-sistema lanalizzatore linguistico lontologia 4 lingue: italiano inglese catalano spagnolo Obiettivo: Gestione di dialoghi per fornire informazioni sugli eventi culturali di una città

Uninfrastruttura linguistica Interaction Models Group Il Progetto TOCAI lanalizzatore linguistico lontologia ANALIZZATORE LINGUISTICO Albero Annotato INTERPRETE SEMANTICO Query Ontologica Ontologia ONT-TO-PRED- TRANSLATOR Query effettiva Ont-Pred Mapping BASI DI DATI FEDERATE Dizionario Query in italiano Grammatica Database (in formati eterogenei) di informazioni su radar Obiettivo: Accesso a informazioni su installazioni, manutenzione, ricambi, di sistemi radar

Interaction Models Group Uninfrastruttura linguistica Il Progetto annotazione di testi legali All' articolo 40, comma 1, della legge 28 dicembre 2005, n. 262, le parole: "sei mesi sono sostituite dalle seguenti: "dodici mesi" 4. All' articolo 40, comma 1, della legge 28 dicembre 2005, n. 262, le parole: "sei mesi sono sostituite dalle seguenti: "dodici mesi". annotazione NormeInRete generazione automatica NormeInRete estesa analisi sintattica e semantica AllRIF9, le parole VIR1 sono sostituite dalle seguenti VIR2. preprocessing Obiettivo: Inserimento automatico di tag XML che identificano componenti semantiche

Interaction Models Group Uninfrastruttura linguistica Traduzione automatica: Il Progetto ATLAS (Automatic Translation into sign LAnguageS) Albero Annotato GENERATORE LIS SCRITTA Frase LIS PIANIFICATORE DEI MOVIMENTI Sequenza di movimenti Didascalia di programma televisivo Dizionario dei Segni GENERATORE DELLIMMAGINE ANIMATA ANALIZZATORE LINGUISTICO DizionarioGrammatica In collaborazione con RAI, Politecnico di Torino, Microsoft, BEPS, CSP, Lumiq, Virtual Reality and Multimedia Park, FBK di Trento, Global Communication lanalizzatore linguistico Obiettivo: Traduzione dallItaliano all Linguaggio dei Segni dei sordi controllo dellanimazione traduttore

Interaction Models Group Architettura dellanalizzatore Regole di chunking Sequenza di interpretazioni morfologiche ANALIZZATORE MORFOLOGICO Dizionario Tabelle morfologiche Sottocategorizzazione verbale POS TAGGER Regole di disambiguazione Sequenza di item lessicali TESTO ITALIANO ALBERO SINTATTICO ANALIZZATORE SINTATTICO

Interaction Models Group Architettura dellanalizzatore Lanalizzatore morfologico si occupa di effettuare laccesso al dizionario, per estrarre da esso (e dalle desinenze individuate) le informazioni associate alle parole in input Es. capitano: a. capitan-o (CAPITANO NOUN COMMON M SING) b. capit-ano (CAPITARE VERB IND PRES 3 PL) Dizionario: oltre lemmi (radici lessicali) Le tabelle morfologiche contengono informazioni sulle desinenze possibili: Es. Nomi maschili della classe 2 (es. capitan-) -o (M SING); -i (M PL) Verbi della classe 1 (es. capit-) -o (IND PRES 1 SING); -i (IND PRES 2 SING); -a (IND PRES 3 SING) -iamo (IND PRES 1 PL) ……. Tabelle morfologiche per italiano, inglese, catalano, spagnolo

Architettura dellanalizzatore Interaction Models Group Il POS (Part of Speech) Tagger si occupa di scegliere, tra le varie interpretazioni di una parola, quella più probabile in un dato contesto Es. Il capitano ha dato lordine NOUN Queste cose capitano raramente VERB 320 regole di disambiguazione del tipo: SE la parola può essere un nome e un verbo AND è preceduta da un articolo ALLORA è un nome Percentuale di scelte corrette: 97.8%

Interaction Models Group Architettura dellanalizzatore Lanalizzatore sintattico (parser) produce una struttura a dipendenze che rappresenta lorganizzazione interna della frase. ANALISI COORDINAZIONE Sequenza di item lessicali CHUNKING NON VERBALE ANALISI STRUTTURE VERBALI Albero Sintattico Esso è organizzato nel modo seguente

Il presidente e il direttore parteciperanno al convegno di Roma Architettura dellanalizzatore Interaction Models Group Gruppi nominali (IL ART DEF M SING) (PRESIDENTE NOUN COMMON M SING) (E CONJ COORD) (IL ART DEF M SING) (DIRETTORE NOUN COMMON M SING) (PARTECIPARE VERB IND FUT 3 PL) (A PREP) (IL ART DEF M SING) (CONVEGNO NOUN COMMON M SING) (DI PREP) (ROMA NOUN PROPER F SING) Sequenza di item lessicali Fase 1: Chunking non verbale

Architettura dellanalizzatore Interaction Models Group (IL ART DEF M SING) (PRESIDENTE NOUN COMMON M SING) (E CONJ COORD) (IL ART DEF M SING) (DIRETTORE NOUN COMMON M SING) (PARTECIPARE VERB IND FUT 3 PL) (A PREP) (IL ART DEF M SING) (CONVEGNO NOUN COMMON M SING) (DI PREP) (ROMA NOUN PROPER F SING) Gruppi nominali Strutture Coordinate Fase 2: Analisi Coordinazione

Architettura dellanalizzatore Interaction Models Group Fase 3: Analisi Strutture Verbali (IL ART DEF M SING) (PRESIDENTE NOUN COMMON M SING) (E CONJ COORD) (IL ART DEF M SING) (DIRETTORE NOUN COMMON M SING) (PARTECIPARE VERB IND FUT 3 PL) (A PREP) (IL ART DEF M SING) (CONVEGNO NOUN COMMON M SING) (DI PREP) (ROMA NOUN PROPER F SING) Gruppi risultanti dalle fasi 1 e 2 Informazione verbale: Il verbo partecipare è un verbo intransitivo che prevede un soggetto e un tema (di norma un evento) soggetto tema luogo

Interaction Models Group Architettura dellanalizzatore Il ruolo dellontologia nella successiva interpretazione semantica (estrazione del significato) è quello di fornire informazioni del tipo: I convegni sono un tipo particolare di eventi I direttori e i presidenti sono persone Le persone possono partecipare agli eventi In base a questo tipo di informazioni è possibile poi costruire il risultato voluto (una operazione un database, la traduzione in unaltra lingua, la risposta a delle domande, …) Sistemi di supporto intelligenti possono poi ragionare su quanto detto: - Se il direttore e il presidente partecipano a una riunione a Roma, sarà necessario prenotare un aereo e un albergo.

Altre iniziative Interaction Models Group Sviluppo di Treebank. Dal sito è possibile scaricare unampia base di dati contenente alberi di analisi sintattica di frasi Italiane. I treebank sono di ampio uso per algoritmi di apprendimento automatico di regole della lingua. Il Turin University Treebank è fra i 3 treebank per litaliano attualmente disponibili ed è lunico ad accesso libero. Nellambito del trattamento automatico del linguaggio, sono ancora da ricordare: Organizzazione di Evalita. Evalita ( è una competizione internazionale per la valutazione di strumenti software di analisi dellItaliano. Il gruppo di Torino ha collaborato nellorganizzazione di Evalita 2007 e in quella della seconda edizione, 2009, attualmente in corso.