Le tecnologie del linguaggio umano incontrano la lingua di internet Dario De Cristofaro, Emanuele Sartori 1° B Classico, Liceo Antonio Rosmini, Rovereto.

Slides:



Advertisements
Presentazioni simili
Un viaggio nei secoli e nello spazio al di là dell'osservazione:
Advertisements

LA FORMAZIONE DEL TUTOR AZIENDALE
Piano dell’offerta formativa anno scolastico
Seminari provinciali informativi sulla riforma
Luso dei corpora nellinsegnamento dellitaliano per scopi speciali Gianfranco Porcelli Venezia, 19 luglio 2010.
INTRODUZIONE AGLI ESAMI CAMBRIDGE DI LINGUA INGLESE a.s. 2001/2002.
SOCRATES Programma Europeo nellambito dellIstruzione che mira a promuovere la dimensione Europea e a migliorare la qualità dellistruzione attraverso lincoraggiamento.
PIANO REGIONALE ORIENTAMENTO ° INCONTRO Salò, 8 ottobre 2010.
ISTITUTO COMPRENSIVO CAVALESE- SCUOLA SECONDARIA DI I GRADO AREA DI APPRENDIMENTO: LINGUE COMUNITARIE – LINGUA TEDESCA a.s. 2011/2012 Curricolo sperimentale.
STAGE MASTERCLASS INFN-LNF 30/1-2/2/2012 Analisi questionari studenti (37/37) Studenti Liceo Classico/Scientifico, classi quinte, provenienti da tutta.
STAGES ESTIVI INFN-LNF 13-24/6/2011 Analisi questionari studenti (98/101) Studenti Liceo Classico/Scientifico e ITIS, classi quarte e quinte, provenienti.
Università della Calabria Corso di laurea: Scienze della Formazione Primaria anno accademico Università della Calabria Corso di laurea: Scienze.
IV ISTITUTO COMPRENSIVO G. LEOPARDI P.O.N Obiettivo/Azione F/1 Dal 24/02/2010 al 26/05/2010 Corpo e Linguaggi Laboratorio di arte e immagine.
Comunicazioni scritte nella amministrazione pubblica. Due tipi di competenza: 1.Semplificazione di testi 2.Produzione di testi.
dell’esistenza quotidiana
Le lingue straniere e le indicazioni nazionali La trasversalità del curricolo linguistico Incontro di ricerca-azione
MEDIA & MEDIA: COME SI LEGGE IL GIORNALE. Introduzione: tecniche di lettura Lettura pagina: da sinistra a destra e dall'alto al basso - paesi anglosassoni.
Dallo sviluppo del linguaggio all’apprendimento della letto-scrittura
Caratteristiche. Sul territorio nazionale: Licei 49,3% Tecnici 30,9% Professionali 19,8%
Corso di Linguistica e Comunicazione prof.ssa Maria Catricalà
Laboratorio di Giornalismo civico-multimediale
P.O.R. CAMPANIA SCUOLE APERTE - AZIONE A S.M.S AUGUSTO PROGETTO SIRIO (Anno scolastico )
P.O.R. CAMPANIA SCUOLE APERTE PROGETTO ANDROMEDA S.M.S AUGUSTO - ITAS V.EMANUELE II (Anno scolastico )
P.O.R. CAMPANIA SCUOLE APERTE –AZIONI CONGIUNTE- AZIONE B S.M.S AUGUSTO (Scuola capofila) ITAS V.EMANUELE II (Scuola in rete) Anno scolastico.
P.O.R. CAMPANIA SCUOLE APERTE - AZIONE A S.M.S AUGUSTO (Anno scolastico )
Che cos’è l’annotazione di un corpus?
DIDATTICA PER COMPETENZE
DIARIO DELLE ESPERIENZE
Wir, die Jugendlichen von heute Progetto in lingua tedesca Prof. Loredana Vertuani (Coordinatrice) Prof. Kirsti Lähdesmäki.
Classi terze anno scolastico ESAME DI STATO CONCLUSIVO Incontro con le Famiglie 27 Maggio 2010.
"Operazione Orientamento"
Ischia, giugno 2006Riunione Annuale GE 2006 High Performance Processors for Cartesian to Polar Coordinates Conversion in 0.25 m CMOS Dip. di Ingegneria.
ITS Meccatronico scuola e azienda unite nel post diploma presentazione del nuovo corso post diploma ITS “Tecnico Superiore per l'Automazione ed i Sistemi.
Maria Piscitelli Firenze, 3 dicembre 2010
FRANCESE DURATA DEL CORSO: 50 ore TEMPI DI ATTUAZIONE: 17 incontri nel periodo compreso tra febbraio e maggio 2012 LICEO STATALE PIETRO SICILIANI LECCE.
Master Universitario in Lingue Straniere per il Turismo
Problemi più frequenti nell’acquisizione dell’italiano
11 Febbraio 2010 Rovereto (TN). Democrazia dei Cittadini Gli esempi reali e di successo dove i cittadini decidono Di Paolo Michelotto.
Benvenuti! ISTITUTO MARCO BELLI LICEO LINGUISTICO
ESPERTO IN BIOTECNOLOGIE APPLICATE (Master per laureati e laureandi)
Esame DSD I può essere sostenuto solo nella sua completezza
Le scuole debbono servire a far teste per la Repubblica, non Grammatici...; a dar uomini pieni del senso di vera e soda pietà, di giustizia, di onestà,
{ 14 è il risultato di 12- { [ 39 – ( – 8 ) – 4 ] } =
Corso di Filosofia del Linguaggio ( )
LICEO ECONOMICO-SOCIALE. 1° biennio2° biennio 1° anno2° anno3° anno4° anno5° anno Lingua e letteratura italiana44444 Lingua straniera 1: inglese33333.
Ministero dell’Istruzione, dell’ Università e della Ricerca Ufficio Scolastico Regionale per il Piemonte Direzione Generale 1 ESAMI DI STATO 2014/15: FORMAZIONE.
Finalità generale della scuola: sviluppo armonico e integrale della persona all’interno dei principi della Costituzione italiana e della tradizione culturale.
Curriculum vitae multimediale di Anna Rossi Dati personali: Nata il 20 giugno 1978 a Palermo residente a Vicenza in via Pagliarino n62 Cod.Fisc. RSSNNO78H60G273D.
(L-LIN/01-Glottologia e Linguistica) Linguistica
Per quanto riguarda l’istruzione liceale sono previsti 6 LICEI.
LA MESSAGGERIA DEI PIU' PICCOLI
Comenius Partenariato Bilaterale e-LIS e-Learning Italiano Svenska.
1 Serbia NOVI SAD KRAGUJEVAC 2 QUALE DOVREBBE ESSERE IL RUOLO DEL LIVELLO CENTRALE ? è Definire la missione, le strategie e le programmazioni, comprese.
Linguaggio come processo cognitivo
Tecnologie della lingua Human Language Technology (HLT)
ALTERNANZA SCUOLA LAVORO
Roma, 9-12 giugno RINNOVIAMOCI CON… ENERGIA.
Lo sviluppo del giornalismo online
Introduzione a Captivate Brevi note a cura di Silvio Grosso e di Emanuele Lana
C.L.I.L. – Norme Transitorie Linguistico – Musicale – L.S.U. – L.S.U. (serale) SOLUZIONE 1: Docente di DNL, con livello B2 o B1 verso B2, veicola.
Dipartimenti di indirizzo Anno scolastico Liceo Alfano I.
ISTITUTO DI ISTRUZIONE SUPERIORE “NICOLA MORESCHI”
Linguistica Generale Il parlato e la sua rappresentazione Modulo di fonetica (articolatoria, acustica e uditiva) Antonio Romano
Per cercare un libro su un argomento (keywords) solo tra quelli scritti in una determinata lingua scegli la ricerca combinata.
Programma FIxO YEI Prospettive di attuazione PROVINCIA AUTONOMA DI TRENTO Trento, 11 Marzo 2016.
FRAMEWORK EUROPEO DELLE COMPETENZE LINGUISTICHE ELEMENTARE - A1ELEMENTARE - A2 INTERMEDIO - B1 AscoltoRiesco a riconoscere parole che mi sono familiari.
Liceo F. Corradini - Thiene. Indirizzi  Classico  Linguistico  Scienze umane  Socio-economico.
Rapporto intermedio progetto Erasmus Plus KA1, prima annualità
Transcript della presentazione:

Le tecnologie del linguaggio umano incontrano la lingua di internet Dario De Cristofaro, Emanuele Sartori 1° B Classico, Liceo Antonio Rosmini, Rovereto (TN) Stage tenuto presso lFBK, unita HLT 21 giugno – 9 luglio 2010

Motivazioni e Obiettivo Motivazione: Lavvento di internet e dei social media ha portato ad una nuova forma di espressione linguistica, diversa dallitaliano scritto standard Obiettivo: comprendere le problematiche che le tecnologie del linguaggio si trovano ad affrontare nellanalisi automatica di questo nuovo linguaggio

Descrizione del lavoro 1.Creazione di un corpus della lingua di internet e di un corpus di italiano standard 2.Confronto delle caratteristiche delle due lingue 3.Creazione di un Gold standard per la valutazione delle prestazioni di un sistema automatico sulla lingua di internet

Il corpus della lingua di internet Argomenti: la partita Italia – Slovacchia e lincidente di Valentino Rossi Da dove: Yahoo e YouTube Quando: 25 giugno 2010 Numero di post: Numero di parole: Come: Webdown e Webparser

Il corpus dellitaliano standard Argomenti:la partita Italia – Slovacchia e lincidente di Valentino Rossi Da dove: giornale lAdige Quando:6, 7, 21, 24 e 25 giugno 2010 Numero di articoli:12 Numero di parole:1.676

Confronto tra i corpora Come: lista delle frequenze delle parole Cosa: punteggiatura e parole contenuto AdigeInternet RossiVale Mugelloforza Pedrosacampione Lorenzogrande Hondamoto ancheonesto AdigeInternet,,. ??? >>... << !!!!! ? : ) ( =)

Caratteristiche distintive delle due lingue ITALIANO STANDARDITALIANO SU INTERNET Linguaggio più neutro e descrittivo Linguaggio più esplicito ed emotivo; grande uso della punteggiatura; continue abbreviazioni; parole che e ke usate moltissimo; ampio uso delle minuscole; parolacce (censurate e non).

Valutazione dei sistemi automatici Gold Standard: corpus annotato a mano con le informazioni specifiche su cui si vogliono valutare gli strumenti automatici TextPro: strumento che aggiunge ai testi informazioni linguistiche Creazione del GS: annotazione del corpus di internet con informazioni su: Segmentazione del testo in frasi Suddivisione del testo in parole Categoria lessicale delle parole (nome, verbo, agg.)

Analisi degli errori di TextPro CorpusGold StandardErrore di TextPro adesso.soloadesso. Solo Fine frase non riconosciuta N O NOI parola censurata Non riconosciute come parole singole Valenome proprio abbreviato Riconosciuto come verbo neanke,giustoooavverbio, aggettivoParole non riconosciute :-)nuova categoria: smiley Riconosciuto come punteggiatura Strumenti come TextPro si trovano in difficoltà di fronte al nuovo linguaggio utilizzato su Internet

Conclusioni Grazie a questo stage, abbiamo avuto loccasione di realizzare un corpus, abbiamo fatto uso di strumenti come TextPro e Webdownload, analizzato una lista di frequenze, creato un Gold Standard, condotto unanalisi linguistica molto ampia e abbiamo infine valutato gli errori di un software. Responsabile HLT: Bernardo Magnini Tutor: Luisa Bentivogli Tecnici: Milen Kouylekov e Christian Girardi