Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2014-2015.

Slides:



Advertisements
Presentazioni simili
Presentazione della tesi di laurea di Flavio Casadei Della Chiesa Newsletter: un framework per una redazione web.
Advertisements

Tecnologie Internet di comunicazione
USABILITÁ Sembra banale, ma….
Bruno Mellarini, IPRASE
HtML Premessa introduttiva al laboratorio Sergio Capone.
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità D1 Architetture di rete.
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità A1 Introduzione a Java.
Percorsi didattici Informatica e Telecomunicazioni.
Informatica e Telecomunicazioni
Quale denominazione? Fachsprachen LSP Langues (langages) spécialisées, de spécialité, langues professionnelles, sur objectif spécifique…. Lingue (linguaggi)
Nuove tecnologie al servizio dei cittadini e delle imprese. Giovanni Ferrero Provincia di Torino.
Le reti informatiche!! Le reti di telecomunicazioni hanno permesso una maggior diffusione delle informazioni che possono essere trasmesse e ricevute.
A cura di Lida Barazzutti. Col passare degli anni si moltiplicarono i computer collegati tra loro; intere reti, che nel frattempo si erano sviluppate.
Il Framework europeo e l’educazione linguistica
La rete del futuro nellautonomia scolastica Sezione propedeutica La rete: uno strumento privilegiato per la didattica.
SOCIAL DIMENSIONS OF TELECOLLABORATIVE FOREIGN LANGUAGE STUDY Julie A. Belz The Pennsylvania State University.
Computer, Lingue ed Applicazioni Perché comprendere tramite gli elaboratori i contenuti testuali? I testi sono i veicoli principali di significato per.
ICT (Information and Communication Technology):
Accessibilità dei siti Web
I nuovi media novità uso dell’elettricità e dell’elettronica, forme di energia non direttamente visibili tendenza alla dematerializzazione e alla delocalizzazione.
Gli Apprendimenti nella Disabilità uditiva e le Nuove Tecnologie
GooglePA, un motore di ricerca per i siti web della PA italiana Un motore di ricerca per i siti web della PA italiana Roma, 19 maggio 2010 PA.
Corso di Laurea in Comunicazione Digitale Corso di Realtà Virtuali - a.a. 2009/10 Prof. Paolo Pasteris Tutor: Stefano Baldan PROGETTARE L'INTERAZIONE
FONDAMENTI DI INFORMATICA III A2-1 CARATTERISTICHE E MODELLIZZAZIONE DEL LAVORO DUFFICIO Argomento 2 CARATTERISTICHE E MODELLIZZAZIONE DEL LAVORO DUFFICIO.
Univ. Studi di Roma FORO ITALICO Prof. Stefano Razzicchia 1 UNIVERSITA STUDI DI ROMA FORO ITALICO Corso di Laurea Triennale INFORMATICA Lez. 6.
1 Istituto Tecnologie Didattiche Consiglio Nazionale Ricerche SSIS di Genova, corso Tecnologie Didattiche, a.a. 2001/2002 Tecnologie informatiche e multimediali.
Applicazioni mobile Better Software 2009 Massimiliano Zani Sms Italia.
Valutazione della ricerca: le opportunità offerte dallOpen Access Alberto Silvani Torino 18 ottobre 2010 Questo/a opera è pubblicato sotto una Licenza.
Modulo 1 - Hardware u.d. 3 (syllabus – 1.3.5)
Modulo 1 – Reti Informatiche u.d. 4 (syllabus – 1.4.4)
PROBLEMI E “PAROLACCE” Nucleo: Relazioni e Funzioni
Il World Wide Web Lidea innovativa del WWW è che esso combina tre importanti e ben definite tecnologie informatiche: Documenti di tipo Ipertesto. Sono.
Maria Piscitelli Firenze, 3 dicembre 2010
Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2013.
Traduzione e computer (2)
Di Luca Santucci e Riccardo Latorre LA CONDIVISIONE E L’ACCESSO ALLE RISORSE DI RETE.
Report su 353 interviste in sette paesi europei per quanto riguarda l’uso delle lingue nel settore del turismo Ricerca condotta dal gruppo di lavoro “SLEST”
Social network e facebook.
Intelligenze artificiali (I.A.)
Università Roma Tre Corso di laurea magistrale CINEMA TELEVISIONE E PRODUZIONEMULTIMEDIALE Corso “Media digitali: Televisione, video, Internet” Docente:
DOTT.SSA Teresa Colonna
Creato da Riccardo Nuzzone
SISR-QUALITÀ UN MODELLO DI QUALITÀ PER I SITI WEB fonte prof Polillo.
Il Parallel Turin University Treebank Cristina Bosco – Manuela Informatica applicata alla comunicazione multimediale
Computer assisted translation (2) Cristina Bosco Informatica applicata alla comunicazione multimediale 2013.
PROGETTO: IMPARO UNA TERZA LINGUA: LINGUA SPAGNOLA in classe ANNO SCOLASTICO Destinatari: ALUNNI CLASSI I E II ITES Referente: Prof.ssa PALMIERI.
Traduzione e computer (4) Cristina Bosco Informatica applicata alla comunicazione multimediale
Software Libero e Open Source. Open Source Open Source è un termine inglese che significa sorgente aperto, e indica un programma per computer (software)
TECNOLOGIE PER LA DISABILITA’ UDITIVA
Linguistica computazionale: task sul linguaggio naturale Cristina Bosco 2015 Informatica applicata alla comunicazione multimediale.
CMS per la scuola con JOOMLA
Crescita dell’informazione nella società dell’informazione Raddoppia in meno di un anno Tra il 70 e il 90% è in forma di testo (nelle lingue storico naturali)
27 febbraio 2003 Modulo di Comunicazione Mirko Tavosanis
Tecnologie della lingua Human Language Technology (HLT)
Traduzione e computer (2) Cristina Bosco Informatica applicata alla comunicazione multimediale
Linguistica computazionale: come accedere all’informazione codificata nel linguaggio naturale (seconda parte) Cristina Bosco 2014 Informatica applicata.
1 Istituto Tecnologie Didattiche Consiglio Nazionale Ricerche SSIS di Genova, corso Tecnologie Didattiche, a.a. 2003/2004 Lezione 2: Principali strategie.
DSA e SCUOLA SECONDARIA Inglese
Media e vita quotidiana I cultural studies britannici.
IISS“Ettore Bolisani”
E-commerce: introduzione Internet ha conosciuto un forte sviluppo a partire dagli anni '90 fino a divenire, ad oggi, uno strumento utilizzato dalla maggior.
 2001 – Inizio crescita esponenziale dell’uso dei canali web  2003 – Inizia l’uso diffuso del commercio su internet (e-commerce)  2005 – In Italia.
Università Roma Tre Corso di laurea magistrale CINEMA TELEVISIONE E PRODUZIONE MULTIMEDIALE Corso “Media digitali: Televisione, video, Internet” Docente:
UNO STRUMENTO DI MARKETING MULTILINGUE Grazie a questa partnership strutturale abbiamo potenziato la capacità produttiva della nostra Divisione Contact.
Computer assisted translation (CAT - 2) Cristina Bosco Informatica applicata alla comunicazione multimediale
Chiunque può scrivere un blog, esprimendo i propri pensieri, opinioni e riflessioni con materiale virtuale, immagini e video.
Corso di formazione e training per attivisti "in e per" la Palestina La parola di VIK in Rete Daniele Frongia – ISM Italia Sala dell'Associazione Esquilino.
MT in pratica Cristina Bosco Informatica applicata alla comunicazione multimediale.
La Globalizzazione.
Transcript della presentazione:

Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale

Tipi di sistemi Fino alla metà degli anni ‘90 esistono solo due tipi di sistemi di MT: Sistemi su mainframe di grandi compagnie Sistemi su personal computer A partire dalla metà degli anni ’90: Traduttori tascabili Software di traduzione per telefonia mobile Servizi di MT su Internet

Sistemi su mainframe I sistemi di MT che giravano su mainframe di grandi compagnie erano utilizzati per produrre una grande quantità di traduzioni di qualità tale da essere pubblicabili, quindi era necessario che l’output di questi sistemi fosse migliorato. Per questo motivo furono applicate tecniche di soluzione finalizzate a migliorare la qualità e a limitare l’intervento umano

Soluzioni (applicate nei mainframe) Le seguenti soluzioni possono aumentare la qualità dell’output dei sistemi di MT: Impiego di revisori umani nel post-editing Sistemi interattivi Vincolare la varietà del linguaggio di input

L’impiego di revisori umani (esperti del LS e del LT) nel post-editing è proposto come soluzione per aumentare la qualità delle traduzioni prodotte da MT fin dai primi sistemi. Progressivamente si svilupparono strumenti per il post-editing specializzati nell’evidenziare errori frequenti e sistematici dei sistemi di MT Soluzioni (applicate nei mainframe)

Vengono sviluppati sistemi di MT che non richiedono post-editing, ma interagiscono con l’utente durante il processo di traduzione, ad es. nel caso di ambiguità di tipo lessicale o sintattico Soluzioni (applicate nei mainframe)

Vincolando la varietà del linguaggio di input si limita la difficoltà della traduzione. In due modi: Il sistema viene costruito per trattare un certo tipo di linguaggio (es. quello dei bollettini metereologici) Il testo da tradurre viene scritto utilizzando un dizionario ristretto e una struttura sintattica semplificata Soluzioni (applicate nei mainframe)

È nel contesto dei sistemi su mainframe per grandi compagnie che si sviluppa l’applicazione della MT al problema della localizzazione. Localizzazione significa adattamento di prodotti e della relativa documentazione a particolari condizioni culturali che possono variare dal corretto modo di esprimere date, numeri, tempi, indirizzi ed abbreviazioni a modificazioni più complesse del testo per renderlo corrispondente alle aspettative del cliente. Mainframe e localizzazione

La localizzazione nasce come effetto dell’immissione sul mercato di prodotti per vari paesi in contemporanea o quasi. Nasce soprattutto in relazione al software, quindi ad un genere testuale (manuali) caratterizzato da ripetitività e da piccole differenze tra uno e l’altro, tra un’edizione e l’altra. Mainframe e localizzazione

Sistemi su PC I sistemi che giravano su personal computer non è chiaro per quali scopi fossero utilizzati, ne’ da chi … prevalentemente per avere traduzioni sommarie di testi diversamente inaccessibili, senza particolare interesse per la pubblicazione del risultato della traduzione

Traduttori tascabili Sono la versione elettronica dei dizionari tascabili e hanno una analoga diffusione. Vengono diffusi prevalentemente sul mercato del turismo e dei viaggi Vengono prodotti per molte lingue Nelle versioni più recenti sono in grado di produrre output vocali

Software di traduzione per telefonia mobile Sono una estensione delle funzioni dei telefoni cellulari Riguardano i linguaggi commercialmente dominanti Nelle versioni più recenti fanno riferimento a database su server

Servizi di traduzione su Internet Inizialmente non sono ad accesso libero e simultanei Sono la versione web dei primi sistemi di MT e sono basati su regole, solo recentemente è comparso Google Translate che applica un approccio statistico Non è chiaro come e da chi sono utilizzati

Servizi di traduzione su Internet La MT è nuova per la maggior parte degli utenti che scoprono i servizi di traduzione online. Molti testano i servizi proponendo la traduzione di espressioni idiomatiche e tentano di valutare il servizio con una doppia traduzione. Il risultato è deludente.

Servizi di traduzione su Internet Non si hanno dati su chi usa i servizi di traduzione online e per quale scopo. Sorprendentemente sono poco utilizzati (15%) per lo scopo che parrebbe più ovvio, la traduzione di pagine web. Nel 50% dei casi vengono sottomesse 1-2 parole, nel restante 50 frasi lunghe mediamente 20 parole

Servizi di traduzione su Internet Sembrerebbe quindi che siano usati come dizionari, nonostante l’ampia disponibilità di dizionari online Prevalentemente da persone che conoscono la lingua in cui traducono Tuttavia l’utilizzo di questi servizi cresce costantemente in modo esponenziale A partire dal 2000 sono stati sviluppati anche sistemi per la localizzazione di pagine web

Limiti della traduzione e della LC Ulteriori limiti della MT sono stati messi in evidenza in relazione alla gestione di linguaggi colloquiali, cioè caratterizzati da frequenti ellissi e irregolarità. Ne sono un esempio: Messaggi di SMS sui cellulari Messaggi su social network

Limiti della traduzione e della LC A partire dal 1990 il crescente utilizzo di telecomunicazioni ha portato allo sviluppo di sistemi di traduzioni di messaggi di e pagine di informazione. L’importanza per studi politici e sociali dei social network ha evidenziato l’urgenza di trattare testi che vengono prodotti in Facebook e Twitter.

Limiti della traduzione e della LC Anche se cresce il numero di sistemi in grado di produrre output in forma vocale, la traduzione del linguaggio orale è ancora una delle aree più problematiche. Non solo per i problemi legati all’analisi e sintesi del parlato, ma anche per la forma particolare dei dialoghi, la massiccia presenza di ellissi e la forte dipendenza dal contesto.

Limiti della traduzione e della LC Esistono progetti non commerciali per lo sviluppo di sistemi di dialogo e traduzione su domini limitati, come comunicazioni di affari e prenotazioni alberghiere. Un’area in via di sviluppo riguarda la comunicazione medico-paziente con possibili applicazioni in contesti in cui sono presenti minoranze linguistiche.

Warren Weaver “There is no need to do more than mention the obvious fact that a multiplicity of languages impedes cultural interchange between the peoples of the earth, and is a serious deterrent to international understanding.”

MT per quali lingue? La MT si è orientata ai suoi esordi alla coppia inglese-russo e successivamente alle lingue commercialmente interessanti (giapponese, tedesco, spagnolo, francese, cinese …). Pochissima attenzione è stata prestata agli altri linguaggi

MT per quali lingue? Da un punto di vista globale, i linguaggi ‘minori’ sono quelli non significativi per le transazioni commerciali L’immigrazione però fa sì che linguaggi minori siano parlati ovunque.

MT per quali lingue? Il problema dei linguaggi delle minorità è dovuto anche alla mancanza di risorse dedicate a tali linguaggi (dizionari, spellchecker … corpora). E ci sono anche linguaggi di minoranze non di tipo etnico e geografico, come i sordi

MT per quali lingue? Negli ultimi anni sono stati sviluppati progetti per la traduzione nel linguaggio dei sordi ad es. per l’italiano E progetti per la traduzione di sottotitoli di programmi televisivi

Ieri e oggi la MT Oggi la tendenza è verso lo sviluppo di moduli di traduzione integrati in sistemi che svolgono varie funzioni e meno di sistemi dedicati unicamente alla MT Oltre alla MT, si lavora su altri task multilingue come Information Retrieval e Information Extraction: la traduzione non è un’attività isolata

Ieri e oggi la MT Dal punto di vista sociale il mondo è cambiato e di conseguenza la richiesta di MT proviene da utenti diversi e per task diversi rispetto al passato. Anche le aspettative sono oggi diverse e i risultati positivi riguardano task e domini limitati. La ricerca della traduzione perfetta non ha più senso.