Computer e traduzione /3/2010 Informatica applicata alla

Slides:



Advertisements
Presentazioni simili
Linguaggio C e C++.
Advertisements

I Linguaggi di programmazione
Testo, ipertesto e ipermedia
Informatica applicata alla comunicazione multimediale
Intelligenza artificiale
Interazione Uomo - Macchina
Analisi e progettazione
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità A1 Introduzione a Java.
STRUTTURA DEL PERSONAL COMPUTER
Comprensione e interpretazione del testo
I linguaggi di programmazione
Prof. Emanuele Marino Concetti teorici di base della tecnologia dellinformazione.
Informatica giuridica Le applicazioni dell’informatica giuridica
TW Analisi dei documenti n Classificazione dei componenti n Selezione dei componenti, costruzione della gerarchia, dei blocchi informativi e degli elementi.
L'open source a scuola... di Paola Travostino.
Multimedialità Ipertesto Interattività
Valutare una proposta di Open learning a cura di Pg.Rossi Supponiamo che una scuola debba organizzare un percorso di formazione per i propri docenti. Ha.
DIFFICOLTA’ DEL LINGUAGGIO
Tenendo conto della Finalità della scuola: Offrire un contributo significativo alla formazione delluomo e del cittadino che dovrà vivere ed operare nella.
Il Software: Obiettivi Programmare direttamente la macchina hardware è molto difficile: lutente dovrebbe conoscere lorganizzazione fisica del computer.
Informatica.science.unitn.it Un esempio di architettura basata sulluso di XML e XSL per la pubblicazione di un sito web.
Testo consigliato Crittografia, P. Ferragina e F. Luccio, Ed. Bollati Boringhieri, € 16.
I DSS – Decision Support System
Struttura dei sistemi operativi (panoramica)
La traduzione automatica dei testi
Unità Didattica 2 I Linguaggi di Programmazione
Linguaggi di markup1 LINGUAGGI DI MARKUP. Linguaggi di markup2 Documenti su Internet Internet permette (tra laltro) di accedere a documenti remoti In.
“Ricordare” da un punto di vista psicologico
Informatica giuridica Informatica e lingua del diritto Nicola Palazzolo Anno Accademico 2006/2007.
Informatica giuridica Origine e sviluppo dellinformatica giuridica Lucio Maggio Anno Accademico 2003/2004.
Informatica giuridica Le applicazioni dellinformatica giuridica Nicola Palazzolo Anno Accademico 2006/2007 Prima parte.
Strategie d’uso del computer nella didattica
Riassumendo le teorie sulla comunicazione
PRESENTAZIONE di RICCARDO
STRUTTURA GENERALE DI UN ELABORATORE
Lezione 1 Linguaggi di programmazione – Algoritmi –Istruzioni
Alle origini della scienza dellinformazione /5 Luca Mari
Gianpaolo Cecere Introduzione
UNA VERSIONE PER IL D.S.A..
Alla fine degli anni quaranta nasceva il mito del cervello elettronico, e tutte le attività connesse allutilizzo del computer venivano indicate tramite.
Linguaggi per COMUNICARE
Programma di Informatica Classi Prime
Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2013.
Tipologie standard di preventivi nella localizzazione, cosa è cambiato?
Corso di Laurea in Ingegneria per l’Ambiente e il Territorio Informatica per l’Ambiente e il Territorio Docente: Giandomenico Spezzano Tutor: Alfredo Cuzzocrea.
IO E LA MATEMATICA PROCEDURALE
L’integrazione scolastica dell’alunno DSA
Computer assisted translation (2) Cristina Bosco Informatica applicata alla comunicazione multimediale 2013.
Introduzione: informatica 18/2/2013 Informatica applicata alla comunicazione multimediale Cristina Bosco.
Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale
Traduzione e computer (4) Cristina Bosco Informatica applicata alla comunicazione multimediale
Robotica Lezione 4. 2 Attributi dell’Intelligenza Pensiero Capacita’ a risolvere problemi Apprendimento e Memoria Linguaggio Intuizione e Creativita’
Come impostare il curricolo
1 Macchine astratte, linguaggi, interpretazione, compilazione.
INTELLIGENZA ARTIFICIALE
Intelligenza Artificiale Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Tecnologie della lingua Human Language Technology (HLT)
Multimedialità: uso contemporaneo e sinergico di diversi media (testo, immagini, suoni); intreccia tra loro linguaggi tradizionalmente originati da media.
Problemi, algoritmi e programmazione
Informazione e Informatica - presentazione dei concetti di base -
Informatica giuridica Origine e sviluppo dell’informatica giuridica Lucio Maggio Anno Accademico 2001/2002.
Le basi di dati.
Il Computer Un elaboratore o computer è una macchina automatizzata in grado di eseguire complessi calcoli matematici ed eventualmente altri tipi di elaborazione.
Computer assisted translation (CAT - 2) Cristina Bosco Informatica applicata alla comunicazione multimediale
Dal problema al programma – ciclo di sviluppo del software La scrittura del programma è solo una delle fasi del processo di sviluppo di un'applicazione.
COMPONENTI DI UN SISTEMA INFORMATICO HardwareSoftware Parte fisicaComponenti logiche Componenti fisiche (elettroniche e meccaniche) di un computer Istruzioni.
Traduzione automatica e crittografia Cristina Bosco Informatica applicata alla comunicazione multimediale
ALGORITMI, LINGUAGGI E PROGRAMMI Facoltà di Lingue e Letterature Straniere Corso di laurea in Relazioni Pubbliche.
Ipertesti e ipermedia.
Corso Base Wordfast - PRO. CAT TOOLS vs MACHINE TRANSLATION Che cosa fa un CAT TOOL Un Cat Tool NON traduce da solo ma si avvale di frase già tradotte.
Transcript della presentazione:

Computer e traduzione 10-15-16/3/2010 Informatica applicata alla comunicazione multimediale Cristina Bosco

Overview Traduzione: Traduzione automatica Traduzione assistita dal computer

Traduzione Traduzione e mondo Traduzione e nuove tecnologie Traduzione e ipertesto

Traduzione Il processo di traduzione comporta la decodifica del significato del testo nel linguaggio sorgente la ricodifica di tale significato nel testo nel linguaggio destinazione

Traduzione Il processo di traduzione comporta quindi una serie di operazioni cognitive solo apparentemente semplici e molto difficili da affrontare in modo automatico

Traduzione Necessità crescente di traduzione: Aumento di comunicazioni Necessità di distruggere le barriere linguistiche (ad es. in regioni, stati e comunità multilingui) Variazione delle logiche di mercato (inglese come lingua franca o multilinguismo?)

Traduzione Ma la traduzione è progressivamente più integrata con la comunicazione quindi deve essere più veloce e di elevata qualità riguarda grandi moli di documenti e coinvolge gruppi di traduttori

Traduzione e nuove tecnologie Le nuove tecnologie arricchiscono il nostro orizzonte culturale di nuove modalità espressive ma incidono anche profondamente sul modo in cui utilizziamo le altre modalità espressive, interagiamo con l'ambiente e costruiamo la nostra conoscenza

Traduzione e nuove tecnologie tra le nuove modalità espressive l'ipertesto si pone come la più realistica simulazione dei processi cognitivi

Traduzione e nuove tecnologie Sono ipertestuali la lettura di un testo che contiene note e rimandi la consultazione di un dizionario mentre si legge un testo E’ IPERTESTUALE ogni lettura che esce dalla logica sequenziale del testo

Traduzione e nuove tecnologie ipertesti che contengano testi e loro traduzioni consentono rapidi confronti tra versioni e svolgono un ruolo importante nel farsi e rifarsi del processo traduttivo

Traduzione e nuove tecnologie L’ipertesto è adatto quindi come supporto alla traduzione in quanto consente di realizzare in modo esplicito legami tra il testo e le sue traduzioni, i commenti, i rapporti con altri testi anche sviluppati da altre persone

Traduzione e nuove tecnologie Internet è uno strumento fondamentale perchè contiene un'enorme quantità di informazioni linguistiche e culturali: archivi di testi letterari, grandi corpora, dizionari

Overview Traduzione Traduzione automatica Traduzione assistita dal computer

Traduzione automatica Cos’è la traduzione automatica Breve storia della traduzione automatica

Traduzione automatica Per traduzione automatica (Machine Translation, MT) si intende un processo di traduzione completamente eseguito da uno strumento software

Traduzione automatica Il software di traduzione automatica prende in input un testo TA in una lingua A restituisce in output il testo TB che nella lingua B ha lo stesso significato di TA il modo in cui si passa dall’input all’output è indifferente

Traduzione automatica La traduzione automatica presenta molti vantaggi: omogeneità nello stile ed uso di vocaboli coerenza (la stessa frase è tradotta sempre nello stesso modo) ma soprattutto risparmio di tempo e denaro

Traduzione automatica La traduzione automatica è particolarmente adatta per determinati tipi di testo: guide di musei documenti dell’Unione Europea manualistica tecnica

Traduzione automatica Tuttavia la traduzione automatica non ha utilità in certi casi, ad esempio quando: lo scopo è di comprendere il contenuto di un documento si vuole la presenza della componente umana stilistica

Traduzione automatica MA la traduzione completamente automatica non è attualmente realizzabile E non sappiamo se lo sarà mai!

Traduzione automatica La traduzione completamente automatica ricade infatti nei problemi, tipici del NLP, legati a: ambiguità del linguaggio incapacità delle macchine di immagazzinare ed utilizzare tutta la conoscenza situazionale/contestuale richiesta nella comprensione di un testo

Traduzione automatica La traduzione completamente automatica è dunque impossibile quando la comunicazione tra esseri umani avviene in “ambienti” (culturali e cognitivi) aperti, mutevoli, governati da regole variabili

Traduzione automatica La traduzione completamente automatica è oggi possibile in casi particolari e ristretti in cui la comunicazione è limitata ad ambienti chiusi, circoscritti. Ed esistono molti casi che possono essere ricondotti a questa situazione.

Traduzione automatica Il forte interesse teorico, ma soprattutto pratico per la traduzione completamente automatica è il motivo per cui esistono ancora progetti di MT, e soprattutto il motivo per cui sono esistiti molti progetti di MT

Traduzione automatica: breve storia Nel 17esimo secolo le idee di Leibniz e Cartesio hanno provocato discussioni su nozioni di linguaggio universale (precorrendo l’esperanto) che faciliterebbe il commercio e linguaggi logici (precorrendo i linguaggi del computer)

Traduzione automatica: breve storia Nel 1933, Georges Artsouni ideò un “cervello meccanico”, un dispositivo per trattare (archiviare, consultare e stampare) informazioni, creato per scopi di crittografia, ma utilizzabile per la traduzione e basato sulla traduzione diretta parola per parola (senza nessuna analisi linguistica sottostante)

Traduzione automatica: breve storia Il prototipo del “cervello meccanico” viene presentato e premiato all’esposizione Universale di Parigi del 1937. Le poste e l’esercito francesi commissionano due macchine che non verranno mai realizzate a causa della guerra.

Traduzione automatica: breve storia Nel 1933, Petr Petrovic Trojanskij brevetta un modello più evoluto di macchina per la traduzione che prevede la trasformazione del testo in forma logica universale (esperanto) prima di passare alla lingua di destinazione e utilizza forme di analisi morfologica e sintattica

Traduzione automatica: breve storia L’importanza del lavoro di Artsouni e di Trojanskij sta nel fatto di aver proposto i due modelli che da allora in poi si utilizzeranno per la traduzione automatica: traduzione diretta, parola per parola traduzione indiretta, basata su interlingua o transfer

Traduzione automatica: breve storia

Traduzione automatica: breve storia La MT basata sull’interlingua o transfer prevede la trasformazione del testo sorgente in una lingua astratta e la successiva generazione del testo destinazione a partire dall’interlingua. Richiede la presenza di informazioni morfologiche sintattiche e semantiche

Traduzione automatica: breve storia La MT diretta non prevede rappresentazioni intermedie e si basa sulla traduzione di ogni parola del linguaggio sorgente nella corrispondente parola nel linguaggio destinazione

Traduzione automatica: breve storia Ma ufficialmente la storia della MT nasce nel 1949, quando Warren Weaver, esperto di decrittazione di codici, produce il promemoria “Translation”

Traduzione automatica: breve storia Weaver, formula ipotesi sulla possibilità e i metodi della MT basati su: sostituzione parola per parola (da Artsouni + crittografia/crittoanalisi) presenza di universali linguistici (metafora delle torri) frequenza delle parole (da crittoanalisi)

Traduzione automatica: breve storia Le tecniche proposte da Weaver si rifanno sostanzialmente alla crittografia e alla crittoanalisi, tecniche molto antiche, già in uso ad esempio presso i romani durante il periodo di Cesare. (Una avvincente storia della crittografia: Simon Singh, Codici e segreti, Mondadori)

Traduzione automatica: breve storia Un esempio di crittografia: il codice di Cesare

Traduzione automatica: breve storia Gli studi di crittografia e crittoanalisi ebbero grande sviluppo nel 700 in Francia e poi durante la seconda guerra mondiale, consentendo la vittoria degli alleati e la sconfitta dei tedeschi (grazie al contributo di Alan Turing e del gruppo di Bletchley Park)

Traduzione automatica: breve storia Dopo l’entusiasmo generato da Weaver e 10 anni ricchi di progetti di MT, la MT entra in una fase di stagnazione per lo scarso successo ottenuto dai progetti e per le critiche di vari studiosi, tra cui in particolare quella del filosofo Bar-Hillel (1959)

Traduzione automatica: breve storia Bar-Hillel sostiene che la MT è inattuabile perché non esistono i mezzi tecnici per realizzarla e soprattutto perché sicuramente non si può riprodurre in una macchina la conoscenza situazionale che è a fondamento di qualunque traduzione

Traduzione automatica: breve storia Bar-Hillel vede come irraggiungibile la FAHQT (fully automatic high quality translation) che rappresenta il traguardo più ambizioso per i sistemi di traduzione, ma non necessario in molti casi reali. Teorizza una traduzione di tipo transfer.

Traduzione automatica: breve storia Negli stessi anni (1954) l’IBM attirava fondi e interesse pubblico pubblicizzando l’esperimento di Georgetown: traduzione, dal russo all’inglese, di 49 frasi accuratamente preparate utilizzando 6 regole grammaticali e 250 item lessicali

Traduzione automatica: breve storia Nel 1966 l’ALPAC (Automatic Language Processing Advisory Committee, composto da 6 scienziati statunitensi) diffonde il suo rapporto in cui si dichiara impraticabile la MT e si enfatizza la necessità di ricerca di base nella linguistica computazionale

Traduzione automatica: breve storia Riassumendo: precursori (1933-1949), alcuni studiosi sviluppano macchine per la traduzione e si evidenziano i due modelli, traduzione diretta e traduzione tramite interlingua o transfer.

Traduzione automatica: breve storia Riassumendo: i due modelli: traduzione diretta traduzione indiretta, tramite interlingua o transfer

Traduzione automatica: breve storia

Traduzione automatica: breve storia Riassumendo: traduzione diretta: basata essenzialmente su una traduzione parola per parole, con qualche aggiustamento a livello sintagmatico, di ordine dei costituenti e di locuzioni idiomatiche

Traduzione automatica: breve storia traduzione indiretta di tipo transfer: LS ->SYS-S -> SYS-D ->LD dal testo in LS si estrae SYS-S (rappresentazione strutturale conforme alla LS) SYS-S viene trasformata in SYS-D (rappresentazione strutturale conforme alla LD) ed impiegata per generare un testo in LD.

Traduzione automatica: breve storia traduzione indiretta di tipo interlingua: LS-> lingua universale -> LD da un testo in LS è tradotto in una forma linguistica non caratterizzata (universale) che viene tradotto in LS.

Traduzione automatica: breve storia Riassumendo: prima fase (1946-1954), detta sperimentale, caratterizzata da ottimismo euforico: si supponeva che un’approfondita ricerca avrebbe permesso di creare macchine in grado di tradurre tutto e con altissima qualità.

Traduzione automatica: breve storia Riassumendo: seconda fase (1954-1966), inizia l’entusiasmo per l’esperimento di Georgetown, continua con lo scetticismo di Bar-Hillel, e si conclude con il rapporto ALPAC secondo cui la FAHQT è impossibile e occorre sviluppare sistemi di supporto alla traduzione ed approfondire la linguistica computazionale

Traduzione automatica: breve storia Riassumendo: terza fase (1966-1975), detta di linguistica computazionale, si sviluppano nuovi sistemi basati su informazione linguistica, si approfondiscono gli studi sul parsing e sul trattamento del linguaggio.

Traduzione automatica: breve storia Riassumendo: quarta fase (dal 1975), in cui la ricerca sulla MT si lega ai nuovi approcci di intelligenza artificiale con orientamento interdisciplinare (informatica, linguistica computazionale e traduttologia).

Overview Traduzione Traduzione automatica Traduzione assistita dal computer

Traduzione assistita dal computer Breve storia dei sistemi integrati Cosa sono i sistemi integrati

Traduzione assistita dal computer L'invito dell’ALPAC a sviluppare sistemi di supporto alla traduzione per molti anni non potè essere seguito a causa dei limiti dei calcolatori dell’epoca. Ma negli anni '60 e '70 alcuni grandi uffici di traduzione iniziarono a creare banche dati

Traduzione assistita dal computer Essendo caricate in supercalcolatori, le banche dati potevano però essere utilizzate solo all'interno delle organizzazioni che le avevano sviluppate (Comunità Europee, governo canadese, Ufficio federale per le questioni linguistiche della Svizzera ...)

Traduzione assistita dal computer Solo a metà degli anni '80, con la diffusione dei PC e successivamente con l’avvento delle reti, vengono sviluppati e resi disponibili tools per la gestione di corpora terminologici (sistemi di gestione terminologica, sistemi di gestione di glossari, vocabolari digitali …)

Traduzione assistita dal computer All'inizio degli anni '90 nascono i cosiddetti sistemi integrati finalizzati alla raccolta e la riproposta di traduzioni già effettuate dall'utente, gestite in modo da poterle condividere con altri traduttori (anche in rete), per ridurre i tempi di traduzione e garantire una maggiore coerenza formale e contenutistica della traduzione

Traduzione assistita dal computer I sistemi integrati di traduzione assistita (CAT, Computer Assisted Translation) sono solitamente composti da Memoria di traduzione Database terminologico Editor di traduzione

Traduzione assistita dal computer Cosa è la memoria di traduzione (TM, tanslation memory)? É un database di frasi bilingue allineate, una raccolta di testi precedentemente tradotti, che viene automaticamente generata e consultata per verificare se (parte del)la frase è già stata tradotta.

Traduzione assistita dal computer Come funziona una TM? Se la frase è già stata tradotta, propone la traduzione (con il grado di concordanza tra la frase contenuta nella TM e quella nuova) che potrà essere eventualmente modificata.

Traduzione assistita dal computer Come funziona una TM? Se la frase NON è ancora stata tradotta, l’utente dovrà digitare l’intera frase nuova, che verrà a sua volta memorizzata nella TM.

Traduzione assistita dal computer Come funziona una TM? Nella traduzione proposta, i segmenti di frase modificati e quelli nuovi sono evidenziati in modo da rendere più immediata e chiara la verifica e correzione della frase che si sta traducendo

Traduzione assistita dal computer Cosa è il database terminologico? È una raccolta di termini tradotti eventualmente arricchita di informazioni relative ai termini stessi

Traduzione assistita dal computer Come funziona un database terminologico? Viene creato dall’utente che vi inserisce i termini e le relative informazioni, e poi utilizzato in fase di traduzione.

Traduzione assistita dal computer Cosa è l’editor per la traduzione? È il software che guida l’utente attraverso la traduzione e gestisce il dialogo tra le finestre che contengono il testo di partenza, la traduzione, le proposte del database testuale e del database terminologico.

Traduzione assistita dal computer Come funziona l’editor per la traduzione? Deve riconoscere e proteggere i cosiddetti markers, perché, a traduzione ultimata, il programma provvede automaticamente a reimpostare nel testo tradotto il medesimo formato del testo di partenza (in colonne, tabelle, grafici, note a pié pagina, ecc.).

Traduzione assistita dal computer I sistemi di CAT si possono basare su 2 diversi approcci: 1) il programma fa un confronto automatico dell’intero testo da tradurre con i contenuti dei suoi database, PRIMA di iniziare la traduzione. Durante la traduzione, proporrà le frasi tradotte in base al materiale trovato.

Traduzione assistita dal computer I sistemi di CAT si possono basare su 2 diversi approcci: 2) Il sistema effettua la ricerca per ogni singola frase, nel momento in cui si passa dalla frase tradotta a quella successiva. Poi propone la traduzione in base ai dati contenuti nel database.

Traduzione assistita dal computer I sistemi di CAT possono: 2) Il sistema effettua la ricerca per ogni singola frase, nel momento in cui si passa dalla frase tradotta a quella successiva. Poi propone la traduzione in base ai dati contenuti nel database.