Computer e traduzione 10-15-16/3/2010 Informatica applicata alla comunicazione multimediale Cristina Bosco
Overview Traduzione: Traduzione automatica Traduzione assistita dal computer
Traduzione Traduzione e mondo Traduzione e nuove tecnologie Traduzione e ipertesto
Traduzione Il processo di traduzione comporta la decodifica del significato del testo nel linguaggio sorgente la ricodifica di tale significato nel testo nel linguaggio destinazione
Traduzione Il processo di traduzione comporta quindi una serie di operazioni cognitive solo apparentemente semplici e molto difficili da affrontare in modo automatico
Traduzione Necessità crescente di traduzione: Aumento di comunicazioni Necessità di distruggere le barriere linguistiche (ad es. in regioni, stati e comunità multilingui) Variazione delle logiche di mercato (inglese come lingua franca o multilinguismo?)
Traduzione Ma la traduzione è progressivamente più integrata con la comunicazione quindi deve essere più veloce e di elevata qualità riguarda grandi moli di documenti e coinvolge gruppi di traduttori
Traduzione e nuove tecnologie Le nuove tecnologie arricchiscono il nostro orizzonte culturale di nuove modalità espressive ma incidono anche profondamente sul modo in cui utilizziamo le altre modalità espressive, interagiamo con l'ambiente e costruiamo la nostra conoscenza
Traduzione e nuove tecnologie tra le nuove modalità espressive l'ipertesto si pone come la più realistica simulazione dei processi cognitivi
Traduzione e nuove tecnologie Sono ipertestuali la lettura di un testo che contiene note e rimandi la consultazione di un dizionario mentre si legge un testo E’ IPERTESTUALE ogni lettura che esce dalla logica sequenziale del testo
Traduzione e nuove tecnologie ipertesti che contengano testi e loro traduzioni consentono rapidi confronti tra versioni e svolgono un ruolo importante nel farsi e rifarsi del processo traduttivo
Traduzione e nuove tecnologie L’ipertesto è adatto quindi come supporto alla traduzione in quanto consente di realizzare in modo esplicito legami tra il testo e le sue traduzioni, i commenti, i rapporti con altri testi anche sviluppati da altre persone
Traduzione e nuove tecnologie Internet è uno strumento fondamentale perchè contiene un'enorme quantità di informazioni linguistiche e culturali: archivi di testi letterari, grandi corpora, dizionari
Overview Traduzione Traduzione automatica Traduzione assistita dal computer
Traduzione automatica Cos’è la traduzione automatica Breve storia della traduzione automatica
Traduzione automatica Per traduzione automatica (Machine Translation, MT) si intende un processo di traduzione completamente eseguito da uno strumento software
Traduzione automatica Il software di traduzione automatica prende in input un testo TA in una lingua A restituisce in output il testo TB che nella lingua B ha lo stesso significato di TA il modo in cui si passa dall’input all’output è indifferente
Traduzione automatica La traduzione automatica presenta molti vantaggi: omogeneità nello stile ed uso di vocaboli coerenza (la stessa frase è tradotta sempre nello stesso modo) ma soprattutto risparmio di tempo e denaro
Traduzione automatica La traduzione automatica è particolarmente adatta per determinati tipi di testo: guide di musei documenti dell’Unione Europea manualistica tecnica
Traduzione automatica Tuttavia la traduzione automatica non ha utilità in certi casi, ad esempio quando: lo scopo è di comprendere il contenuto di un documento si vuole la presenza della componente umana stilistica
Traduzione automatica MA la traduzione completamente automatica non è attualmente realizzabile E non sappiamo se lo sarà mai!
Traduzione automatica La traduzione completamente automatica ricade infatti nei problemi, tipici del NLP, legati a: ambiguità del linguaggio incapacità delle macchine di immagazzinare ed utilizzare tutta la conoscenza situazionale/contestuale richiesta nella comprensione di un testo
Traduzione automatica La traduzione completamente automatica è dunque impossibile quando la comunicazione tra esseri umani avviene in “ambienti” (culturali e cognitivi) aperti, mutevoli, governati da regole variabili
Traduzione automatica La traduzione completamente automatica è oggi possibile in casi particolari e ristretti in cui la comunicazione è limitata ad ambienti chiusi, circoscritti. Ed esistono molti casi che possono essere ricondotti a questa situazione.
Traduzione automatica Il forte interesse teorico, ma soprattutto pratico per la traduzione completamente automatica è il motivo per cui esistono ancora progetti di MT, e soprattutto il motivo per cui sono esistiti molti progetti di MT
Traduzione automatica: breve storia Nel 17esimo secolo le idee di Leibniz e Cartesio hanno provocato discussioni su nozioni di linguaggio universale (precorrendo l’esperanto) che faciliterebbe il commercio e linguaggi logici (precorrendo i linguaggi del computer)
Traduzione automatica: breve storia Nel 1933, Georges Artsouni ideò un “cervello meccanico”, un dispositivo per trattare (archiviare, consultare e stampare) informazioni, creato per scopi di crittografia, ma utilizzabile per la traduzione e basato sulla traduzione diretta parola per parola (senza nessuna analisi linguistica sottostante)
Traduzione automatica: breve storia Il prototipo del “cervello meccanico” viene presentato e premiato all’esposizione Universale di Parigi del 1937. Le poste e l’esercito francesi commissionano due macchine che non verranno mai realizzate a causa della guerra.
Traduzione automatica: breve storia Nel 1933, Petr Petrovic Trojanskij brevetta un modello più evoluto di macchina per la traduzione che prevede la trasformazione del testo in forma logica universale (esperanto) prima di passare alla lingua di destinazione e utilizza forme di analisi morfologica e sintattica
Traduzione automatica: breve storia L’importanza del lavoro di Artsouni e di Trojanskij sta nel fatto di aver proposto i due modelli che da allora in poi si utilizzeranno per la traduzione automatica: traduzione diretta, parola per parola traduzione indiretta, basata su interlingua o transfer
Traduzione automatica: breve storia
Traduzione automatica: breve storia La MT basata sull’interlingua o transfer prevede la trasformazione del testo sorgente in una lingua astratta e la successiva generazione del testo destinazione a partire dall’interlingua. Richiede la presenza di informazioni morfologiche sintattiche e semantiche
Traduzione automatica: breve storia La MT diretta non prevede rappresentazioni intermedie e si basa sulla traduzione di ogni parola del linguaggio sorgente nella corrispondente parola nel linguaggio destinazione
Traduzione automatica: breve storia Ma ufficialmente la storia della MT nasce nel 1949, quando Warren Weaver, esperto di decrittazione di codici, produce il promemoria “Translation”
Traduzione automatica: breve storia Weaver, formula ipotesi sulla possibilità e i metodi della MT basati su: sostituzione parola per parola (da Artsouni + crittografia/crittoanalisi) presenza di universali linguistici (metafora delle torri) frequenza delle parole (da crittoanalisi)
Traduzione automatica: breve storia Le tecniche proposte da Weaver si rifanno sostanzialmente alla crittografia e alla crittoanalisi, tecniche molto antiche, già in uso ad esempio presso i romani durante il periodo di Cesare. (Una avvincente storia della crittografia: Simon Singh, Codici e segreti, Mondadori)
Traduzione automatica: breve storia Un esempio di crittografia: il codice di Cesare
Traduzione automatica: breve storia Gli studi di crittografia e crittoanalisi ebbero grande sviluppo nel 700 in Francia e poi durante la seconda guerra mondiale, consentendo la vittoria degli alleati e la sconfitta dei tedeschi (grazie al contributo di Alan Turing e del gruppo di Bletchley Park)
Traduzione automatica: breve storia Dopo l’entusiasmo generato da Weaver e 10 anni ricchi di progetti di MT, la MT entra in una fase di stagnazione per lo scarso successo ottenuto dai progetti e per le critiche di vari studiosi, tra cui in particolare quella del filosofo Bar-Hillel (1959)
Traduzione automatica: breve storia Bar-Hillel sostiene che la MT è inattuabile perché non esistono i mezzi tecnici per realizzarla e soprattutto perché sicuramente non si può riprodurre in una macchina la conoscenza situazionale che è a fondamento di qualunque traduzione
Traduzione automatica: breve storia Bar-Hillel vede come irraggiungibile la FAHQT (fully automatic high quality translation) che rappresenta il traguardo più ambizioso per i sistemi di traduzione, ma non necessario in molti casi reali. Teorizza una traduzione di tipo transfer.
Traduzione automatica: breve storia Negli stessi anni (1954) l’IBM attirava fondi e interesse pubblico pubblicizzando l’esperimento di Georgetown: traduzione, dal russo all’inglese, di 49 frasi accuratamente preparate utilizzando 6 regole grammaticali e 250 item lessicali
Traduzione automatica: breve storia Nel 1966 l’ALPAC (Automatic Language Processing Advisory Committee, composto da 6 scienziati statunitensi) diffonde il suo rapporto in cui si dichiara impraticabile la MT e si enfatizza la necessità di ricerca di base nella linguistica computazionale
Traduzione automatica: breve storia Riassumendo: precursori (1933-1949), alcuni studiosi sviluppano macchine per la traduzione e si evidenziano i due modelli, traduzione diretta e traduzione tramite interlingua o transfer.
Traduzione automatica: breve storia Riassumendo: i due modelli: traduzione diretta traduzione indiretta, tramite interlingua o transfer
Traduzione automatica: breve storia
Traduzione automatica: breve storia Riassumendo: traduzione diretta: basata essenzialmente su una traduzione parola per parole, con qualche aggiustamento a livello sintagmatico, di ordine dei costituenti e di locuzioni idiomatiche
Traduzione automatica: breve storia traduzione indiretta di tipo transfer: LS ->SYS-S -> SYS-D ->LD dal testo in LS si estrae SYS-S (rappresentazione strutturale conforme alla LS) SYS-S viene trasformata in SYS-D (rappresentazione strutturale conforme alla LD) ed impiegata per generare un testo in LD.
Traduzione automatica: breve storia traduzione indiretta di tipo interlingua: LS-> lingua universale -> LD da un testo in LS è tradotto in una forma linguistica non caratterizzata (universale) che viene tradotto in LS.
Traduzione automatica: breve storia Riassumendo: prima fase (1946-1954), detta sperimentale, caratterizzata da ottimismo euforico: si supponeva che un’approfondita ricerca avrebbe permesso di creare macchine in grado di tradurre tutto e con altissima qualità.
Traduzione automatica: breve storia Riassumendo: seconda fase (1954-1966), inizia l’entusiasmo per l’esperimento di Georgetown, continua con lo scetticismo di Bar-Hillel, e si conclude con il rapporto ALPAC secondo cui la FAHQT è impossibile e occorre sviluppare sistemi di supporto alla traduzione ed approfondire la linguistica computazionale
Traduzione automatica: breve storia Riassumendo: terza fase (1966-1975), detta di linguistica computazionale, si sviluppano nuovi sistemi basati su informazione linguistica, si approfondiscono gli studi sul parsing e sul trattamento del linguaggio.
Traduzione automatica: breve storia Riassumendo: quarta fase (dal 1975), in cui la ricerca sulla MT si lega ai nuovi approcci di intelligenza artificiale con orientamento interdisciplinare (informatica, linguistica computazionale e traduttologia).
Overview Traduzione Traduzione automatica Traduzione assistita dal computer
Traduzione assistita dal computer Breve storia dei sistemi integrati Cosa sono i sistemi integrati
Traduzione assistita dal computer L'invito dell’ALPAC a sviluppare sistemi di supporto alla traduzione per molti anni non potè essere seguito a causa dei limiti dei calcolatori dell’epoca. Ma negli anni '60 e '70 alcuni grandi uffici di traduzione iniziarono a creare banche dati
Traduzione assistita dal computer Essendo caricate in supercalcolatori, le banche dati potevano però essere utilizzate solo all'interno delle organizzazioni che le avevano sviluppate (Comunità Europee, governo canadese, Ufficio federale per le questioni linguistiche della Svizzera ...)
Traduzione assistita dal computer Solo a metà degli anni '80, con la diffusione dei PC e successivamente con l’avvento delle reti, vengono sviluppati e resi disponibili tools per la gestione di corpora terminologici (sistemi di gestione terminologica, sistemi di gestione di glossari, vocabolari digitali …)
Traduzione assistita dal computer All'inizio degli anni '90 nascono i cosiddetti sistemi integrati finalizzati alla raccolta e la riproposta di traduzioni già effettuate dall'utente, gestite in modo da poterle condividere con altri traduttori (anche in rete), per ridurre i tempi di traduzione e garantire una maggiore coerenza formale e contenutistica della traduzione
Traduzione assistita dal computer I sistemi integrati di traduzione assistita (CAT, Computer Assisted Translation) sono solitamente composti da Memoria di traduzione Database terminologico Editor di traduzione
Traduzione assistita dal computer Cosa è la memoria di traduzione (TM, tanslation memory)? É un database di frasi bilingue allineate, una raccolta di testi precedentemente tradotti, che viene automaticamente generata e consultata per verificare se (parte del)la frase è già stata tradotta.
Traduzione assistita dal computer Come funziona una TM? Se la frase è già stata tradotta, propone la traduzione (con il grado di concordanza tra la frase contenuta nella TM e quella nuova) che potrà essere eventualmente modificata.
Traduzione assistita dal computer Come funziona una TM? Se la frase NON è ancora stata tradotta, l’utente dovrà digitare l’intera frase nuova, che verrà a sua volta memorizzata nella TM.
Traduzione assistita dal computer Come funziona una TM? Nella traduzione proposta, i segmenti di frase modificati e quelli nuovi sono evidenziati in modo da rendere più immediata e chiara la verifica e correzione della frase che si sta traducendo
Traduzione assistita dal computer Cosa è il database terminologico? È una raccolta di termini tradotti eventualmente arricchita di informazioni relative ai termini stessi
Traduzione assistita dal computer Come funziona un database terminologico? Viene creato dall’utente che vi inserisce i termini e le relative informazioni, e poi utilizzato in fase di traduzione.
Traduzione assistita dal computer Cosa è l’editor per la traduzione? È il software che guida l’utente attraverso la traduzione e gestisce il dialogo tra le finestre che contengono il testo di partenza, la traduzione, le proposte del database testuale e del database terminologico.
Traduzione assistita dal computer Come funziona l’editor per la traduzione? Deve riconoscere e proteggere i cosiddetti markers, perché, a traduzione ultimata, il programma provvede automaticamente a reimpostare nel testo tradotto il medesimo formato del testo di partenza (in colonne, tabelle, grafici, note a pié pagina, ecc.).
Traduzione assistita dal computer I sistemi di CAT si possono basare su 2 diversi approcci: 1) il programma fa un confronto automatico dell’intero testo da tradurre con i contenuti dei suoi database, PRIMA di iniziare la traduzione. Durante la traduzione, proporrà le frasi tradotte in base al materiale trovato.
Traduzione assistita dal computer I sistemi di CAT si possono basare su 2 diversi approcci: 2) Il sistema effettua la ricerca per ogni singola frase, nel momento in cui si passa dalla frase tradotta a quella successiva. Poi propone la traduzione in base ai dati contenuti nel database.
Traduzione assistita dal computer I sistemi di CAT possono: 2) Il sistema effettua la ricerca per ogni singola frase, nel momento in cui si passa dalla frase tradotta a quella successiva. Poi propone la traduzione in base ai dati contenuti nel database.