La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Computer e traduzione 10-15-16/3/2010 Informatica applicata alla comunicazione multimediale Cristina Bosco.

Presentazioni simili


Presentazione sul tema: "Computer e traduzione 10-15-16/3/2010 Informatica applicata alla comunicazione multimediale Cristina Bosco."— Transcript della presentazione:

1 Computer e traduzione /3/2010 Informatica applicata alla comunicazione multimediale Cristina Bosco

2 Overview Traduzione: Traduzione automatica Traduzione assistita dal computer

3 Traduzione Traduzione e mondo Traduzione e nuove tecnologie Traduzione e ipertesto

4 Traduzione Il processo di traduzione comporta la decodifica del significato del testo nel linguaggio sorgente la ricodifica di tale significato nel testo nel linguaggio destinazione

5 Traduzione Il processo di traduzione comporta quindi una serie di operazioni cognitive solo apparentemente semplici e molto difficili da affrontare in modo automatico

6 Traduzione Necessità crescente di traduzione: Aumento di comunicazioni Necessità di distruggere le barriere linguistiche (ad es. in regioni, stati e comunità multilingui) Variazione delle logiche di mercato (inglese come lingua franca o multilinguismo?)

7 Traduzione Ma la traduzione è progressivamente più integrata con la comunicazione quindi deve essere più veloce e di elevata qualità riguarda grandi moli di documenti e coinvolge gruppi di traduttori

8 Traduzione e nuove tecnologie Le nuove tecnologie arricchiscono il nostro orizzonte culturale di nuove modalità espressive ma incidono anche profondamente sul modo in cui utilizziamo le altre modalità espressive, interagiamo con l'ambiente e costruiamo la nostra conoscenza

9 tra le nuove modalità espressive l'ipertesto si pone come la più realistica simulazione dei processi cognitivi Traduzione e nuove tecnologie

10 Sono ipertestuali la lettura di un testo che contiene note e rimandi la consultazione di un dizionario mentre si legge un testo E IPERTESTUALE ogni lettura che esce dalla logica sequenziale del testo Traduzione e nuove tecnologie

11 ipertesti che contengano testi e loro traduzioni consentono rapidi confronti tra versioni e svolgono un ruolo importante nel farsi e rifarsi del processo traduttivo Traduzione e nuove tecnologie

12 Lipertesto è adatto quindi come supporto alla traduzione in quanto consente di realizzare in modo esplicito legami tra il testo e le sue traduzioni, i commenti, i rapporti con altri testi anche sviluppati da altre persone Traduzione e nuove tecnologie

13 Internet è uno strumento fondamentale perchè contiene un'enorme quantità di informazioni linguistiche e culturali: archivi di testi letterari, grandi corpora, dizionari Traduzione e nuove tecnologie

14 Overview Traduzione Traduzione automatica Traduzione assistita dal computer

15 Traduzione automatica Cosè la traduzione automatica Breve storia della traduzione automatica

16 Traduzione automatica Per traduzione automatica (Machine Translation, MT) si intende un processo di traduzione completamente eseguito da uno strumento software

17 Traduzione automatica Il software di traduzione automatica prende in input un testo T A in una lingua A restituisce in output il testo T B che nella lingua B ha lo stesso significato di T A il modo in cui si passa dallinput alloutput è indifferente

18 Traduzione automatica La traduzione automatica presenta molti vantaggi: omogeneità nello stile ed uso di vocaboli coerenza (la stessa frase è tradotta sempre nello stesso modo) ma soprattutto risparmio di tempo e denaro

19 Traduzione automatica La traduzione automatica è particolarmente adatta per determinati tipi di testo: guide di musei documenti dellUnione Europea manualistica tecnica

20 Traduzione automatica Tuttavia la traduzione automatica non ha utilità in certi casi, ad esempio quando: lo scopo è di comprendere il contenuto di un documento si vuole la presenza della componente umana stilistica

21 Traduzione automatica MA la traduzione completamente automatica non è attualmente realizzabile E non sappiamo se lo sarà mai!

22 Traduzione automatica La traduzione completamente automatica ricade infatti nei problemi, tipici del NLP, legati a: ambiguità del linguaggio incapacità delle macchine di immagazzinare ed utilizzare tutta la conoscenza situazionale/contestuale richiesta nella comprensione di un testo

23 Traduzione automatica La traduzione completamente automatica è dunque impossibile quando la comunicazione tra esseri umani avviene in ambienti (culturali e cognitivi) aperti, mutevoli, governati da regole variabili

24 Traduzione automatica La traduzione completamente automatica è oggi possibile in casi particolari e ristretti in cui la comunicazione è limitata ad ambienti chiusi, circoscritti. Ed esistono molti casi che possono essere ricondotti a questa situazione.

25 Traduzione automatica Il forte interesse teorico, ma soprattutto pratico per la traduzione completamente automatica è il motivo per cui esistono ancora progetti di MT, e soprattutto il motivo per cui sono esistiti molti progetti di MT

26 Traduzione automatica: breve storia Nel 17esimo secolo le idee di Leibniz e Cartesio hanno provocato discussioni su nozioni di linguaggio universale (precorrendo lesperanto) che faciliterebbe il commercio e linguaggi logici (precorrendo i linguaggi del computer)

27 Traduzione automatica: breve storia Nel 1933, Georges Artsouni ideò un cervello meccanico, un dispositivo per trattare (archiviare, consultare e stampare) informazioni, creato per scopi di crittografia, ma utilizzabile per la traduzione e basato sulla traduzione diretta parola per parola (senza nessuna analisi linguistica sottostante)

28 Traduzione automatica: breve storia Il prototipo del cervello meccanico viene presentato e premiato allesposizione Universale di Parigi del Le poste e lesercito francesi commissionano due macchine che non verranno mai realizzate a causa della guerra.

29 Traduzione automatica: breve storia Nel 1933, Petr Petrovic Trojanskij brevetta un modello più evoluto di macchina per la traduzione che prevede la trasformazione del testo in forma logica universale (esperanto) prima di passare alla lingua di destinazione e utilizza forme di analisi morfologica e sintattica

30 Traduzione automatica: breve storia Limportanza del lavoro di Artsouni e di Trojanskij sta nel fatto di aver proposto i due modelli che da allora in poi si utilizzeranno per la traduzione automatica: traduzione diretta, parola per parola traduzione indiretta, basata su interlingua o transfer

31 Traduzione automatica: breve storia

32 La MT basata sullinterlingua o transfer prevede la trasformazione del testo sorgente in una lingua astratta e la successiva generazione del testo destinazione a partire dallinterlingua. Richiede la presenza di informazioni morfologiche sintattiche e semantiche

33 Traduzione automatica: breve storia La MT diretta non prevede rappresentazioni intermedie e si basa sulla traduzione di ogni parola del linguaggio sorgente nella corrispondente parola nel linguaggio destinazione

34 Traduzione automatica: breve storia Ma ufficialmente la storia della MT nasce nel 1949, quando Warren Weaver, esperto di decrittazione di codici, produce il promemoria Translation

35 Traduzione automatica: breve storia Weaver, formula ipotesi sulla possibilità e i metodi della MT basati su: sostituzione parola per parola (da Artsouni + crittografia/crittoanalisi) presenza di universali linguistici (metafora delle torri) frequenza delle parole (da crittoanalisi)

36 Traduzione automatica: breve storia Le tecniche proposte da Weaver si rifanno sostanzialmente alla crittografia e alla crittoanalisi, tecniche molto antiche, già in uso ad esempio presso i romani durante il periodo di Cesare. (Una avvincente storia della crittografia: Simon Singh, Codici e segreti, Mondadori)

37 Traduzione automatica: breve storia Un esempio di crittografia: il codice di Cesare

38 Traduzione automatica: breve storia Gli studi di crittografia e crittoanalisi ebbero grande sviluppo nel 700 in Francia e poi durante la seconda guerra mondiale, consentendo la vittoria degli alleati e la sconfitta dei tedeschi (grazie al contributo di Alan Turing e del gruppo di Bletchley Park)

39 Traduzione automatica: breve storia Dopo lentusiasmo generato da Weaver e 10 anni ricchi di progetti di MT, la MT entra in una fase di stagnazione per lo scarso successo ottenuto dai progetti e per le critiche di vari studiosi, tra cui in particolare quella del filosofo Bar-Hillel (1959)

40 Traduzione automatica: breve storia Bar-Hillel sostiene che la MT è inattuabile perché non esistono i mezzi tecnici per realizzarla e soprattutto perché sicuramente non si può riprodurre in una macchina la conoscenza situazionale che è a fondamento di qualunque traduzione

41 Traduzione automatica: breve storia Bar-Hillel vede come irraggiungibile la FAHQT (fully automatic high quality translation) che rappresenta il traguardo più ambizioso per i sistemi di traduzione, ma non necessario in molti casi reali. Teorizza una traduzione di tipo transfer.

42 Traduzione automatica: breve storia Negli stessi anni (1954) lIBM attirava fondi e interesse pubblico pubblicizzando lesperimento di Georgetown: traduzione, dal russo allinglese, di 49 frasi accuratamente preparate utilizzando 6 regole grammaticali e 250 item lessicali

43 Traduzione automatica: breve storia Nel 1966 lALPAC (Automatic Language Processing Advisory Committee, composto da 6 scienziati statunitensi) diffonde il suo rapporto in cui si dichiara impraticabile la MT e si enfatizza la necessità di ricerca di base nella linguistica computazionale

44 Traduzione automatica: breve storia Riassumendo: precursori ( ), alcuni studiosi sviluppano macchine per la traduzione e si evidenziano i due modelli, traduzione diretta e traduzione tramite interlingua o transfer.

45 Traduzione automatica: breve storia Riassumendo: i due modelli: traduzione diretta traduzione indiretta, tramite interlingua o transfer

46 Traduzione automatica: breve storia

47 Riassumendo: traduzione diretta: basata essenzialmente su una traduzione parola per parole, con qualche aggiustamento a livello sintagmatico, di ordine dei costituenti e di locuzioni idiomatiche

48 Traduzione automatica: breve storia traduzione indiretta di tipo transfer: LS ->SYS-S -> SYS-D ->LD dal testo in LS si estrae SYS-S (rappresentazione strutturale conforme alla LS) SYS-S viene trasformata in SYS-D (rappresentazione strutturale conforme alla LD) ed impiegata per generare un testo in LD.

49 Traduzione automatica: breve storia traduzione indiretta di tipo interlingua: LS-> lingua universale -> LD da un testo in LS è tradotto in una forma linguistica non caratterizzata (universale) che viene tradotto in LS.

50 Traduzione automatica: breve storia Riassumendo: prima fase ( ), detta sperimentale, caratterizzata da ottimismo euforico: si supponeva che unapprofondita ricerca avrebbe permesso di creare macchine in grado di tradurre tutto e con altissima qualità.

51 Traduzione automatica: breve storia Riassumendo: seconda fase ( ), inizia lentusiasmo per lesperimento di Georgetown, continua con lo scetticismo di Bar-Hillel, e si conclude con il rapporto ALPAC secondo cui la FAHQT è impossibile e occorre sviluppare sistemi di supporto alla traduzione ed approfondire la linguistica computazionale

52 Traduzione automatica: breve storia Riassumendo: terza fase ( ), detta di linguistica computazionale, si sviluppano nuovi sistemi basati su informazione linguistica, si approfondiscono gli studi sul parsing e sul trattamento del linguaggio.

53 Traduzione automatica: breve storia Riassumendo: quarta fase (dal 1975), in cui la ricerca sulla MT si lega ai nuovi approcci di intelligenza artificiale con orientamento interdisciplinare (informatica, linguistica computazionale e traduttologia).

54 Overview Traduzione Traduzione automatica Traduzione assistita dal computer

55 Breve storia dei sistemi integrati Cosa sono i sistemi integrati

56 Traduzione assistita dal computer L'invito dellALPAC a sviluppare sistemi di supporto alla traduzione per molti anni non potè essere seguito a causa dei limiti dei calcolatori dellepoca. Ma negli anni '60 e '70 alcuni grandi uffici di traduzione iniziarono a creare banche dati

57 Traduzione assistita dal computer Essendo caricate in supercalcolatori, le banche dati potevano però essere utilizzate solo all'interno delle organizzazioni che le avevano sviluppate (Comunità Europee, governo canadese, Ufficio federale per le questioni linguistiche della Svizzera...)

58 Traduzione assistita dal computer Solo a metà degli anni '80, con la diffusione dei PC e successivamente con lavvento delle reti, vengono sviluppati e resi disponibili tools per la gestione di corpora terminologici (sistemi di gestione terminologica, sistemi di gestione di glossari, vocabolari digitali …)

59 Traduzione assistita dal computer All'inizio degli anni '90 nascono i cosiddetti sistemi integrati finalizzati alla raccolta e la riproposta di traduzioni già effettuate dall'utente, gestite in modo da poterle condividere con altri traduttori (anche in rete), per ridurre i tempi di traduzione e garantire una maggiore coerenza formale e contenutistica della traduzione

60 Traduzione assistita dal computer I sistemi integrati di traduzione assistita (CAT, Computer Assisted Translation) sono solitamente composti da Memoria di traduzione Database terminologico Editor di traduzione

61 Traduzione assistita dal computer Cosa è la memoria di traduzione (TM, tanslation memory)? É un database di frasi bilingue allineate, una raccolta di testi precedentemente tradotti, che viene automaticamente generata e consultata per verificare se (parte del)la frase è già stata tradotta.

62 Traduzione assistita dal computer Come funziona una TM? Se la frase è già stata tradotta, propone la traduzione (con il grado di concordanza tra la frase contenuta nella TM e quella nuova) che potrà essere eventualmente modificata.

63 Traduzione assistita dal computer Come funziona una TM? Se la frase NON è ancora stata tradotta, lutente dovrà digitare lintera frase nuova, che verrà a sua volta memorizzata nella TM.

64 Traduzione assistita dal computer Come funziona una TM? Nella traduzione proposta, i segmenti di frase modificati e quelli nuovi sono evidenziati in modo da rendere più immediata e chiara la verifica e correzione della frase che si sta traducendo

65 Traduzione assistita dal computer Cosa è il database terminologico? È una raccolta di termini tradotti eventualmente arricchita di informazioni relative ai termini stessi

66 Traduzione assistita dal computer Come funziona un database terminologico? Viene creato dallutente che vi inserisce i termini e le relative informazioni, e poi utilizzato in fase di traduzione.

67 Traduzione assistita dal computer Cosa è leditor per la traduzione? È il software che guida lutente attraverso la traduzione e gestisce il dialogo tra le finestre che contengono il testo di partenza, la traduzione, le proposte del database testuale e del database terminologico.

68 Traduzione assistita dal computer Come funziona leditor per la traduzione? Deve riconoscere e proteggere i cosiddetti markers, perché, a traduzione ultimata, il programma provvede automaticamente a reimpostare nel testo tradotto il medesimo formato del testo di partenza (in colonne, tabelle, grafici, note a pié pagina, ecc.).

69 Traduzione assistita dal computer I sistemi di CAT si possono basare su 2 diversi approcci: 1) il programma fa un confronto automatico dellintero testo da tradurre con i contenuti dei suoi database, PRIMA di iniziare la traduzione. Durante la traduzione, proporrà le frasi tradotte in base al materiale trovato.

70 Traduzione assistita dal computer I sistemi di CAT si possono basare su 2 diversi approcci: 2) Il sistema effettua la ricerca per ogni singola frase, nel momento in cui si passa dalla frase tradotta a quella successiva. Poi propone la traduzione in base ai dati contenuti nel database.

71 Traduzione assistita dal computer I sistemi di CAT possono: 2) Il sistema effettua la ricerca per ogni singola frase, nel momento in cui si passa dalla frase tradotta a quella successiva. Poi propone la traduzione in base ai dati contenuti nel database.


Scaricare ppt "Computer e traduzione 10-15-16/3/2010 Informatica applicata alla comunicazione multimediale Cristina Bosco."

Presentazioni simili


Annunci Google