La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Computer e traduzione /3/2010 Informatica applicata alla

Presentazioni simili


Presentazione sul tema: "Computer e traduzione /3/2010 Informatica applicata alla"— Transcript della presentazione:

1 Computer e traduzione 10-15-16/3/2010 Informatica applicata alla
comunicazione multimediale Cristina Bosco

2 Overview Traduzione: Traduzione automatica
Traduzione assistita dal computer

3 Traduzione Traduzione e mondo Traduzione e nuove tecnologie
Traduzione e ipertesto

4 Traduzione Il processo di traduzione comporta
la decodifica del significato del testo nel linguaggio sorgente la ricodifica di tale significato nel testo nel linguaggio destinazione

5 Traduzione Il processo di traduzione comporta quindi
una serie di operazioni cognitive solo apparentemente semplici e molto difficili da affrontare in modo automatico

6 Traduzione Necessità crescente di traduzione: Aumento di comunicazioni
Necessità di distruggere le barriere linguistiche (ad es. in regioni, stati e comunità multilingui) Variazione delle logiche di mercato (inglese come lingua franca o multilinguismo?)

7 Traduzione Ma la traduzione è
progressivamente più integrata con la comunicazione quindi deve essere più veloce e di elevata qualità riguarda grandi moli di documenti e coinvolge gruppi di traduttori

8 Traduzione e nuove tecnologie
Le nuove tecnologie arricchiscono il nostro orizzonte culturale di nuove modalità espressive ma incidono anche profondamente sul modo in cui utilizziamo le altre modalità espressive, interagiamo con l'ambiente e costruiamo la nostra conoscenza

9 Traduzione e nuove tecnologie
tra le nuove modalità espressive l'ipertesto si pone come la più realistica simulazione dei processi cognitivi

10 Traduzione e nuove tecnologie
Sono ipertestuali la lettura di un testo che contiene note e rimandi la consultazione di un dizionario mentre si legge un testo E’ IPERTESTUALE ogni lettura che esce dalla logica sequenziale del testo

11 Traduzione e nuove tecnologie
ipertesti che contengano testi e loro traduzioni consentono rapidi confronti tra versioni e svolgono un ruolo importante nel farsi e rifarsi del processo traduttivo

12 Traduzione e nuove tecnologie
L’ipertesto è adatto quindi come supporto alla traduzione in quanto consente di realizzare in modo esplicito legami tra il testo e le sue traduzioni, i commenti, i rapporti con altri testi anche sviluppati da altre persone

13 Traduzione e nuove tecnologie
Internet è uno strumento fondamentale perchè contiene un'enorme quantità di informazioni linguistiche e culturali: archivi di testi letterari, grandi corpora, dizionari

14 Overview Traduzione Traduzione automatica
Traduzione assistita dal computer

15 Traduzione automatica
Cos’è la traduzione automatica Breve storia della traduzione automatica

16 Traduzione automatica
Per traduzione automatica (Machine Translation, MT) si intende un processo di traduzione completamente eseguito da uno strumento software

17 Traduzione automatica
Il software di traduzione automatica prende in input un testo TA in una lingua A restituisce in output il testo TB che nella lingua B ha lo stesso significato di TA il modo in cui si passa dall’input all’output è indifferente

18 Traduzione automatica
La traduzione automatica presenta molti vantaggi: omogeneità nello stile ed uso di vocaboli coerenza (la stessa frase è tradotta sempre nello stesso modo) ma soprattutto risparmio di tempo e denaro

19 Traduzione automatica
La traduzione automatica è particolarmente adatta per determinati tipi di testo: guide di musei documenti dell’Unione Europea manualistica tecnica

20 Traduzione automatica
Tuttavia la traduzione automatica non ha utilità in certi casi, ad esempio quando: lo scopo è di comprendere il contenuto di un documento si vuole la presenza della componente umana stilistica

21 Traduzione automatica
MA la traduzione completamente automatica non è attualmente realizzabile E non sappiamo se lo sarà mai!

22 Traduzione automatica
La traduzione completamente automatica ricade infatti nei problemi, tipici del NLP, legati a: ambiguità del linguaggio incapacità delle macchine di immagazzinare ed utilizzare tutta la conoscenza situazionale/contestuale richiesta nella comprensione di un testo

23 Traduzione automatica
La traduzione completamente automatica è dunque impossibile quando la comunicazione tra esseri umani avviene in “ambienti” (culturali e cognitivi) aperti, mutevoli, governati da regole variabili

24 Traduzione automatica
La traduzione completamente automatica è oggi possibile in casi particolari e ristretti in cui la comunicazione è limitata ad ambienti chiusi, circoscritti. Ed esistono molti casi che possono essere ricondotti a questa situazione.

25 Traduzione automatica
Il forte interesse teorico, ma soprattutto pratico per la traduzione completamente automatica è il motivo per cui esistono ancora progetti di MT, e soprattutto il motivo per cui sono esistiti molti progetti di MT

26 Traduzione automatica: breve storia
Nel 17esimo secolo le idee di Leibniz e Cartesio hanno provocato discussioni su nozioni di linguaggio universale (precorrendo l’esperanto) che faciliterebbe il commercio e linguaggi logici (precorrendo i linguaggi del computer)

27 Traduzione automatica: breve storia
Nel 1933, Georges Artsouni ideò un “cervello meccanico”, un dispositivo per trattare (archiviare, consultare e stampare) informazioni, creato per scopi di crittografia, ma utilizzabile per la traduzione e basato sulla traduzione diretta parola per parola (senza nessuna analisi linguistica sottostante)

28 Traduzione automatica: breve storia
Il prototipo del “cervello meccanico” viene presentato e premiato all’esposizione Universale di Parigi del 1937. Le poste e l’esercito francesi commissionano due macchine che non verranno mai realizzate a causa della guerra.

29 Traduzione automatica: breve storia
Nel 1933, Petr Petrovic Trojanskij brevetta un modello più evoluto di macchina per la traduzione che prevede la trasformazione del testo in forma logica universale (esperanto) prima di passare alla lingua di destinazione e utilizza forme di analisi morfologica e sintattica

30 Traduzione automatica: breve storia
L’importanza del lavoro di Artsouni e di Trojanskij sta nel fatto di aver proposto i due modelli che da allora in poi si utilizzeranno per la traduzione automatica: traduzione diretta, parola per parola traduzione indiretta, basata su interlingua o transfer

31 Traduzione automatica: breve storia

32 Traduzione automatica: breve storia
La MT basata sull’interlingua o transfer prevede la trasformazione del testo sorgente in una lingua astratta e la successiva generazione del testo destinazione a partire dall’interlingua. Richiede la presenza di informazioni morfologiche sintattiche e semantiche

33 Traduzione automatica: breve storia
La MT diretta non prevede rappresentazioni intermedie e si basa sulla traduzione di ogni parola del linguaggio sorgente nella corrispondente parola nel linguaggio destinazione

34 Traduzione automatica: breve storia
Ma ufficialmente la storia della MT nasce nel 1949, quando Warren Weaver, esperto di decrittazione di codici, produce il promemoria “Translation”

35 Traduzione automatica: breve storia
Weaver, formula ipotesi sulla possibilità e i metodi della MT basati su: sostituzione parola per parola (da Artsouni + crittografia/crittoanalisi) presenza di universali linguistici (metafora delle torri) frequenza delle parole (da crittoanalisi)

36 Traduzione automatica: breve storia
Le tecniche proposte da Weaver si rifanno sostanzialmente alla crittografia e alla crittoanalisi, tecniche molto antiche, già in uso ad esempio presso i romani durante il periodo di Cesare. (Una avvincente storia della crittografia: Simon Singh, Codici e segreti, Mondadori)

37 Traduzione automatica: breve storia
Un esempio di crittografia: il codice di Cesare

38 Traduzione automatica: breve storia
Gli studi di crittografia e crittoanalisi ebbero grande sviluppo nel 700 in Francia e poi durante la seconda guerra mondiale, consentendo la vittoria degli alleati e la sconfitta dei tedeschi (grazie al contributo di Alan Turing e del gruppo di Bletchley Park)

39 Traduzione automatica: breve storia
Dopo l’entusiasmo generato da Weaver e 10 anni ricchi di progetti di MT, la MT entra in una fase di stagnazione per lo scarso successo ottenuto dai progetti e per le critiche di vari studiosi, tra cui in particolare quella del filosofo Bar-Hillel (1959)

40 Traduzione automatica: breve storia
Bar-Hillel sostiene che la MT è inattuabile perché non esistono i mezzi tecnici per realizzarla e soprattutto perché sicuramente non si può riprodurre in una macchina la conoscenza situazionale che è a fondamento di qualunque traduzione

41 Traduzione automatica: breve storia
Bar-Hillel vede come irraggiungibile la FAHQT (fully automatic high quality translation) che rappresenta il traguardo più ambizioso per i sistemi di traduzione, ma non necessario in molti casi reali. Teorizza una traduzione di tipo transfer.

42 Traduzione automatica: breve storia
Negli stessi anni (1954) l’IBM attirava fondi e interesse pubblico pubblicizzando l’esperimento di Georgetown: traduzione, dal russo all’inglese, di 49 frasi accuratamente preparate utilizzando 6 regole grammaticali e 250 item lessicali

43 Traduzione automatica: breve storia
Nel 1966 l’ALPAC (Automatic Language Processing Advisory Committee, composto da 6 scienziati statunitensi) diffonde il suo rapporto in cui si dichiara impraticabile la MT e si enfatizza la necessità di ricerca di base nella linguistica computazionale

44 Traduzione automatica: breve storia
Riassumendo: precursori ( ), alcuni studiosi sviluppano macchine per la traduzione e si evidenziano i due modelli, traduzione diretta e traduzione tramite interlingua o transfer.

45 Traduzione automatica: breve storia
Riassumendo: i due modelli: traduzione diretta traduzione indiretta, tramite interlingua o transfer

46 Traduzione automatica: breve storia

47 Traduzione automatica: breve storia
Riassumendo: traduzione diretta: basata essenzialmente su una traduzione parola per parole, con qualche aggiustamento a livello sintagmatico, di ordine dei costituenti e di locuzioni idiomatiche

48 Traduzione automatica: breve storia
traduzione indiretta di tipo transfer: LS ->SYS-S -> SYS-D ->LD dal testo in LS si estrae SYS-S (rappresentazione strutturale conforme alla LS) SYS-S viene trasformata in SYS-D (rappresentazione strutturale conforme alla LD) ed impiegata per generare un testo in LD.

49 Traduzione automatica: breve storia
traduzione indiretta di tipo interlingua: LS-> lingua universale -> LD da un testo in LS è tradotto in una forma linguistica non caratterizzata (universale) che viene tradotto in LS.

50 Traduzione automatica: breve storia
Riassumendo: prima fase ( ), detta sperimentale, caratterizzata da ottimismo euforico: si supponeva che un’approfondita ricerca avrebbe permesso di creare macchine in grado di tradurre tutto e con altissima qualità.

51 Traduzione automatica: breve storia
Riassumendo: seconda fase ( ), inizia l’entusiasmo per l’esperimento di Georgetown, continua con lo scetticismo di Bar-Hillel, e si conclude con il rapporto ALPAC secondo cui la FAHQT è impossibile e occorre sviluppare sistemi di supporto alla traduzione ed approfondire la linguistica computazionale

52 Traduzione automatica: breve storia
Riassumendo: terza fase ( ), detta di linguistica computazionale, si sviluppano nuovi sistemi basati su informazione linguistica, si approfondiscono gli studi sul parsing e sul trattamento del linguaggio.

53 Traduzione automatica: breve storia
Riassumendo: quarta fase (dal 1975), in cui la ricerca sulla MT si lega ai nuovi approcci di intelligenza artificiale con orientamento interdisciplinare (informatica, linguistica computazionale e traduttologia).

54 Overview Traduzione Traduzione automatica
Traduzione assistita dal computer

55 Traduzione assistita dal computer
Breve storia dei sistemi integrati Cosa sono i sistemi integrati

56 Traduzione assistita dal computer
L'invito dell’ALPAC a sviluppare sistemi di supporto alla traduzione per molti anni non potè essere seguito a causa dei limiti dei calcolatori dell’epoca. Ma negli anni '60 e '70 alcuni grandi uffici di traduzione iniziarono a creare banche dati

57 Traduzione assistita dal computer
Essendo caricate in supercalcolatori, le banche dati potevano però essere utilizzate solo all'interno delle organizzazioni che le avevano sviluppate (Comunità Europee, governo canadese, Ufficio federale per le questioni linguistiche della Svizzera ...)

58 Traduzione assistita dal computer
Solo a metà degli anni '80, con la diffusione dei PC e successivamente con l’avvento delle reti, vengono sviluppati e resi disponibili tools per la gestione di corpora terminologici (sistemi di gestione terminologica, sistemi di gestione di glossari, vocabolari digitali …)

59 Traduzione assistita dal computer
All'inizio degli anni '90 nascono i cosiddetti sistemi integrati finalizzati alla raccolta e la riproposta di traduzioni già effettuate dall'utente, gestite in modo da poterle condividere con altri traduttori (anche in rete), per ridurre i tempi di traduzione e garantire una maggiore coerenza formale e contenutistica della traduzione

60 Traduzione assistita dal computer
I sistemi integrati di traduzione assistita (CAT, Computer Assisted Translation) sono solitamente composti da Memoria di traduzione Database terminologico Editor di traduzione

61 Traduzione assistita dal computer
Cosa è la memoria di traduzione (TM, tanslation memory)? É un database di frasi bilingue allineate, una raccolta di testi precedentemente tradotti, che viene automaticamente generata e consultata per verificare se (parte del)la frase è già stata tradotta.

62 Traduzione assistita dal computer
Come funziona una TM? Se la frase è già stata tradotta, propone la traduzione (con il grado di concordanza tra la frase contenuta nella TM e quella nuova) che potrà essere eventualmente modificata.

63 Traduzione assistita dal computer
Come funziona una TM? Se la frase NON è ancora stata tradotta, l’utente dovrà digitare l’intera frase nuova, che verrà a sua volta memorizzata nella TM.

64 Traduzione assistita dal computer
Come funziona una TM? Nella traduzione proposta, i segmenti di frase modificati e quelli nuovi sono evidenziati in modo da rendere più immediata e chiara la verifica e correzione della frase che si sta traducendo

65 Traduzione assistita dal computer
Cosa è il database terminologico? È una raccolta di termini tradotti eventualmente arricchita di informazioni relative ai termini stessi

66 Traduzione assistita dal computer
Come funziona un database terminologico? Viene creato dall’utente che vi inserisce i termini e le relative informazioni, e poi utilizzato in fase di traduzione.

67 Traduzione assistita dal computer
Cosa è l’editor per la traduzione? È il software che guida l’utente attraverso la traduzione e gestisce il dialogo tra le finestre che contengono il testo di partenza, la traduzione, le proposte del database testuale e del database terminologico.

68 Traduzione assistita dal computer
Come funziona l’editor per la traduzione? Deve riconoscere e proteggere i cosiddetti markers, perché, a traduzione ultimata, il programma provvede automaticamente a reimpostare nel testo tradotto il medesimo formato del testo di partenza (in colonne, tabelle, grafici, note a pié pagina, ecc.).

69 Traduzione assistita dal computer
I sistemi di CAT si possono basare su 2 diversi approcci: 1) il programma fa un confronto automatico dell’intero testo da tradurre con i contenuti dei suoi database, PRIMA di iniziare la traduzione. Durante la traduzione, proporrà le frasi tradotte in base al materiale trovato.

70 Traduzione assistita dal computer
I sistemi di CAT si possono basare su 2 diversi approcci: 2) Il sistema effettua la ricerca per ogni singola frase, nel momento in cui si passa dalla frase tradotta a quella successiva. Poi propone la traduzione in base ai dati contenuti nel database.

71 Traduzione assistita dal computer
I sistemi di CAT possono: 2) Il sistema effettua la ricerca per ogni singola frase, nel momento in cui si passa dalla frase tradotta a quella successiva. Poi propone la traduzione in base ai dati contenuti nel database.


Scaricare ppt "Computer e traduzione /3/2010 Informatica applicata alla"

Presentazioni simili


Annunci Google