Informatica applicata alla comunicazione multimediale

Slides:



Advertisements
Presentazioni simili
Traduzione e computer (3) Cristina Bosco Informatica applicata alla comunicazione multimediale 2013.
Advertisements

Traduzione e computer (4) Cristina Bosco Informatica applicata alla comunicazione multimediale
Prof.ssa Laura Grella ITI “G.Galilei”- Salerno 1 L’articolo di giornale Tipologie di testi Per scrivere un articolo pag. 2 La collocazionepag. 3 Il destinatariopag.
OBIETTIVI di REVISIONE Bettina Campedelli - Revisione aziendale e sistemi di controllo 1 per poter esprimere il giudizio di revisione il revisore scompone.
Fondamenti di Informatica - D. Talia - UNICAL 1 Fondamenti di Informatica FONDAMENTI DI INFORMATICA Domenico Talia
1 Variabili. 2 Tipi di variabili Una variabile è qualche proprietà di un evento che è stata misurata. Le variabili sono attributi dei fenomeni e pertanto.
Elaborazione delle Immagini Operatori Puntuali Luigi Cinque
Il Parallel Turin University Treebank
LA CLASSIFICAZIONE DIMENSIONI DEL CONCETTO DI CLASSIFICAZIONE (Marradi, ) classificazione a: operazione intellettuale con cui l’estensione di.
Tratto da: Anna Labella (a cura), E questo tutti chiamano Informatica, Manuali Scienze e Tecnologie – Formazione, La Sapienza Roma.
Rappresentazione dell’ Informazione Informazione e Comunicazione
rielaborato da Atzeni-etal., Basi di dati, Capitolo 4
Revisione Aziendale Corso avanzato
L’operazionalizzazione
Dott. Fabio Massimo Zanzotto a.a
Tre diversi materiali:
ISTITUTO STATALE LICEALE “S.PIZZI”. «DIMMI E IO DIMENTICO; MOSTRAMI E IO RICORDO; COINVOLGIMI E IO IMPARO.» (BENJAMIN FRANKLIN)
LA MEDIAZIONE.
Dal problema al processo risolutivo
Laboratorio di produzione editoriale
IL SISTEMA DI VALUTAZIONE DELLA PERFORMANCE della PROVINCIA DI PAVIA
La valutazione del programma di MR
Algoritmi e soluzioni di problemi
Universal Dependencies e treebank
Dal problema al processo risolutivo
Studente/i Relatore Correlatore Committente Aris Piatti
By Jacob Nielsen, novembre 2016
Lo strumento dell’intervista qualitativa
INDICAZIONI PRELIMINARI ALLA STESURA DI
Le postcondizioni specificano l’output della funzione.
Linguistica e treebank
Computer assisted translation e terminologia
Metodi della progettazione industriale
Tipo di dato: array Un array è un tipo di dato usato per memorizzare una collezione di variabili dello stesso tipo. Per memorizzare una collezione di 7.
LABORATORIO PROGETTUALE
Utilizzo del lavoro di altri Revisori
Come si scrive un poster scientifico
Gestione Informatica dei Dati Aziendali Sistemi Informativi Gestionali
IL TESTO ESPOSITIVO - INFORMATIVO
Istituto Comprensivo Statale di Motta S.Giovanni (RC)
Che cos’e’ l’Informatica
Psicologia dell’apprendimento
IL CONCETTO DI ALGORITMO
Informatica - Prof. Gregorio Cosentino
Programmare.
La vita e Il vento Quanto il vento é stato ed è utile all’uomo
Confronto tra rappresentazioni di percorsi nella griglia 10×10
Il problem solving La normativa Le Caratteristiche I processi
Introduzione a PowerPoint 2007
© 2007 SEI-Società Editrice Internazionale, Apogeo
Sistemi informativi statistici
Definizione di linguaggio di programmazione
VUOI SAPERE COME FARE UN RIASSUNTO?
Corso di Laurea Ingegneria Informatica Fondamenti di Informatica
WORD 28/02/2019 Informatica - WORD.
Gli archivi e le basi di dati
Teoria della computabilità
Parti interne del computer
Strategie di progetto Si possono utilizzare le strategie tipiche dello sviluppo di un processo di ingegnerizzazione (es. ingegneria del software). Strategie.
Dalle prove INVALSI alla didattica
Attività Laboratoriale
N O E MODELLO GITA S Come progettare una gita in base alla destinazione da condividere con altri studenti. Un modello con cui gli studenti possono.
Modulo 6 Colombo Claudio  EU Web Agency Academy 
La metodologia del nostro curricolo di italiano: principi generali
Cella A. - Hila S. - Motta L. - Lunardelli C. - Panontin C
Come cercare le fonti di informazione scientifica RISORSE
Gli Indici di Produttività di Divisia
GRIGLIE PER LA VALUTAZIONE DELL’ORALE-CLIL
LA CLASSIFICAZIONE DIMENSIONI DEL CONCETTO DI CLASSIFICAZIONE (Marradi, ) classificazione a: operazione intellettuale con cui l’estensione di.
Piano di gestione del rischio informatico: utility di supporto
Transcript della presentazione:

Informatica applicata alla comunicazione multimediale Traduzione e computer Cristina Bosco Informatica applicata alla comunicazione multimediale 2016-2017

Problemi nel valutare la MT Prima di affrontare il problema della valutazione della MT occorre chiarire che la valutazione della stessa traduzione in generale è un problema complesso, non risolto e su cui ci sono molte proposte e modelli in parte in contrasto tra loro.

Problemi nel valutare la traduzione Manca chiarezza in generale su come si deve valutare una traduzione perché: è un problema estremamente complesso la valutazione della traduzione implica una intrinseca ed ineliminabile componente soggettiva si parla di metodologia della valutazione della traduzione solo a partire dal 1959 (convegno della Federazione Internazionale Traduttori)

Problemi nel valutare la traduzione Si propongono modelli diversi di valutazione della traduzione, che fanno riferimento a teorie diverse della traduzione. In particolare per alcuni modelli la traduzione deve essere vista come un testo a se’ stante, per altri invece come un’entità dipendente dal testo originale. Una varietà di parametri vengono proposti per confrontare frasi e interi testi.

Problemi nel valutare traduzione I modelli concordano tuttavia su alcuni principi fondamentali generali: la valutazione deve cercare di misurare il grado di adeguatezza della traduzione rispetto al dato semantico, sintattico e pragmatico del testo sorgente al quadro culturale del testo sorgente alle possibilità espressive del testo sorgente tenendo conto dello scopo comunicativo.

Problemi nel valutare la traduzione L’interesse “teorico” dei modelli di valutazione è spesso inversamente proporzionale alla loro semplicità di applicazione. Da una parte vi è la ricerca di esaustività del mondo accademico, dall’altra gli imperativi di ordine economico di chi si trova a gestire il controllo di qualità in ambito professionale (traduzione giusta al momento giusto, nel posto giusto e al costo giusto, con la giusta formattazione).

Problemi nel valutare la traduzione Livelli di qualità: qualità-traduzione: garantisce la restituzione fedele del contenuto del testo di partenza e la correttezza sintattica e ortografica del testo di arrivo, ma adatto comunque solo ad una diffusione limitata. qualità-adattamento: il testo viene rifinito fino ad ottenere l’equivalenza totale, testuale e contestuale, sul piano del geostile e del sociostile. qualità-editing: è lo “zero difetti” pronto da stampare, assemblato con le immagini, le foto ed i disegni.

Problemi nel valutare la traduzione Metrica SAE (Society of Automitive Engineers) con 7 categorie di errore: errore terminologico, errore sintattico, omissione, errore di concordanza o di morfologia, errore di ortografia, errore di interpunzione, altro. Ogni errore è pesato come lieve o grave, cioè che può causare un malinteso o far compiere errore nell’eseguire le istruzioni descritte. La somma dei punti è divisa per il numero di parole.

Valutare la MT Un problema messo a fuoco dal rapporto ALPAC è quello della valutazione dei risultati prodotti dai sistemi di MT. Non esiste tutt’ora una metodologia condivisa ed universalmente accettata per la valutazione in toto della MT. Esistono però delle metriche utili anche per il confronto tra i sistemi e degli aspetti che devono essere considerati.

Problemi nel valutare la MT Uno dei principali problemi è la scelta di chi valuta: Se il valutatore è completamente ignorante di MT non esprime una valutazione realistica e non evidenzia le potenzialità dei limiti Se è invece esperto di MT si rischia che si basi su campioni troppo scelti di linguaggio e che evidenzi problemi irrilevanti.

Passi di sviluppo e valutazione per MT Nella costruzione di un sistema di MT, il primo passo è la costruzione di un prototipo di sistema (esperti). Il secondo passo è lo sviluppo di un sistema che possa operare in un ambiente reale, con associate utility per pre e post editing (sviluppatori). Il terzo passo è la valutazione da parte degli acquirenti ed utilizzatori che possono esprimere giudizi su come il sistema modificherebbe il loro lavoro.

Valutazione dell’output In tutti i passi occorre valutare l’output che il sistema produce sulla base di 3 parametri: Fedeltà o accuratezza - in che misura l’output contiene le stesse informazioni dell’input Intelligibilità o chiarezza - la facilità con cui si può comprendere il significato della traduzione Stile e registro - in che misura l’output usa un linguaggio appropriato al contesto d’uso

Valutazione dell’output Fedeltà o accuratezza - in che misura l’output contiene le stesse informazioni dell’input. Per verificare si possono applicare tecniche empiriche: vedere se seguendo le istruzioni di un manuale tradotto si possono fare le stesse cose che seguendo l’originale (leggibilità ed equivalenza di effetto sul lettore) applicare la traduzione all’indietro

Valutazione dell’output Intelligibilità o chiarezza - la facilità con cui si può comprendere il significato della traduzione. Viene applicata a frasi isolate o a interi testi, prendendo in considerazione anche la coerenza o consistenza traduttiva delle varie parti. Si valuta con scale numeriche standard.

Valutazione dell’output Stile e registro - in che misura l’output usa un linguaggio appropriato al contesto d’uso. È un fattore molto importante, soprattutto in certi tipi di documenti, che richiede una valutazione difficile da quantificare. Vari fattori determinano infatti il tipo di registro, come la scelta dei termini e il modo in cui ci si rivolge al lettore.

Analisi dell’errore Il conteggio degli errori presenti nell’output di un sistema di MT fornisce informazioni molto utili su come migliorarli. Si tratta di quantificare il lavoro da svolgere sull’output per renderlo accettabile come traduzione. Si contano le aggiunte e cancellazioni, le sostituzioni e si calcola la percentuale di parole corrette nel testo tradotto. Non è un processo oggettivo, dipende dal revisore e dal livello di accettabilità richiesto, e dai 3 parametri.

Analisi dell’errore Si osservi che il semplice conteggio degli errori può non essere sufficiente: occorre anche classificarli in base al fenomeno ed alla difficoltà di correzione. Il risultato di queste analisi si rivela utile per lo sviluppatore del sistema e per l’acquirente. Ma serve anche a confrontare diversi sistemi di MT. Ma questo richiederebbe però l’applicazione ad un benchmark condiviso.

Valutazione degli esperti Durante lo sviluppo del prototipo la valutazione è fatta dagli esperti allo scopo di decidere in che direzione procedere. L’output mostra carenze che richiedono modifiche dell’algoritmo o dei dati, pertinenti ad uno o più livelli di analisi o di generazione. La valutazione viene ripetuta ad ogni modifica del sistema allo scopo di verificare i progressi, in accordo con i 3 parametri.

Valutazione degli esperti Durante lo sviluppo del sistema la valutazione è fatta dagli sviluppatori che si devono preoccupare del funzionamento del sistema in un ambiente reale, quindi correggere i problemi correggibili, e costruire utility per supplire alle carenze del sistema che si decide di accettare, cercando di bilanciare costi e benefici. La valutazione viene fatta prima su piccoli frammenti di testo e poi su corpora.

Valutazione degli acquirenti Spesso acquirenti ed utilizzatori intervengono già nella fase di sviluppo, ad es. selezionando i dati su cui testare il sistema. É una valutazione tipo scatola-nera, solo sul risultato senza pensare al processo per ottenerlo. È una valutazione fortemente condizionata da interessi pratici ed economici che devono essere chiaramente definiti (tipo di testi, utenti, pubblicazione o uso interno, quantità di testi …)

Valutazione degli acquirenti Per l’utilizzo di un sistema in un ambiente reale occorre anche gestirne la compatibilità rispetto a sistemi operativi ed eventuali sistemi di input e di output, come OCR ed editor di testo o stampanti e scanner. Molto raramente un sistema di MT è una entità isolata, di solito è integrato in un sistema più ampio.

Valutazione dei traduttori Gli utilizzatori dei sistemi di MT sono principalmente i traduttori di professione, che sono quindi coinvolti nei processi di valutazione. La loro valutazione riguarda i 3 parametri e soprattutto in relazione alla quantità di lavoro di pre e post editing, e l’utilizzabilità delle relative utility. Il sistema di MT deve garantire facilità di revisione dell’input e dell’output.

Valutazione e metriche Nel rapporto ALPAC si fa un primo tentativo di valutare la qualità della traduzione e il compito di valutare è affidato ad un gruppo di esperti umani che leggono il testo originale e quello tradotto e li confrontano. Riconoscendo che questo modo di valutare ha il difetto della componente di soggettività, in seguito vengono proposte metriche oggettive per la valutazione.

BLEU Bilingual Evaluation Understudy BLEU è un algoritmo che valuta la qualità di un testo tradotto da una macchina confrontandolo con una traduzione fatto da un umano. Per limitare la soggettività è preferibile il confronto con più traduzioni. Il risultato è compreso tra 0 e 1, dove 1 è la perfetta identità. La valutazione si basa sul numero di parole uguali nei due testi confrontati.

TER Translation Error Rate Anche TER valuta la qualità di un testo tradotto da una macchina confrontandolo con una traduzione fatto da un umano. La distanza tra i due testi è calcolata come numero di modifiche (inserimenti di parole nuove, cancellazioni, sostituzioni e spostamenti) necessarie a trasformare il testo prodotto dalla macchina in quello di riferimento. Il risultato è diviso per il numero di parole del testo di riferimento. Il valore migliore è 0.

TER Translation Error Rate Saudi Arabia denied this week information published in the American New York Times This week the Saudis denied information published in the New York Times 1 spostamento, 2 sostituzioni, 1 cancellazione 13 parole 4/13 = 0.31 = 31%