EXTRA Progetto e Sviluppo di un Ambiente per Traduzioni Multilingua Assistite Riccardo Martoglia Università degli Studi di Modena e Reggio Emilia Facoltà.

Slides:



Advertisements
Presentazioni simili
Primary Italian Saying How You Are.
Advertisements

Trieste, 26 novembre © 2005 – Renato Lukač Using OSS in Slovenian High Schools doc. dr. Renato Lukač LinuxDay Trieste.
Qual è la differenza e quando li usiamo?
Giovanni Falcone & Paolo Borsellino.
L’esperienza di un valutatore nell’ambito del VII FP Valter Sergo
principi di emodinamica; regolazione delle resistenze periferiche
Teoria e Tecniche del Riconoscimento
Interfacce Java.
Microsoft SQL Server 2008 Utilizzo. Creazione DataBase CREATE DATABASE CREATE DATABASE Cinema.
1 Teaching Cloud Computing and Windows Azure in Academia Domenico Talia UNIVERSITA DELLA CALABRIA & ICAR-CNR Italy Faculty Days 2010.
A. Oppio, S. Mattia, A. Pandolfi, M. Ghellere ERES Conference 2010 Università Commerciale Luigi Bocconi Milan, june 2010 A Multidimensional and Participatory.
DG Ricerca Ambientale e Sviluppo FIRMS' FUNDING SCHEMES AND ENVIRONMENTAL PURPOSES IN THE EU STRUCTURAL FUNDS (Monitoring of environmental firms funding.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Relatore:Candidato:
Università degli studi di Modena e Reggio Emilia
Facoltà di Architettura PSICOLOGIA DELLA PERCEZIONE L01 a.a. 2001/02 prof. Walter Gerbino.
Università degli Studi di Cassino e del Lazio Meridionale Dipartimento di Scienze Umane, Sociali e della Salute Lingua Inglese a.a (Dott. Saverio.
1.E un algoritmo ricorsivo: Tutti le istanze di oggetti raggiungibili da un oggetto persistente diventano anchessi persistenti.
© and ® 2011 Vista Higher Learning, Inc.4B.1-1 Punto di partenza Italian uses two principal tenses to talk about events in the past: the passato prossimo.
Cancer Pain Management Guidelines
© and ® 2011 Vista Higher Learning, Inc.4B.2-1 Punto di partenza The verbs conoscere and sapere both mean to know. The choice of verb depends on its context.
Punto di partenza Reciprocal verbs are reflexives that express a shared or reciprocal action between two or more people or things. In English we often.
Un DataBase Management System (DBMS) relazionale client/server.
MySQL Esercitazioni. Ripasso Connessione a MySQL. Creazione delle basi di dati e delle tablelle. Inserimento dei dati. Interrogazioni.
CSN giugno Comunicazioni Riunione R-ECFA ai LNF 21&22 maggio; buona impressione data dallEnte. Follow-up? Giornata PT ai LNGS 3&4.
Quale dei seguenti composti può comportarsi da acido di Broensted ? Quale è la relativa reazione con una base? Cl -, HSO 4 -, NH 4 +, NH 3, H 2 S, OH -
Corso di Laurea in Ingegneria Elettronica - U niversità di N apoli F EDERICO II Autori XXXXX XXXXXXX YYYYY YYYYYYY ZZZZZ ZZZZZZZ Titolo tesina Parte X:
TIPOLOGIA DELLE VARIABILI SPERIMENTALI: Variabili nominali Variabili quantali Variabili semi-quantitative Variabili quantitative.
1. Conoscere luso delle collezioni in Java Comprendere le principali caratteristiche nelle varie classi di Collection disponibili Saper individuare quali.
Chistmas is the most loved holiday of the years. Adults and children look forward to Chistmas and its magical atmosphere. It is traditional to decorate.
VARO SRL LOGISTIC, QUALITY, SERVICE
HERES OUR SCHOOL.. 32 years ago this huge palace was built and it was just the beginning; It is becoming larger and larger as a lot of students choose.
Le regole Giocatori: da 2 a 10, anche a coppie o a squadre Scopo del gioco: scartare tutte le carte per primi Si gioca con 108 carte: 18 carte.
SOURCE TERM ON NPP SAFETY ANALYSES Marino Mazzini Professore Ordinario nel s.s.d. Impianti Nucleari Università di Pisa Facoltà di Ingegneria Dipartimento.
Palermo, may 2010 F.Doumaz, S.Vinci (INGV-CNT- Gruppo di telerilevamento)
PASTIS CNRSM, Brindisi – Italy Area Materiali e Processi per lAgroindustria Università degli Studi di Foggia, Italy Istituto di Produzioni e Preparazioni.
STAGE IN LINGUA INGLESE ISIS GREENWICH SCHOOL OF ENGLISH GREENWICH Data: dal al Studenti delle II-III-IV classi Docenti coordinatori:
Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione.
Mobile e Social per portare traffico nei negozi H&m Isabella Federico.
Gli ambienti di apprendimento Firenze, 3 marzo 2006.
UNIVERSITÀ DEGLI STUDI DI PAVIA FACOLTÀ DI ECONOMIA, GIURISPRUDENZA, INGEGNERIA, LETTERE E FILOSOFIA, SCIENZE POLITICHE. Corso di Laurea Interfacoltà in.
Guardate le seguenti due frasi:
Motor Sizing.
You will see a very spectacular picture ? Vuoi vedere una roccia spettacolare ?
embryo GPS dish (Rieger et al., 2007) Avvicinamento degli embrioni rispetto a micro gocce tradizionali e minore superficie.
Funzioni stringhe. chr Restituisce il carattere di un valore ascii dato. Per vedere lelenco dei codici ascii clicca QQQQ uuuu iiiiEsempio
Tutor: Elisa Turrini Mail:
Enzo Anselmo Ferrari By Giovanni Amicucci. Di Enzo Questo è Enzo Anselmo Ferrari. Enzo compleanno è diciotto febbraio Enzo muore è quattordici agosto.
Project Review Novembrer 17th, Project Review Agenda: Project goals User stories – use cases – scenarios Project plan summary Status as of November.
Enzo anselmo ferrari By: Orazio Nahar.
Quale Europa? Riscopriamo le radici europee per costruire unEuropa PIÙ vicina a noi ISTITUTO COMPRENSIVO MAZZINI CASTELFIDARDO PROGETTO COMENIUS 2010/2012.
In the following slides there are photos and work of Primary School Via Fiume Ins. Maria Aurelia Cosentino Part 1 Our place, our water…
Italian Family Policies and Pre- School Childcare in view of the Best Interest of the Child and Best Quality of Early Care Services. Towards the Lisbon.
DOMOTIC HOUSE WATER MONITOR Agalbato Francesco Buccheri Antonino.
UG40 Energy Saving & Twin Cool units Functioning and Adjustment
1 Basi di dati (Sistemi Informativi) Scuola di Dottorato in Scienze Veterinarie per la Salute Animale e la Sicurezza Alimentare a.a Ing. Mauro.
Analysis and Development of Functions in REST Logic: Application to the «DataView» Web App UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA DIPARTIMENTO.
Collection & Generics in Java
EMPOWERMENT OF VULNERABLE PEOPLE An integrated project.
LA WEB RADIO: UN NUOVO MODO DI ESSERE IN ONDA.
A PEACEFUL BRIDGE BETWEEN THE CULTURES TROUGH OLYMPICS OLYMPIC CREED: the most significant thing in the olympic games is not to win but to take part OLYMPIC.
IL GIUDIZIO FINALE THE LAST JUDGMENT Quando il Figlio dell’uomo verrà nella sua Gloria con tutti i suoi angeli, si siederà sul trono della sua gloria.
Passato Prossimo. What is it?  Passato Prossimo is a past tense and it is equivalent to our:  “ed” as in she studied  Or “has” + “ed” as in she has.
Lezione n°27 Università degli Studi Roma Tre – Dipartimento di Ingegneria Corso di Teoria e Progetto di Ponti – A/A Dott. Ing. Fabrizio Paolacci.
Scenario e Prospettive della Planetologia Italiana
Do You Want To Pass Actual Exam in 1 st Attempt?.
FRATRUM MINORUM CAPUCCINORUM
Il condizionale.
Preliminary results of DESY drift chambers efficiency test
The effects of leverage in financial markets Zhu Chenge, An Kenan, Yang Guang, Huang Jiping. Department of Physics, Fudan University, Shanghai, ,
Transcript della presentazione:

EXTRA Progetto e Sviluppo di un Ambiente per Traduzioni Multilingua Assistite Riccardo Martoglia Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Corso di Laurea in Ingegneria Informatica Anno Accademico 2000/2001 Relatore: Prof. Paolo Tiberio Correlatore: Dott. Federica Mandreoli Controrelatore Controrelatore: Prof. Sonia Bergamaschi

Traduzione EBMT (Example-based) Translation Memory Testo da tradurre Testo tradotto Ricerca di frasi (Pre-traduzione) Allineamento TranslationMemory Suggerimenti per la traduzione Traduttore professionista esattaapprossimata ~ frasi Codice Frase originaria (Lingua sorgente) Frase tradotta (Lingua destinazione) 5673 Welcome to the world of computer generated art! Benvenuti nel mondo della grafica generata al computer! The area to the left of the toolbox is where you work on your pictures. L’area a sinistra degli strumenti è dove si opera sulle immagini Now press the right mouse button and draw over a figure. Ora premere il pulsante destro del mouse e disegnare una figura. ………

Progetto EXTRA (EXample-based TRanslation Assistant) Metrica di similarità tra frasi Flessibile (stemming) Flessibile (stemming) Rigorosa (edit distance) Rigorosa (edit distance) Efficace Efficace Indipendente dalle lingue Indipendente dalle lingue Algoritmi di ricerca di similarità tra frasi Completi (full-match e partial-match) Completi (full-match e partial-match) Efficienti (filtri ed indici ad hoc) Efficienti (filtri ed indici ad hoc) Portabili (query SQL / JDBC + stored procedure Java) Portabili (query SQL / JDBC + stored procedure Java) Algoritmi di allineamento Allineamento frasi e parole Allineamento frasi e parole Automatici Automatici Indipendenti dalle lingue Indipendenti dalle lingue Ambiente integrato Strumenti per gestione ed analisi Translation Memory Strumenti per gestione ed analisi Translation Memory Interfaccia utente grafica Interfaccia utente grafica Svolto in collaborazione con Logos S.p.A.

Metrica di similarità tra frasi Edit Distance L’edit distance ed(f 1,f 2 ) tra due frasi f 1 e f 2 è il minimo costo della sequenza di operazioni sulle parole (inserimenti, cancellazioni, sostituzioni) che trasformano f 1 in f 2. Esempio. f 1 : On completion of electrical connections, fit the cooktop in place from the top f 2 : After the electrical connection, fit the hob from the top stemming  complete electric connect fit cooktop place top  electric connect fit hob top  electric connect fit hob top O O O O O O ed(f 1,f 2 ) = 3  distanza tra le frasi di 3 (parole)

INSERT INTO FULLMATCH SELECT R2.COD AS COD2, R1.COD AS COD1, R1.TARG_SENT AS SUGG, ed (R1.STEM_SENT, R2. STEM_SENT, round (d*R2.LEN)) AS DIST ed (R1.STEM_SENT, R2. STEM_SENT, round (d*R2.LEN)) AS DIST FROM TM R1, Q R2 WHERE WHERE … AND ed (R1. STEM_SENT, R2.STEM_SENT, round (d*R2.LEN))>= 0 AND ed (R1. STEM_SENT, R2.STEM_SENT, round (d*R2.LEN)) >= 0 ORDER BY COD2, DIST, COD1 INSERT INTO FULLMATCH SELECT R2.COD AS COD2, R1.COD AS COD1, R1.TARG_SENT AS SUGG, ed (R1.STEM_SENT, R2. STEM_SENT, round (d*R2.LEN)) AS DIST ed (R1.STEM_SENT, R2. STEM_SENT, round (d*R2.LEN)) AS DIST FROM TM R1, TMq R1q, Q R2, Qq R2q WHERE R1.COD = R1q.COD AND R2.COD = R2q.COD AND R1q.Qgram = R2q.Qgram AND ABS (R1q.POS – R2q.POS) ≤ round (d*R2.LEN) AND ABS (R1.LEN – R2.LEN) ≤ round (d*R2.LEN) GROUP BY R2.COD, R1.COD, R1.STEM_SENT, R2.STEM_SENT, R1.LEN, R2.LEN HAVING COUNT (*) ≥ (R1.LEN – 1 – (round(d*R2.LEN) – 1) *q) AND COUNT (*) ≥ (R2.LEN – 1 – (round(d*R2.LEN) – 1) *q) AND ed (R1. STEM_SENT, R2.STEM_SENT, round (d*R2.LEN))>= 0 AND ed (R1. STEM_SENT, R2.STEM_SENT, round (d*R2.LEN)) >= 0 ORDER BY COD2, DIST, COD1 Ricerca di similarità tra frasi Full match Dato un insieme di frasi da pre-tradurre Q, un insieme di frasi della Translation Memory TM, e una massima distanza relativa d, per ogni frase f q in Q di lunghezza |f q | si ricercano tutte le frasi f TM in TM (i suggerimenti) tali che ed(f q,f TM,round(d*|f q |))≥0 (ordinate sulla base del risultato dell’edit distance). Filtri: basati sul concetto di q-gramma posizionale basati sul concetto di q-gramma posizionale garantiscono correttezza (assenza di false esclusioni) garantiscono correttezza (assenza di false esclusioni) garantiscono efficienza (pochi falsi positivi) garantiscono efficienza (pochi falsi positivi) filtri di lunghezza, conteggio e posizione filtri di lunghezza, conteggio e posizione

31: On completion of electrical connections, fit the cooktop in place from the top and secure it by means of the clips as shown. (complete electric connect fit cooktop place top secure mean clip show) LEN = 11 d = 0.3  Massima distanza ammessa = 3 parole Frase Cercata: Frasi in Translation Memory: CODSOURCE_SENTSTEM_SENTLEN 3572 This is computer generated art. be compute generate art The cooling fan switches on only when the oven or cooktop has reached a certain temperature. cool fan switch oven cooktop have reach certain temperature After the electrical connection, fit the hob from the top and hook it to the support springs, according to the illustration. electric connect fit hob top hook support spring illustrate On completion of electrical connections, put the cooktop in place and fix it by means of the clips as shown. complete electric connect put cooktop place fix mean clip show 7 Ricerca di similarità tra frasi Full match ed(31,3572)ed(31,4631)ed(31,5848)ed(31,41780) = 3

Ricerca di similarità tra frasi Partial match Estensione del concetto di Full match. Si ricercano match di similarità: tra qualunque sottoparte delle frasi da pretradurre (estratta automaticamente) tra qualunque sottoparte delle frasi da pretradurre (estratta automaticamente) rispetto a qualunque sottoparte delle frasi della Translation Memory rispetto a qualunque sottoparte delle frasi della Translation Memory non solo in modo esatto, ma anche approssimato non solo in modo esatto, ma anche approssimato utilizzando la stessa metrica di similarità vista per le frasi intere utilizzando la stessa metrica di similarità vista per le frasi intere I Partial match devono essere: di lunghezza superiore ad una soglia minima lMin di lunghezza superiore ad una soglia minima lMin di distanza non maggiore a dSub di distanza non maggiore a dSub non contenuti in altri Partial Match più ampi non contenuti in altri Partial Match più ampi che soddisfano le condizioni precedenti che soddisfano le condizioni precedenti TranslationMemory Query 1: Ricerca parole uguali Partial Match Query 2: Ricerca migliori partial match Nuovi filtri: conteggio (partial match) conteggio (partial match) posizione (partial match) posizione (partial match) lunghezza (partial match) lunghezza (partial match) inclusione inclusione ridondanza ridondanza

Ricerca di similarità tra frasi Esempi di suggerimenti di pre-traduzione Frase cercata: On completion of electrical connections, fit the cooktop in place from the top and secure it by means of the clips as shown. Frase con parte simile 1: After the electrical connection, fit the hob from the top and hook it to the support springs, according to the illustration. Traduzione completa 1: Dopo aver eseguito il collegamento elettrico, montare il piano cottura dall'alto e agganciarlo alle molle di supporto come da figura. Suggerimento 1 (Dist=0.33): collegamento elettrico, montare il piano cottura dall'alto Frase con parte simile 2: Secure it by means of the clips. Traduzione suggerita 2 (Dist=0): Fissare definitivamente per mezzo dei ganci.

Allineamento Allineamento parole: esempio di funzionamento.riciclaggiodelsimbolodalindicatocome,100%alriciclabileèimballod'materialeIl Uguaglianza (sigle, punteggiatura, parole) Somiglianza LCS (parole)Thepackingis100%recyclable,asindicatedbytherecyclingsymbol..

Allineamento Allineamento frasi: esempio di funzionamento IngleseFrancese According to our survey, 1988 sales of mineral water and soft drinks were much higher than in 1987, reflecting the growing popularity of these products. Cola drink manufacturers in particular achieved above-average growth rates. The higher turnover was largely due to an increase in the sales volume. Employment and investment levels also climbed. Following a two-year transitional period, the new Foodstuffs Ordinance for Mineral Water came into effect on April 1, Specifically, it contains more stringent requirements regarding quality consistency and purity guarantees. Quant aux eaux minérales et aux limonades, elles rencontrent toujours plus d’adeptes. En effet, notre sondage fait ressortir des ventes nettement supérieures à celles de 1987, pour les boissons à base de cola notamment. La progression des chiffres d’affaires résulte en grande partie de l’accroissement du volume des ventes. L’emploi et les investissements ont également augmenté. La nouvelle ordonnance fédérale sur les denrées alimentaires concernant entre autres les eaux minérales, entrée en vigueur le 1er avril 1988 après une période transitoire de deux ans, exige surtout une plus grande constance dans la qualité et une garantie de la pureté. IngleseFranceseMatchDist According to our survey, 1988 sales of mineral water and soft drinks were much higher than in 1987, reflecting the growing popularity of these products. Quant aux eaux minérales et aux limonades, elles rencontrent toujours plus d’adeptes. 2 :2460 En effet, notre sondage fait ressortir des ventes nettement supérieures à celles de 1987, pour les boissons à base de cola notamment. Cola drink manufacturers in particular achieved above-average growth rates. The higher turnover was largely due to an increase in the sales volume. La progression des chiffres d’affaires résulte en grande partie de l’accroissement du volume des ventes. 1 :1173 Employment and investment levels also climbed. L’emploi et les investissements ont également augmenté. L’emploi et les investissements ont également augmenté.1 :146 Following a two-year transitional period, the new Foodstuffs Ordinance for Mineral Water came into effect on April 1, Following a two-year transitional period, the new Foodstuffs Ordinance for Mineral Water came into effect on April 1, La nouvelle ordonnance fédérale sur les denrées alimentaires concernant entre autres les eaux minérales, entrée en vigueur le 1er avril 1988 après une période transitoire de deux ans, exige surtout une plus grande constance dans la qualité et une garantie de la pureté. 2 :1340 Specifically, it contains more stringent requirements regarding quality consistency and purity guarantees.

Ambiente integrato Strumenti aggiuntivi e interfaccia utente

Collezione 1 (35000 frasi): copertura totale 99% Collezione 2 (1500 frasi): copertura totale 71% Prestazioni del sistema Efficacia Efficienza Tempi di pre-traduzione di 420 frasi (Translation Memory di frasi)  Circa 1,5 secondi per frase I filtri e gli indici permettono una riduzione dei tempi di circa 70%

EXTRA Conclusioni Obiettivi conseguiti: è stata definita una metrica di similarità tra frasi efficace ed indipendente dai linguaggi è stato definito e affrontato il problema di ricerca di similarità tra frasi intere è stata estesa la ricerca di similarità alle parti di frasi sono stati mappati tali problemi in query SQL/JDBC portabili ed efficienti sono stati implementati in Java una serie di algoritmi di allineamento, automatici ed indipendenti dalle lingue è stato realizzato in Java un ambiente comune, che riunisce tali funzionalità sotto un’interfaccia comune e ne fornisce di aggiuntive Sviluppi futuri Proseguire il lavoro di ricerca: studiando estensioni della ricerca di similarità in ambito semantico migliorando ulteriormente le prestazioni (nuovi filtri …) studiando l’applicabilità del sistema ad altri ambiti