MT in pratica Cristina Bosco Informatica applicata alla comunicazione multimediale
SYSTRAN La compagnia SYSTRAN, fondata nel 1968, è una delle più antiche attive nel settore della MT. Il creatore di SYSTRAN è Peter Toma, attivo fin dai primi anni ’50 e tra i partecipanti dell’esperimento di Georgetown.
SYSTRAN Toma lascia nel 1962 l’università per trasferirsi in Germania dove lavora ai primi prototipi di MT russo-inglese e russo-tedesco. Tornato negli USA, continua lo sviluppo di SYSTRAN che diventa il sistema usato dall’esercito e dalla NASA. Negli anni seguenti viene sviluppata la MT per inglese-francese che viene venduta alla Comunità Europea.
SYSTRAN SYSTRAN segue un approccio di traduzione diretta basato su regole fino al 2007, quando passa ad un approccio ibrido in cui regole e apprendimento statistico si integrano.
SYSTRAN SYSTRAN è alla base di alcuni noti sistemi di traduzione online, come SystraNET ma anche Yahoo, Babel fish e Google (fino al 2007).
BING Bing è il sistema di MT dell’ambiente Microsoft
BING Sistemi di traduzione su telefoni basati su Bing
Google translate
Confronto di sistemi di MT achine_translation_applications
Statistical MT
Corpora for MT
Dizionari Google dictionary Anche basati su ontologie, WordNet dictionary
Ontologie WordNet: MultiWordNet: t.php
Licenze per dati linguistici Enti che rilasciano risorse: European Language Resource Association Linguistic Data Consortium (negli USA)
Licenze per dati linguistici Per molti dati la licenza è un problema … ad es. i dati dei social media. Non si possono pubblicare i Tweet di Twitter, ma solo un riferimento al loro identidicativo.
Es. Twitter
Valutazione e Italiano Campagna di valutazione per il NLP della lingua italiana