La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

MT in pratica Cristina Bosco Informatica applicata alla comunicazione multimediale.

Presentazioni simili


Presentazione sul tema: "MT in pratica Cristina Bosco Informatica applicata alla comunicazione multimediale."— Transcript della presentazione:

1 MT in pratica Cristina Bosco Informatica applicata alla comunicazione multimediale

2 SYSTRAN La compagnia SYSTRAN, fondata nel 1968, è una delle più antiche attive nel settore della MT. Il creatore di SYSTRAN è Peter Toma, attivo fin dai primi anni ’50 e tra i partecipanti dell’esperimento di Georgetown.

3 SYSTRAN Toma lascia nel 1962 l’università per trasferirsi in Germania dove lavora ai primi prototipi di MT russo-inglese e russo-tedesco. Tornato negli USA, continua lo sviluppo di SYSTRAN che diventa il sistema usato dall’esercito e dalla NASA. Negli anni seguenti viene sviluppata la MT per inglese-francese che viene venduta alla Comunità Europea.

4 SYSTRAN SYSTRAN segue un approccio di traduzione diretta basato su regole fino al 2007, quando passa ad un approccio ibrido in cui regole e apprendimento statistico si integrano.

5 SYSTRAN SYSTRAN è alla base di alcuni noti sistemi di traduzione online, come SystraNET www.systranet.com/ ‎ ma anche Yahoo, Babel fish e Google (fino al 2007).

6 BING Bing è il sistema di MT dell’ambiente Microsoft http://www.bing.com/translator/help/#Home http://www.bing.com/translator/

7 BING Sistemi di traduzione su telefoni basati su Bing http://www.bing.com/translator/phone/

8 Google translate http://en.wikipedia.org/wiki/Google_Translate

9 Confronto di sistemi di MT http://en.wikipedia.org/wiki/Comparison_of_m achine_translation_applications

10 Statistical MT http://www.statmt.org/

11 Corpora for MT http://ipsc.jrc.ec.europa.eu/index.php?id=198 http://catalog.elra.info/ https://www.ldc.upenn.edu/

12 Dizionari Google dictionary http://google-dictionary.so8848.com/ Anche basati su ontologie, WordNet dictionary http://wordnet-online.freedicts.com/

13 Ontologie WordNet: http://en.wikipedia.org/wiki/WordNet MultiWordNet: http://multiwordnet.fbk.eu/english/home.php http://multiwordnet.fbk.eu/online/multiwordne t.php http://wndomains.fbk.eu/wnaffect.html

14 Licenze per dati linguistici http://creativecommons.org/ Enti che rilasciano risorse: European Language Resource Association http://catalog.elra.info/ http://catalog.elra.info/ Linguistic Data Consortium (negli USA) https://www.ldc.upenn.edu/

15 Licenze per dati linguistici Per molti dati la licenza è un problema … ad es. i dati dei social media. Non si possono pubblicare i Tweet di Twitter, ma solo un riferimento al loro identidicativo.

16 Es. Twitter

17

18 Valutazione e Italiano Campagna di valutazione per il NLP della lingua italiana http://www.evalita.it/


Scaricare ppt "MT in pratica Cristina Bosco Informatica applicata alla comunicazione multimediale."

Presentazioni simili


Annunci Google