Tecnologia semantica made in Italy NLP per i problemi di business del mondo reale Pisa, 12/10/2013 Nico Lavarini.

Slides:



Advertisements
Presentazioni simili
© 2010 Colt Telecom Group Limited. All rights reserved. Cloud Computing Lapproccio Colt Dionigi Faccedna.
Advertisements

DALL’EFFICIENZA TECNICA ALLA CRESCITA E MOTIVAZIONE DEL PERSONALE: una nuova cultura aziendale per la gestione della Responsabilità Sociale d’Impresa.
Midrange Modernization Conference 1 Scenari evolutivi per le soluzioni basate su AS/400 Walter Poloni Direttore Developer & Platform Evangelism Microsoft.
Dalla Business Intelligence al Business Performance Management
1 Rai Voice SubTitling System Lacquisizione vocale nella sottotilazione Ispra novembre 2003 Federico Neri LEXICAL SYSTEMS LAB.
WSDL (Web Services Description Language) Laurea Magistrale in Informatica Reti 2 (2006/07) dott. Federico Paoloni
Microsoft Robotics Studio Marco Petrucco Microsoft Student Partner - Udine.
EJB Enterprise Java Beans B. Pernici. Approccio Java.
Country Manager Genesys Italia
ETEN – Re-Public – RePublic website 1\5 eTEN Progetto Re-Public – RePublic website Workshop finale Dott. Marco Sentinelli – Galgano International Roma,
1 © 2013 Cobra Italia SpA All rights reserved Cobra group website Gennaio 2013.
MIC 2008, Roma Antonio Pistoia Università Politecnica delle Marche MOODLELab Uno strumento per MOODLE per la gestione dei telelaboratori durante i corsi.
Progetto Strutture e personale del Ministero
Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione.
RISK MANAGEMENT Breve overview sullo stato dellarte in Italia.
Presentazione Finale Team 2 1. Decomposizione in sottosistemi 2.
Sperimentazione CLIL nella scuola primaria in Lombardia
Knowledge Resources Guide: guida alle buone pratiche di turismo sostenibile La Knowledge Resources Guide: guida alle buone pratiche di turismo sostenibile.
Un mondo di soluzioni per la gestione dei viaggi daffari Il partner ideale per la gestione dei Viaggi dAffari.
Competenze Abilità Conoscenze Spirito di collaborazione Gratificazione.
GE.CO. Gestione per competenze. Introduzione a GE.CO. Orienta nella scelta di nuovi modelli organizzativi. Elabora modelli concettuali ed operativi. Introduce.
Venezia Confartigianato. Gli ultimi 10 anni Oggi.
NOI RAGAZZI DEL PERCORSO FORMAZIONE ANIMAZIONE 2006 ABBIAMO REALIZZATO QUESTA PRESENTAZIONE PER FAR CONOSCERE UNA NUOVA FIGURA AL SERVIZIO DELLA COMUNITA…
PRIMA PARTE Lezione 21 dicembre 2008 Luciano Molinari.
Filtered Index and Statistics Filtered Indexes Sergio Govoni
T.4T Technology for Teacher 3 Giorni per la Scuola IX edizione Città della Scienza, Ottobre 2011 Francesco Orciuoli DIEII – Università di Salerno.
Università degli studi di Roma La Sapienza Facoltà di Scienze Matematiche Fisiche E Naturali Corso di Laurea in Tecnologie Informatiche Presentazione Relazione.
I paesi e il territorio: turismo culturale, crescita della comunità ed economia identitaria Il paese e il territorio: Recite II - Learning Sustainability.
INNOVAZIONE NELLA SCUOLA E T.I.C.
Telemarketing & Market Research Advanced on Line Business Oriented Research Solutions ALBORS.
EUROPEAN YOUTH MEET THE CULTURAL HEREDITAGE WORKSHOP MALTA OTTOBRE 2011.
Custom Apps Development
Titolo 1. Chi sono 2 Sono coordinatore del SEO Training e SEO di DEA Marketing S.r.l. Mi ritengo fortunato di poter lavorare con la mia passione da geek.
Napoli, 28/06/ Hotel San Francesco al Monte Presentazione Associazione ITC.
DA NATIVI DIGITALI A INTERNAUTI CONSAPEVOLI
PORTE APERTE SUL WEB L'officina del webmaster: strumenti, materiali, iniziative, fonti di informazione, e poi perché costruire siti scolastici ? Laura.
1 Web Design Internet Agency. 2 Web Design Internet Agency Qual è il valore aggiunto che può portare allimpresa ? Perché è fondamentale oggi avere un.
La Biblioteca del Polo biologico Brevi note per un utilizzo consapevole della nostra biblioteca.
Una metodologia didattica di ricerca sul web
Prospecting & Vendite Padova 25 luglio Ci stanno ipnotizzando Crisi e Ipnosi.
POINT BREAKBREAK EVENTEVENT Prof. Pietro Samarelli.
I.S.F.I I nternational S chool F ashion & I ndustry CAMPUS S. PELLEGRINO - Misano (RN) Italy.
Cosa vuol dire «Embedded»? Valter
PILLOLE DI ……….. PROGRAMMA FORMATIVO ALTERNANZA SCUOLA – LAVORO.
Il software al servizio dei centri sportivi e polifunzionali.
Analisi del video: Come può essere così difficile? Dopo aver visto il documentario, sul sito
Il Problem Based Learning nella scuola secondaria e nella formazione professionale: una metodologia per “imparare facendo” esperienza su casi reali Susanna.
DIVARIO DIGITALE E NUOVI MEDIA SILVIA GREGORIO Relatore: Prof. FABIO MUZZIO Correlatore : Prof. MARCO PORTA BARRIERE DACCESSO ALLINFORMAZIONE.
La sfida dellinnovazione Tecnologia e servizi MARIO MELLA VoIP DAY Il futuro della rete Roma, 25 marzo 2010.
Firenze – Festival della Creatività 2009 Comm.it s.r.l. – Ing. Davide Rogai, Ph.D. – Software >> eyelander tracking semplice con il tuo cellulare.
Progetto WIDENS/MEHEN Pisa, 16 Aprile Progetto WIDENS/MEHEN Pisa, 16 Aprile 2005 WIreless DEployable Network System (WIDENS) Meshing European Heterogeneous.
Architettura dei sistemi di elaborazione
La Ricerca/azione. cosè la ricercazione la ricercazione risponde alla necessità, per la sociologia, di un approccio più comprensivo, attento ai fattori.
Stefania Manca ITD-CNR Genova, 28 Aprile Il Web 2.0 costituisce un approccio filosofico alla rete che ne connota la dimensione sociale, della condivisione,
PROFILO DOCENTE Fasce detà Anni di insegnamento Scuole di provenienza Lingue insegnate INSEGNAMENTO DEL LESSICO Ore mensili dedicate al lessico Giudizio.
P r o g e t t o M o n t a g n a s i c u r a Club Alpino Italiano Soccorso Alpino Speleologico Toscano Provincia di LuccaProvincia di Massa e Carrara Provincia.
Perché insegnare statistica a scuola Utilità della Statistica 1.è a fondamento della crescita democratica di un nazione moderna 2.è essenziale per monitorare.
On-line multi modal information
La ricerca nel web a cura di Patrizia Vayola. La ricerca nel web a cura di Patrizia Vayola Giornata di studio su Le leggi antiebraiche in Italia,
Prof.ssa Lucia Gangale Alternanza scuola lavoro Protocollo di intesa tra Polo di Qualità di Napoli ed Istituto Livatino di San Marco dei Cavoti.
PROGETTO CURRICOLO A cura del gruppo delle Funzioni Strumentali
ICF e Politiche del Lavoro
Riflessioni sul lavoro compiuto durante il percorso formativo Marzo 2011 Sant’Ambrogio Daniela Robasto Dipartimento di scienze dell’educazione e della.
Giancarlo Colferai - CEPAS
Confidential Information Copyright Nextel Italia R Talk Powered by Audioconferenza wireless Quality of Japan.
NICE Systems Interactions Analytics Business Applications
Modelli del dialogo: l'impatto della prospettiva computazionale Giacomo Ferrari Dipartimento di Studi Umanistici Università del Piemonte Orientale.
1 © 2004, Cisco Systems, Inc. All rights reserved. Il ruolo della Rete nella strategia aziendale David Bevilacqua Operations Director Enterprise 29 Settembre.
Clarius Suite per lanalisi dei dati storici e la generazione dei documenti cruscotti Guy Rochat
Do not put content on the brand signature area Misurabilità e direct response nell’era del cliente multiscreen Paolo Giambertone Head of Digital Channels,
Transcript della presentazione:

Tecnologia semantica made in Italy NLP per i problemi di business del mondo reale Pisa, 12/10/2013 Nico Lavarini

2 NLP e Tecnologia Semantica Baseline Keyword-based / bag-of-words Primitivo, generale, veloce Avanzato Shallow linguistic / LSI / statistica avanzata Approccio sintetico con analisi su grandi volumi Machine Learning per apprendimento conoscenza

3 NLP e Tecnologia Semantica Perché la tecnologia semantica per NLP? Analisi approfondita testi Approccio analitico a fenomeni linguistici

4 Siri (Apple 2011) Combinazione STT / NLP Virtual assistant, capisce e gestisce Elementi locali (telefono, rubrica, appuntamenti, messaggi) Conoscenza generica esterna (ricerca, meteo) Numerosi tipi di query: meteo, invia sms a, informazioni varie, ricerca Risultato mainstream: cosa mai vista

5 Genio (Virgilio 1999) Genio rispondeva alle domande via web flusso: analisi linguistica, identificazione elementi, ricerca template e restituzione risposta Uso generico NLP su web in italiano 13 anni fa

6 Genio (Virgilio 1999) Esempi di query: che tempo fa a Roma voglio info sul circuito di Hockenheim no mobile/locale ma web su tanti domini comprensione NL qualunque Creazione base di conoscenza strutturata usata come repository per le richieste. Aree coperte: sport, mappe, treni,voli, traffico, meteo, hotel, turismo, nozioni enciclopediche, celebrità, eventi, lavoro, tv, musica, ecc.

7 Chi può farlo Non basta (non serve) forza bruta e risorse Il problema globale è troppo complesso e ampio Cosa serve? Altra strategia Capacità, Competenze Scelta del compromesso valore aggiunto fattibilità Perché in Italia? Intelligenza, visione di insieme, capacità di sintesi

8 Machine Learning Machine Learning oggi molto comune Risorse + $ + hardware + tanti dati danno risultati TTM veloce, buona qualità in poco tempo ma risultati difficilmente affinabili, molte tecniche sono black-box

9 Lapproccio analitico Controllo e sfruttamento fenomeni linguistici porta a comprensione Più faticoso e richiede molte competenze specifiche Compromesso fra analisi puntuale di tutto e fattibilità Migliore nonostante la complessità Permette precisione e qualità più alte (a piacere in certi casi)

10 NLP e qualità La perfezione non è raggiungibile Anche gli umani interpretano male i testi (e i comandi a voce) Mutual agreement fra esperti medio ~80% su analisi sintattica/semantica Grande varietà fenomeni linguistici del mondo reale Long Tail Coreferenze lunghe, negazioni (multiple), ironia/sarcasmo, conoscenza implicita (world knowledge), pragmatica, ecc.

11 NLP e qualità C'è ancora tanta strada da fare Mantenere qualità analisi con scarsa qualità dei documenti (social web) Approcci formali al linguaggio (Generative/Transformational grammars) non funzionano in assoluto Gestione Long Tail dei fenomeni linguistici

12 Il futuro Sfida: combinare gli approcci esistenti prendendo il meglio analisi approfondita usando come base la conoscenza proveniente da sintesi di grandi volumi di testi Tecnologie Big Data possono aiutare a gestire in maniera efficiente i volumi Fondamentale il passaggio da informazione a conoscenza Strumenti black box danno informazione difficilmente usabile, serve significato

13 Il futuro Scenari futuri con qualità migliore: Efficiente integrazione NLP nel ciclo TTS/STT per assistenti vocali NLP open-domain efficiente (QA, sentiment analysis) su informazioni non strutturate Semantic network automatiche da dati web (conoscenza, non informazione) Analisi social media (linguaggi non-standard, scarsa qualità, diverse lingue, conoscenza e cultura implicite)

Grazie Nico Lavarini Chief Scientist Expert System Contacts