Carlo Aliprandi – Mario Spoto

Slides:



Advertisements
Presentazioni simili
MIP International Patent Forum 2011
Advertisements

Trieste, 26 novembre © 2005 – Renato Lukač Using OSS in Slovenian High Schools doc. dr. Renato Lukač LinuxDay Trieste.
LEGAL INFORMATION ON THE WEB: THE ITALIAN SITUATION
Il Marketing Mix e il Modello delle “4 P”
Anno Diaconale f Federazione delle Chiese Evangeliche in Italia ufficio volontariato internazionale via firenze 38, roma tel. (+39) fax.
Centro Internazionale per gli Antiparassitari e la Prevenzione Sanitaria Azienda Ospedaliera Luigi Sacco - Milano WP4: Cumulative Assessment Group refinement.
L’esperienza di un valutatore nell’ambito del VII FP Valter Sergo
Logistica collaborativa per i distretti industriali.
1 SOCIAL MEDIA PLATFORM FOR MARKETERS. 2 Vitrue è una piattaforma di social marketing (SRM Dashboard) impiegata per aiutare i brand a catturare il vasto.
Business Models and Technology Watch
Midrange Modernization Conference 1 Scenari evolutivi per le soluzioni basate su AS/400 Walter Poloni Direttore Developer & Platform Evangelism Microsoft.
1 Teaching Cloud Computing and Windows Azure in Academia Domenico Talia UNIVERSITA DELLA CALABRIA & ICAR-CNR Italy Faculty Days 2010.
Modalità di ricerca semantica nelle Biblioteche digitali Maria Teresa Biagetti DIPARTIMENTO DI SCIENZE DOCUMENTARIE LINGUISTICO-FILOLOGICHE E GEOGRAFICHE.
EBRCN General Meeting, Paris, 28-29/11/20021 WP4 Analysis of non-EBRCN databases and network services of interest to BRCs Current status Paolo Romano Questa.
Interazione uomo-macchina (HCI – Human-Computer Interaction)
DG Ricerca Ambientale e Sviluppo FIRMS' FUNDING SCHEMES AND ENVIRONMENTAL PURPOSES IN THE EU STRUCTURAL FUNDS (Monitoring of environmental firms funding.
VOICE and MOISE Projects - Madrid I PROGETTI VOICE E MOISE Presentazione di Giuliano Pirelli European Commission Joint Research Centre Institute for the.
1 Rai Voice SubTitling System Lacquisizione vocale nella sottotilazione Ispra novembre 2003 Federico Neri LEXICAL SYSTEMS LAB.
Amministratore Delegato Avaya Italia
UNPAID WORK AND THE ECONOMY: STANDARDS OF LIVING FROM A GENDER PERSPECTIVE (ROUTLEDGE, 2003) Antonella Picchio Università di Modena e Reggio Emilia e.
1.E un algoritmo ricorsivo: Tutti le istanze di oggetti raggiungibili da un oggetto persistente diventano anchessi persistenti.
Raffaele Cirullo Head of New Media Seconda Giornata italiana della statistica Aziende e bigdata.
SOCIOLOGIA DEI PROCESSI CULTURALI E COMUNICATIVI Prof.ssa Donatella Padua A.A. 2011/12 A.A. 2011/12.
DISP, Tor Vergata The AI-NLP group at Computer Science Dept Prof. Maria Teresa PAZIENZA Prof. Roberto BASILI 2-4 Researchers 1-2 PhD students 1-2.
J0 1 Marco Ronchetti - Corso di Formazione Sodalia – Febbraio 2001 – Modulo Web Programming Tomcat configuration.
C Consiglio Nazionale delle Ricerche - Pisa Iit Istituto per lInformatica e la Telematica Reasoning about Secure Interoperation using Soft Constraints.
Biometry to enhance smart card security (MOC using TOC protocol)
LInnovazione di Prodotto. Lo sviluppo di nuovi prodotti e nuovi servizi: una vecchia sfida per le imprese innovative. [emilio bellini]
Infrastruttura & Competenze ICT ENEA
Fanno ormai parte della nostra vita di tutti i giorni….
Avis Contact Centres Review
2000 Prentice Hall, Inc. All rights reserved. 1 Capitolo 3 - Functions Outline 3.1Introduction 3.2Program Components in C++ 3.3Math Library Functions 3.4Functions.
Trento, March 13, 2008 Andrea Facco Info-telematics for Public Mobility and Logistics HMI Group - Speech Interfaces Centro Ricerche Fiat.
Nanoscience Laboratory Silicon nanophotonics Metamaterials Nanobiotechnologies, antioxidants and human health Few lab members.
Synthema TALeP 2006 Pisa Carlo Aliprandi Language and Speech Solutions Manager Synthema srl.
VARO SRL LOGISTIC, QUALITY, SERVICE
OSPEDALE SAN RAFFAELE GRUPPO OSPEDALIERO SAN DONATO
National Project – on going results Potenza 7/10 November 06 IT-G2-SIC-066 – Social Enterprise and Local Development.
Università degli Studi di Torino. Bruxelles, 11 September 2006 Università degli Studi di Torino – Prof. Ezio Pelizzetti Università degli Studi di Torino.
1 Attivita di ricerca Carlo Batini. 2 Aree Come costruire ed esprimere il contenuto informativo integrato di sistemi informativi complessi basati.
Institute for Atmospheric Pollution – EKOLab Consiglio Nazionale delle Ricerche Environmental Terminology Workshop 2 nd Ecoterm Group Meeting UBA - Umweltbundesamt.
Palermo, may 2010 F.Doumaz, S.Vinci (INGV-CNT- Gruppo di telerilevamento)
PASTIS CNRSM, Brindisi – Italy Area Materiali e Processi per lAgroindustria Università degli Studi di Foggia, Italy Istituto di Produzioni e Preparazioni.
STAGE IN LINGUA INGLESE ISIS GREENWICH SCHOOL OF ENGLISH GREENWICH Data: dal al Studenti delle II-III-IV classi Docenti coordinatori:
Project Review byNight byNight December 6th, 2011.
UNIVERSITÀ DEGLI STUDI DI PAVIA FACOLTÀ DI ECONOMIA, GIURISPRUDENZA, INGEGNERIA, LETTERE E FILOSOFIA, SCIENZE POLITICHE. Corso di Laurea Interfacoltà in.
Convegno CDTI Roma-Inforav-LUSPIO Mobile Computing in ambito sanitario Dinamiche, Opzioni, Opportunità, Sfide Emiliano Del Fiume, Unisys Italia
Socrates - Grundtvig D E S I G N I N G I N C L U S I V E S P O R T A C T I V I T I E S F A C I L I T I E S Questa presentazione può essere.
NICE Systems Interactions Analytics Business Applications
Come nella stampa tradizionale, un giornale online può essere di informazione informazione o un periodico dedicato a una disciplina specifica.
Centro di Servizi e Documentazione per la Cooperazione Economica Internazionale Centro di Servizi e Documentazione per la Cooperazione Economica Internazionale.
ISTITUTO DI SCIENZE E TECNOLOGIE DELLA COGNIZIONE Piero Cosi SEZIONE DI PADOVA - FONETICA E DIALETTOLOGIA Via Martiri della libertà, 2 – adova (Italy)
Project Review Novembrer 17th, Project Review Agenda: Project goals User stories – use cases – scenarios Project plan summary Status as of November.
Project Review Novembrer 17th, Project Review Agenda: Project goals User stories – use cases – scenarios Project plan summary Status as of November.
Federazione Nazionale Commercio Macchine Cantiermacchine Cogena Intemac Unicea Unimot ASSOCIAZIONE ITALIANA PER LA PROMOZIONE DELLA COGENERAZIONE.
Riccardo Mazza, AICA 2001, 20 sett Scuola universitaria professionale della Svizzera italiana Formazione continua e classe virtuale lapprendimento.
6° CONVEGNO NAZIONALE MILANO 16 giugno 2010 LE ORGANIZZAZIONI CAMBIANO COL FARE Il Change Management che fa accadere le cose The Leading Network of Fashion,
Italian Family Policies and Pre- School Childcare in view of the Best Interest of the Child and Best Quality of Early Care Services. Towards the Lisbon.
20 maggio 2002 NETCODE Set up a thematic network for development of competence within the Information Society.
Analysis and Development of Functions in REST Logic: Application to the «DataView» Web App UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA DIPARTIMENTO.
EMPOWERMENT OF VULNERABLE PEOPLE An integrated project.
LA WEB RADIO: UN NUOVO MODO DI ESSERE IN ONDA.
Teorie e tecniche della Comunicazione di massa Lezione 7 – 14 maggio 2014.
UITA Genève ottobre Comitè du Groupe Professionnel UITA Genève octobre 2003 Trade Union and Tour.
Early Language Learning and Multilingualism: Scottish and European Perspectives BILINGUALISM MATTERS.
Italian 1 -- Capitolo 2 -- Strutture
Prof. G.PassianteCorso di Economia dell’innovazione - A.A. 2012/13 The Process Handbook: A Tool for Business Process Redesign.
1 Giornata AIRI per l’Innovazione Industriale 2014 AIRI: 40 anni a sostegno della ricerca industriale italiana 26 maggio 2014 Horti Sallustiani, Roma.
5^BLS Regione Friuli Venezia Giulia Liceo Scientifico “Albert Einstein”
Transcript della presentazione:

Carlo Aliprandi – Mario Spoto SyNTHEMA Semantic Intelligence, Speech & Language Technologies Carlo Aliprandi – Mario Spoto Synthema srl Carlo Aliprandi

Company Profile Based in Pisa (Italy), SyNTHEMA is a high-technology SME that was established in 1993 by computer scientists from the IBM Research Center. Since then, the company has rapidly evolved, becoming nowadays a leading provider of Language and Semantic solutions, with state-of-the-art technologies for applications like Enterprise Search, Audio&Text Mining, Technology Watch, Competitive Intelligence, Speech Recognition, Respeaking and Speech Analytics. Grounding its leadership into a strong IT Research and Development, SyNTHEMA has pioneered a number of innovative applications and solutions, adopted on a daily basis by a vast amount of users to perform productivity tasks in different markets and industries, including Homeland Security, Intelligence and Law Enforcement, Public Administration and Government, Healthcare and Media. Carlo Aliprandi

Structure and activities 30 People (20 IT, 10 Localisation Services) Semantic Technology Translation Technology Speech Technology Carlo Aliprandi

Tecnologie del Linguaggio – COSA SONO? Language technology is often called Human Language Technology (HLT) or Natural Language Processing (NLP) and consists of computational linguistics and speech technology as its core but includes also many application oriented aspects of them. Language technology is closely connected to computer science and general linguistics Bill Clinton: “Soon researchers will bring us devices that can translate foreign languages as fast as as you can talk ….” Carlo Aliprandi

Tecnologie del linguaggio, alcuni esempi LINGUAGGIO SCRITTO Traduzione Automatica Analisi Semantica Ricerca in linguaggio naturale Information Retrieval Question Answering LINGUAGGIO PARLATO Speech Recognition – Speech to Text Trascrizione Automatica Sottotitolazione Assistita Intelligent Speech Interfaces Comprensione del Parlato Gestione del dialogo (Avatar,..) Carlo Aliprandi

Il linguaggio naturale Source Ethnologue Source Netz-Tipp.De 2002 Source http://www.netz-tipp.de/languages.html AIIA NLP Workshop 2010 Carlo Aliprandi

Semantica La semantica è una parte della linguistica che studia il significato delle parole, delle frasi e dei testi. Computazionalmente, si tratta di analizzare automaticamente il testo, cercando di capire il testo e di rappresentarne il significato profondo, (Natural Language Understanding) che risulta sempre dipendente dal contesto. AIIA NLP Workshop 2010 Carlo Aliprandi

Semantica: stato dell’arte Tecnologie fondanti, esempi: interessi “Questo prodotto è rivolto ai clienti cui interessi la qualità” “Contattateci per il calcolo interessi addebitati nei conti correnti e nei mutui” borsa “La borsa di Milano oggi ha chiuso in rialzo” “La Treasure è una borsa in pelle di lusso“ “Dal 2010 diventa obbligatoria la borsa della spesa biodegradabile” “Il presidente ha le borse sotto agli occhi” “per ottenere la borsa di studio della Camera dei Deputati…” interessare interesse lemmatizzazione VERBO NOME POS tagging WSD NER ORG. DATE PERS. LOC. AIIA NLP Workshop 2010 Carlo Aliprandi

The Italian market offers State of the art for deep NLU: Lemmatisation Semantic Technology The Italian market offers State of the art for deep NLU: Lemmatisation POS Tagging MultiWord Detection (MWD) Named Entity Recogniiton (NER) Parsing (dependency – constituency) Word Sense Disambiguation (WSD) Sentiment Analysis (SA) Semantic Role Labeling (SLR) Languages: Carlo Aliprandi

aspettando la killer app, c’è una domanda latente di “Semantic Search” Semantica è un cool topic? Bing Microsoft – Powerset (linguistic processor) Google – Applied Semantics (ontology, or knowledge base of concepts and their relationships, coupled with linguistic processing engine) Google Squared (structures the unstructured data on web pages) Hakia (meaning-based search engine, ontology and semantic lexicon, ontological parser) WolphramAlpha + computational knowledge engine, distilled and revised knowledge, NL query, rich visualisation Knowledge engineering, language dependent IBM Watson (Jeopardy!) aspettando la killer app, c’è una domanda latente di “Semantic Search” AIIA NLP Workshop 2010 Carlo Aliprandi

The Italian market offers State of the art speech technology for: Automatic Speech Recognition Automatic Transcription Dialogue Systems Speech Analytics Languages: Carlo Aliprandi

Dictation Transcription Dialogue Speech Retrieval Speech Recognition Dictation Dictation is the interactive composition of text Medical Report, court – parliamentary proceedings Transcription Transcription is transforming speech into text (Batch – Online) Dialogue CRM, device control, navigation, call routing Speech Retrieval Search audio and video using keywords Carlo Aliprandi

Language and Speech Solutions Manager Thank you Q&A Carlo Aliprandi Language and Speech Solutions Manager Synthema srl www.synthema.it Carlo Aliprandi

from Core NLP&ASR Technologies to products Dal 1997, portiamo tecnologia R&D nel mercato SR (consumer - professional) 1997: primo sistema di Riconoscimento del Parlato Continuo per l’Italiano (IBM Viavoice – Rad, Pat) 2000: Camera dei Deputati: CameraVox, primo sistema di Speech Reporting basato sul respeaking 2001: SpeechTitle (VoiceSubTitle), primo sistema per la sottotitolazione con Live Respeaking (broadcasting) 2002: Voice Suite, primo sistema professionale per il distributed Speech Reporting 2005: Voice Suite (and Fabrizio G. Verruso) World Champion in Speech Reporting - (still current) WR of 174 wpm 2009: Applicazione al mondo Giudiziario: Voice Suite Legal edition 2007: SpeechAligner, sistema di allineamento automatico tra video/audio e testo 2008: DictaSpeech, sistema ALL-IN-ONE per la gestione del workflow dell’Audio Digitale e della Resocontazione Vocale 2010: SpeechJive, Riconoscimento del Parlato su nuovi motori Nuance Dragon NaturallySpeaking 2012: SpeechScribe.Server, Speaker Independent ASR. Trascrizione automatica batch di audio e video del parlato spontaneo 2012: SpeechScribe.Live!, primo sistema di Online Speaker Independent ASR. Trascrizione automatica Live di audio e video del parlato spontaneo per la lingua italiana 2013: SpeechScribe, new languages: Carlo Aliprandi

Italian Chamber of Deputies RAI Università di Pisa Main Clients - Italy Italian Chamber of Deputies RAI Università di Pisa Regione Emilia-Romagna Tribunale di Milano 200+ Hospitals, 10.000+ physicians: Ospedale di Merano (German & Italian) Azienda Ospedaliera Pisana Ospedale di Viareggio Ospedale Savigliano Area vasta Toscana Sud-Est Carlo Aliprandi

HealthCare (Public and Private) Media Local and central Government Market HealthCare (Public and Private) Media Local and central Government Customer care Carlo Aliprandi

R&D - current projects Mosaic (Multi-Modal Situation Assessment & Analytics Platform) Automated detection, recognition, geo-location and mapping, to enhance situation awareness, surveillance targeting and camera handover Caper (Collaborative information, Acquisition, Processing, Exploitation and Reporting for the prevention of organised crime) A common platform for the prevention of organised crime through information sharing, exploitation and analysis of open and closed information sources Savas (Sharing AudioVisual language resources for Automatic Subtitling) Audiovisual resources collection and sharing, to develop a new Speech Recognition (ASR) technology for Multilingual Live Subtitling, specifically tuned to the needs of the Broadcasting and New Media Industries. OpenNER (Open Named Entity recognition) Provide enterprise and society with base technologies for Crosslingual Named Entity Recognition and Classification and Sentiment Analysis through the reuse of existing resources Carlo Aliprandi