Tavola rotonda - Big Data

Slides:



Advertisements
Presentazioni simili
OMEN: Conclusioni seconda TRR. La strategia della Commissione Europea per lInnovazione regionale In occasione del lancio dei nuovi fondi strutturali 2007/2013,
Advertisements

Lo sviluppo delle PMI tra Innovazione e Competenze. Il progetto MASTER Valentina Castello.
Europass Supplemento al Diploma: il valore della trasparenza e il diritto alla mobilità Elisabetta Perulli Centro Nazionale Europass
V.I.D.E.O. Video-CV to Increase and Develop Employment Opportunities
A. M. Tammaro Bibliocomm 2003 Linee guida per la digitalizzazione Perché ne abbiamo bisogno? Anna Maria Tammaro.
1 Quale spazio per uneducazione plurilingue nella scuola di oggi? Firenze, 30 settembre 2011 Silvia Minardi.
Scuola della Società Italiana di Statistica Una breve presentazione: passato e prospettive Monica Pratesi | Università di Pisa Direttore della Scuola della.
Poligono frequenze 1 dado. Poligono frequenze 2 dadi.
Raffaele Cirullo Head of New Media Seconda Giornata italiana della statistica Aziende e bigdata.
Nuovi prodotti e processi più efficienti: le opportunità tecnologiche e di finanziamento.
Best Practices: i Risultati dellInnovazione. Salerno, 26 Nov 07.
BRISCOLA GO ON AVANTI. Storia I giochi di carte hanno le origini più disparate e vengono collocati in differenti epoche, la Briscola risale al La.
Social Media & Contact Center: Point of View Telecom Italia
Fonti, metodi e strumenti per lanalisi dei flussi turistici A.A Prof.ssa Barbara Baldazzi Corso di Laurea PROGEST Facoltà di Lettere e Filosofia.
La standardizzazione dei processi di produzione nella statistica ufficiale: iniziative a livello internazionale ed all’interno dell’Istituto Giulio Barcaroli.
Comitato metodologie 9 luglio 2010 Costituzione di una rete per linnovazione metodologica nella produzione statistica.
Le politiche della Commissione Europea sull'accesso aperto. Il ruolo delle biblioteche accademiche Salone del libro di Torino, 10 maggio 2012 Maddalena.
Come nella stampa tradizionale, un giornale online può essere di informazione informazione o un periodico dedicato a una disciplina specifica.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
Frequency Domain Processing
FASTVID RENTALS: BUSINESS MODELING 1. Business Modeling One of the major problems with most business engineering efforts, is that the software engineering.
L’Unione Europea e la Scuola da anni hanno stretto un patto e per colmare il divario di apprendimento fra le diverse realtà didattiche dei vari Paesi,
Cinema e web: verso un ambiente formativo integrato Fondazione Ismu Milano, sabato 20 settembre 2008 ore Riccardo Triolo Laboratorio Itals Dipartimento.
PRO JOB La componente psicologica Alessandra Gorini, Gabriella Pravettoni Università degli Studi di Milano Istituto Europeo di Oncologia.
D2b Antonio Lioy Marco Vallini Politecnico di Torino Dip. Automatica e Informatica (Sestriere, Gennaio 2015)
Profilo professionale
Giovanni Biondi ICT e trasformazione della Scuola.
Vantaggi di questa metodologia Aggiorna in continuo il dataset Permette di visualizzare subito gli effetti delle scelte politiche sul territorio Combina.
La convergenza digitale Torino, 29 novembre 2005 Claudio Inguaggiato.
Metodi Quantitativi per Economia, Finanza e Management Lezioni n° 7-8.
( Art. 14 ) 1. Ogni bambino ha diritto all’istruzione senza distinzioni razziali. 1. Every child has the right to be brought up without.
1 Ugo Montanari Dipartimento di Informatica Università di Pisa Moving Forward at the Age of 33 A new building for the Dipartimento di Informatica June.
Comunicazioni La storia trasparente della CSN1 Sanzioni in arrivo per l’arcicattivo: Zoccoli: HERA-B A Luglio ti puniremo ! E ora bisogna.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle.
ANNUNCIO DI SEMINARIO Il giorno Venerdi' 21 Maggio 2004 alle ore 11:30 presso l'Aula C3.4 della Facolta' di Scienze Matematiche Fisiche e Naturali dell'Universita'
Siete i proprietari di una squadra di corse NASCAR. E’ l’ultima gara di un’ottima stagione e sarà trasmessa in Mondovisione vecchio sponsor (comunque.
Obiettivi del Progetto Ruolo del Living Lab ICT cloud-based platform and mobility services available, universal and safe for all.
ICT cloud-based platform and mobility services available, universal and safe for all users PRESENTAZIONE GENERALE
Presentazione Living Lab di Genova
Un problema multi impianto Un’azienda dispone di due fabbriche A e B. Ciascuna fabbrica produce due prodotti: standard e deluxe Ogni fabbrica, A e B, gestisce.
Corso di Statistica e Gestione delle Imprese Insegnamento: MARKETING Docente: Roberto Grandinetti Università di Padova Cap. 2 - Dal marketing di massa.
Mobilità tra i Paesi del Programma KA103 A.A. 2014/2015 (KA103) Mobility Tool+ e il Rapporto Finale Claudia Peritore Roma luglio 2015.
SUMMARY Different classes and distortions RIEPILOGO Le diverse classi e le distorsioni RIEPILOGO Le diverse classi e le distorsioni.
Alessandra De Cugis Progetto Tempi e Orari del Comune di Milano Time in the cities, a holistic approach for urban time issues, the case of Milan Paper.
Relative pronouns Forms and uses. Relative pronouns Uses and functions of the relative CHI Translates he who, she who, those who, everybody who Does not.
Che ora è? Che ore sono? Telling time. Fate Adesso: If you were to stop someone on the street to ask the time how would you get their attention? If you.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.
Università Roma Tre Corso di laurea magistrale CINEMA TELEVISIONE E PRODUZIONE MULTIMEDIALE Corso “Media digitali: Televisione, video, Internet” Docente:
Candidato: Giovanni Carnazza Relatore: Prof. Paolo Liberati Il saldo di bilancio corretto per il ciclo Il caso italiano dagli anni Ottanta ad oggi.
SISTEMI ZOOTECNICI PER LA GESTIONE DELLE AREE MARGINALI Massimo Lazzari Dipartimento di Scienze e tecnologie Veterinarie per la Sicurezza Alimentare Università.
LE PREPOSIZIONI. Le Preposizioni semplici (Simple prepositions) A preposition describes a relationship between other words in a sentence. In itself, a.
Laboratorio
Domenica Taruscio Direttore Centro Nazonale Malattie Rare Istituto Superiore di Sanità Roma
Titolo evento Luogo, data Seminario INSPIRE Bologna, luglio 2012 Profili, strumenti ed implementazioni dei metadati Antonio Rotundo Agenzia per l’Italia.
A.A CORSO INTEGRATO DI INFORMATICA E BIOINFORMATICA per il CLT in BIOLOGIA MOLECOLARE Scuola di Scienze, Università di Padova Docenti: Proff.
Crescita I: Paolo Sospiro Università di Macerata Macerata 29 Settembre 2014 Economia dello Sviluppo Università di Macerata.
Activity diagrams Data & Control Flows Esempi
RIUNIONE DEI PRESIDENTI DELLE COMMISSIONI COMPETENTI IN MATERIA DI OCCUPAZIONE, RICERCA E INNOVAZIONE Roma, novembre 2014 Camera dei deputati (Palazzo.
ROMA 24 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Misurare l’incertezza INNOVAZIONI E SPERIMENTAZIONI Misurare l’incertezza COMPORTAMENTI.
ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI - IL PROGRAMMA DI MODERNIZZAZIONE DELL'ISTAT La nuova Raccolta Dati: opportunità.
ROMA 23 GIUGNO 2016 OFFICINA MODERNIZZAZIONE - Gli strumenti del Programma di Modernizzazione dell’Istat Giulio Barcaroli, Nadia Mignolli - Il modello.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI - IL PROGRAMMA DI MODERNIZZAZIONE DELL'ISTAT Piero Demetrio Falorsi - Obiettivi,
ROMA 00 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Titolo presentazione INNOVAZIONI E SPERIMENTAZIONI La comunicazione del dato statistico.
STMan Advanced Graphics Controller. What is STMan  STMan is an advanced graphic controller for Etere automation  STMan is able to control multiple graphics.
Ninux.org OpenCamp Traditional Network Infrastructure: commercial wireless access Big operators –GPRS  UMTS  HSDPA “small”
MSc in Communication Sciences Program in Technologies for Human Communication Davide Eynard Facoltà di scienze della comunicazione Università della.
Do You Want To Pass Actual Exam in 1 st Attempt?.
WRITING – EXERCISE TYPES
AusTel by taha.a.
Transcript della presentazione:

Tavola rotonda - Big Data Seconda giornata italiana della statistica 23 ottobre 2012 Domenico Donvito Direttore – Direzione Centrale per le tecnologie dell’informazione e della comunicazione

Dato Statistico vs. BIG Data Caratteristiche del Dato Statistico Dimensioni trattabili Acquisizione dei dati in istanti predefiniti Qualità controllata da un processo di elaborazione/produzione definito BIG Data Dimensioni non trattabili con tecnologie tradizionali (tra Peta (10^15) e Exa (10^18)) Acquisizione continua dei dati (stream) Qualità non controllata e processi di elaborazione/produzione (in generale) non definiti Oggi il più grande db di ISTAT è ASIA (registro imprese) 1

BIG Data: Dimensioni Le tecnologie attuali consentono la risoluzione del problema BIG Implementazione di metodologie tradizionali attraverso tecnologie Big Data Ad esempio, record linkage con fase di bloccaggio fatta su architettura hadoop/MapReduce (programmazione per elaborazione distribuita) BIG è anche un’ opportunità: Nuove variabili (online sales) non misurate finora Variabili ausiliarie per stimare meglio i fenomeni o stimarli prima (nowcasting) Permettere di costruire informazioni che possano servire insieme ai dati per capire i fenomeni (social data mining), correggere e validare le informazioni, aumentare efficienza campionaria, etc.. Possibilità di scoprire nuova conoscenza, ad esempio relazioni nascoste, nuovi cluster/patterns, ecc. Controlli di consistenza che sfruttano l’estrema ridondanza delle sorgenti Web Hadoop (ad up): distributed file system from Apache Map reduce: scrittura programmi distribuita x elaborazione in parallelo, ogni nodo è autonomo (from Google) Altri metodi: db nosql (non ci sono tabelle per fornire flessibilità e scalabilità) Pattern (trama) 2

BIG Data: Acquisizione Continua Nuovi indicatori «near-time» basati su dati continuamente aggiornati Esempio 1: calcolo e monitoraggio continuo di indicatori standard a partire da sorgenti di big data non-standard, ad esempio l'indice di disoccupazione inferito dai profili di attività ottenuti per data mining dei record di telefonia mobile Esempio 2: calcolo e monitoraggio di nuovi indicatori di benessere/performance sociale a partire da sorgenti di big data non standard (social media, telefonia e navigazione satellitare, social networks, acquisti grande distribuzione) Near time è verso il real time 3

Problemi di qualità dei dati a vari livelli: BIG Data: Qualità Problemi di qualità dei dati a vari livelli: Qualità del dato, in termini di correttezza, aggiornamento, completezza, etc. Affidabilità o reputazione della sorgente Metadati che descrivono come il dato è memorizzato, da dove proviene (provenance), ecc. Opportunità di migliorare la qualità: Possibilità di risolvere problemi di missing data attingendo dall’elevato numero di fonti Possibilità di risolvere problemi di inconsistenza sfruttando la ridondanza delle fonti Attendibilità dei dati su web es. fake identities, è un filone di ricerca primario di google 4

La Statistica «Ufficiale» può attingere ai BIG data? Ruolo degli INS (1/3) La Statistica «Ufficiale» può attingere ai BIG data? Si, ma modalità da definire Esempio: Tecniche di sentiment analysis e opinion mining non direttamente utilizzabili in contesti di statistica «ufficiale» Il dato di statistica ufficiale è «certificato» dal processo di produzione 5

Ruolo degli INS (2/3) Necessità di rivedere il ruolo… Documento di vision HLG-BAS (High-level group for strategic developments in business architecture in statistics) ‘We are in a changeover from a society with little or no data available to one that has an abundance of data. In this light we have to rethink our traditional business values and the reasons of our existence. We see other parties making statistics that are akin to ours but much, much quicker (e.g. Google) and on an almost global scale. We also see other very interesting uses of statistics, prompted by the availability of so much data. Another important point is that nowadays it is much easier to get data that cover more than the traditional national statistics users would need. We do not, however, have the mechanisms in place to make full use of these data. The above is a strong indication that we have to rethink our products at the risk of becoming obsolete.’ (Strategic vision of the High-level group for strategic developments in business architecture in statistics, June 2011) …senza omologarsi ad altri provider di informazione statistica non-ufficiali HLG-BAS The High-Level Group for Strategic Developments in Business Architecture in Statistics (HLG-BAS) was set up by the Bureau of the Conference of European Statisticians in 2010 to oversee and coordinate international work relating to the development of enterprise architectures within statistical organisations. The HLG-BAS comprises 9 heads of national and international statistical organisations: Gosse van der Veen (Netherlands) – Chairman,Brian Pink (Australia),Eduardo Sojo Garza-Aldape (Mexico),Enrico Giovannini (Italy),Irena Križman (Slovenia),Katherine Wallman (United States),Walter Radermacher (Eurostat),Martine Durand (OECD) Lidia Bratanova (UNECE)  Le relazioni tra HLG-BAS e altri gruppi internazionali sono illustrate in: http://www1.unece.org/stat/platform/display/msis/Inventory+of+International+Groups 6

Ruolo degli INS (3/3) Key messages High-Level Group for Strategic Developments in Business Architecture in Statistics (HLG-BAS) Meeting (San Pietroburgo, Ottobre 3-5 2012) Harnessing New Data Sources Key messages Big data is the next big thing….è fondamentale esserci Dont go alone. È una attività su cui gli INS devono sperimentare, scegliere la scala piccola e farlo con gli esperti del mondo IT e di altri mondi dove questi dati sono stati già utilizzati Big data, require filtering. Nel processo di produzione è pensabile che fonti come i big data non entrino direttamente ma trasformate in input più simili a quelli tradizionali (ad esempio archivi amministrativi) attraverso motori che li estraggano e li ricodifichino per “estrarre segnale dal rumore” HLG-BAS The High-Level Group for Strategic Developments in Business Architecture in Statistics (HLG-BAS) was set up by the Bureau of the Conference of European Statisticians in 2010 to oversee and coordinate international work relating to the development of enterprise architectures within statistical organisations. The HLG-BAS comprises 9 heads of national and international statistical organisations: Gosse van der Veen (Netherlands) – Chairman,Brian Pink (Australia),Eduardo Sojo Garza-Aldape (Mexico),Enrico Giovannini (Italy),Irena Križman (Slovenia), Katherine Wallman (United States),Walter Radermacher (Eurostat),Martine Durand (OECD) Lidia Bratanova (UNECE)  Le relazioni tra HLG-BAS e altri gruppi internazionali sono illustrate in: http://www1.unece.org/stat/platform/display/msis/Inventory+of+International+Groups 7

Stat2015 e Big Data Stat2015 Programma pluriennale dell’ISTAT, Assicurare una regia complessiva dell’intero processo di innovazione, Sviluppare i progetti in maniera coerente con la visione di lungo termine, Rendere disponibili infrastrutture comuni o servizi generalizzati e riutilizzabili. Macro fasi basate su Generic Statistical Business Process Model (GSBPM), condiviso a livello europeo e internazionale Fase di acquisizione Dati da rilevazione Dati da archivi amministrativi Big Data  strategia e investigazioni 8

Big Data - iniziative Partecipazione a call for proposals Future & Emerging Technologies - FET - Flagships, managed by the European Commission within the 7th Framework Programme Ruolo - associated partner nel progetto di ricerca "FuturICT‘ WP1.3 Social data mining and knowledge discovery, coordinated by Dr. Fosca Giannotti, ISTICNR, Pisa, with a the focus on the use of novel sources of "big data" for the construction and monitoring of novel indicators of social well-being WP2.3 Open world of modelling platform, coordinated by Prof. Dino Pedreschi, University of Pisa, with a focus on the development of novel simulation models for what-if scenarios of social phenomena, such as human mobility, and associated ICT platforms for the construction of analytical and simulation processes 9

Grazie