Strumenti software per gestire i BIG DATA

Slides:



Advertisements
Presentazioni simili
Misure riflettometriche nel dominio della frequenza (OFDR)
Advertisements

2006 KILOG KILOG la soluzione per la logistica Gabriele Ottaviani Sales Manager
ARI sezione di Parma Sito ariparma ARI sezione di Parma.
Profilazione d’utente nei sistemi di e-commerce
Prototipo del Portale Fiscale per le Aziende. Portale Fiscale x le Aziende Area informativa news Area abbonati, accesso alla home page personalizzata,
1 t Mobilità internazionale e conversione dei voti Maria Sticchi Damiani Università della Calabria 8 febbraio 2013.
Intelligenza artificiale
Prime sperimentazioni d'indicizzazione [semi]automatica alla BNCF Maria Grazia Pepe - Elisabetta Viti (Biblioteca nazionale centrale di Firenze) 6. Incontro.
SISTEMA INFORMATIVO AZIENDALE
Le tecnologie informatiche per l'azienda
Corsi di Studio in Ingegneria Elettrica
una interfaccia internet per il sistema Momis
1 Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento.
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Progetto e sviluppo di.
Peer to Peer DBMS: il sistema FOAF Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Università degli.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Semantic.
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica MOMIS: servizi di wrapping.
Realizzazione di un robot mobile controllato mediante comandi labiali
1 A.A. 2008/2009 Laurea Magistrale In INFORMATICA Modelli Decisionali Metodi e Applicazioni.
E-Commerce 2 - Dott. E. G. Rapisarda - A.A Lanalisi di settore (2) Capitolo 4 Lanalisi di settore (2)
Siamo in grado di reperire una grande quantità di informazioni relativa alle attività sanitarie ed ai loro costi. Ciò è sufficiente per la Governance?
Informatica Web – design
Studiare INFORMATICA all’Università Ca’ Foscari
Luigi Puddu Torino - Ottobre 2010
IL PATRIMONIO DI DATI - LE BASI DI DATI. Il patrimonio dei dati Il valore del patrimonio di dati: –Capacità di rispondere alle esigenze informative di.
IL PROCESSO DI PREVISIONE DELLA DOMANDA
IL CLOUD COMPUTING: portabilità o privacy?
Operare in un mondo di BOLLE Spunti di riflessione di management Giugno 2008.
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA FACOLTÀ DI INGEGNERIA DI MODENA Corso di Laurea Specialistica in Ingegneria Informatica PROGETTO E REALIZZAZIONE.
UNIVERSO DI RIFERIMENTO: 730 ISCRITTI A CONFINDUSTRIA SERVIZI INNOVATIVI VENETO E TECNOLOGICI DEL VENETO DEI SETTORI: - SERVIZI DI INFORMAZIONE E DI COMUNICAZIONE.
DAGLI ARCHIVI AI DATABASE
Information-intensive
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria “Enzo Ferrari” – Sede di Modena Corso di Laurea Specialistica in Ingegneria Informatica.
Strumento per l'innovazione di prodotto eco-compatibile per le PMI
SOLUZIONI E PRODOTTI CODING SOLUTIONS. Coding Solutions progetta e realizza sistemi informatici per il controllo e lautomazione dei processi produttivi,
Il computer nella vita di ogni giorno
Firenze – Festival della Creatività 2009 Comm.it s.r.l. – Ing. Davide Rogai, Ph.D. – Software >> fast on demand software.
Servizi Grid ed agenti mobili : un ambiente di sviluppo e delivering
L’azienda ed i sistemi aziendali
Presentazione del problema Obiettivo: Lapplicazione di Search of Sematic Services permette di ricercare sevizi semantici, ossia servizi a cui sono associati.
Progetto Ingegneria del Software
Per l’analisi di un caso aziendale occorre:
Università degli Studi di Cagliari
Un Piano Strategico per lo Sviluppo dei Sistemi ITS in Italia ROMA 13 Dicembre 2007 Prof. Giovanni Tesoriere I SISTEMI ITS A SUPPORTO DELLE POLITICHE SULLA.
Universita’ degli Studi Roma Tre
SImPlIFy: UN SISTEMA DISTRIBUITO DI PRESCRIZIONE E SOMMINISTRAZIONE
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA DIPARTIMENTO DI INGEGNERIA “Enzo Ferrari” Corso di Laurea in Ingegneria Informatica Anno Accademico 2013/2014.
Università Roma Tre Corso di laurea magistrale CINEMA TELEVISIONE E PRODUZIONEMULTIMEDIALE Corso “Media digitali: Televisione, video, Internet” Docente:
Proxima Service Srl Sede Centrale: Torino  Proxima Point in Italia: 6 città principali Milano - Roma - Modena Bari - Cagliari – Siracusa  Addetti: 30.
Le “nuvole informatiche”
Dall’ambiente imprenditoriale al settore dell’impresa
Tecnologie Informatiche ed Elettroniche per le Produzioni Animali (corso TIE) CORSO LAUREA MAGISTRALE IN SCIENZE E TECNOLOGIE DELLE PRODUZIONI ANIMALI.
Consiglio della Regione Toscana (CRT) Area 4 - Settore tecnologie informatiche e ITIS Meucci Firenze La sfida del web 2.0 : Realizzazione di un portale.
Iterative Learning Control per un manipolatore robotico
Algoritmi euristici per l’ottimizzazione dell’offerta nella raccolta di rifiuti Tesi di laurea di Nicola Bindini Relatore: Chiar.mo Prof. Ing. DANIELE.
Sistemi di elaborazione dell’informazione Modulo 3 - Protocolli applicativi Unità didattica 1 - Domain Name System Ernesto Damiani Lezione 2 – Caratteristiche.
Modulo n – U.D. n – Lez. n Nome Cognome – titolo corso.
UNIVERSITÀ DEGLI STUDI DI PAVIA
Sistemi di Gestione dei Dati e dei Processi Aziendali Computer-Assisted Audit Technique (CAAT)
Basi di dati distribuite Prof. M.T. PAZIENZA a.a
FITEL Telecomunicazioni Soluzioni per tecnologie informatiche e telecomunicazioni.
Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Fisiche, Informatiche e Matematiche Corso di Laurea in Informatica Progettazione e.
Pag. 1 Soluzioni per l’ottimizzazione. UN PO’ DI STORIA…  EasyStaff nasce nel gennaio  Dal 2007 al 2013 è stata insediata all’interno del Parco.
1 DB unimo CROSS LAB Integrazione framework MOMIS - BCI Parma, 18/09/2007 Sonia Bergamaschi, Maurizio Vincini, Mirko Orsini
Domenico Elia1Riunione PRIN STOA-LHC / Bologna Attività per ALICE: sommario e prospettive Domenico Elia Riunione PRIN STOA-LHC Bologna, 18 Giugno.
NB: NON USARE QUESTO FILE POWERPOINT COME MODELLO (POT) 0 Pag.Fabrizio JemmaCorso di Economia e Organizzazione Aziendale Corso di "Economia ed Organizzazione.
X CONVEGNO NAZIONALE GIT IL GPS IN BEEBOOK Geosciences and Information Technologies Carlo CesariniSan Leo (Rimini) – 18 giugno 2015 Carlo Cesarini (laureando.
ROMA 23 GIUGNO 2016 LABORATORIO NUMERACY Big data nel settore assicurativo e sanitario LABORATORIO NUMERACY Big Data. Metodi statistici per la società.
ROMA 23 GIUGNO 2016 OFFICINA MODERNIZZAZIONE - Gli strumenti del Programma di Modernizzazione dell’Istat Giulio Barcaroli, Nadia Mignolli - Il modello.
Transcript della presentazione:

Strumenti software per gestire i BIG DATA Università degli studi di Padova Facoltà di Ingegneria Gestionale Dipartimento di tecnica e gestione dei sistemi industriali Strumenti software per gestire i BIG DATA Laureando: Pedassou Yao Edem Relatore: Bonollo Giuliano Anno Accademico 2011-2012

Sommario Definizione di big data Descrizione dei processi in campo big data e i relativi problemi e criticità Le tecnologie : Apache hadoop Applicazioni Prospettive e conclusioni

E’ un insieme di dati talmente grande che è praticamente impossibile utilizzarli con gli strumenti tradizionali. Definizione doppiamente inadeguata per la dimensione dei dati via via crescente e il valore di sfida che racchiude il big data

PROCESSI E CRITICITÀ

Dati di acquisizione e di recording Sorgenti di generazione dei dati Definizione dei filtri dei dati Generazione automatica del metadata giusto Provenienza dei dati Estrazione dell’informazione e il data cleaning Informazioni non inizialmente in formato strutturato pronte per l’analisi

L’integrazione, l’aggregazione e la rapresentazione dei dati Ricerca di automatizazione dell’analisi dei dati rendendo l’analisi comprensibile in modo computazionale e poi risolvibile con la robotica Elaborazione delle query, modellazione e analisi dei dati Scaling di query complesse Mancanza di coordianamento tra i sistemi di dati strutturati e non strutturati Interpretazione dei dati L’analisi deve essere reso facile al decisore Si deve soddisfare la richiesta di precisione del decisore

Le sfide Eteregeneità La scala La tempestività La privacy La collaborazione umana

Tecnologie apache hadoop linguaggio R Cascading Scribe ElasticSearch Apache Hbase Apache Cassandra MongoDB Apache CouchDB

HDFS: È un software che : Cos’è ? MapReduce Hadoop Distributed file system (HDFS) È un framework Open Source per applicazioni distribuite data-intensive HDFS: È un software che : memorizza i file attraverso un insieme di server in un cluster. Rileva e compensa i problemi di hardware, di disco e guasti di server Tolera e compensa i fallimenti del cluster

MapReduce : Sistema di elaborazione parallela dei dati

Fare fronte a un problema di esplosione di dati che nessun sistema preesistente era in grado di risolvere Capace di archiviare qualsiasi tipi di dati Prevedere uno stoccaggio a costo basso Offre un nuovo repository dove tutti dati strutturali e complessi possono essere facilmente combinati Scalabilità e affidabilità per l’elaborazione di algoritmi arbitrari Compatibile con i sistemi preesistenti (database, log generator…) Permette al DBA di ottimizzare il database Fornire agli utenti meno tecnici informazioni sui dati (analisti..) Guida ad una struttura incentrata sui dati

(uso della carta di credito) Applicazioni Applicazioni analitiche Basate su Attributi Attribuiscono un credito a una serie di attività (Partner di società) Basate su predizione o previsione Usano le tecniche statistiche e di data Mining per processi decisionali in svariati scenari di mercato (valutazione rischi, gestione del rendimento) Basate su approfondimento Usano le stese tecniche della precedente ma per rilevare Comportamenti insoliti (uso della carta di credito)

Applicazioni settoriali Finanza Impatto su i costi, rischi, ricavi e conformità Miglioramento dell’anlisi del profilo di clienti determinazione dell’eggibilità del capital azionario (mutui, assicurazione,credito) Individuazione delle frodi e prevenzione di eventi futuri di frodi Permette l’analisi del commercio

Industria Manifatturiera Gestione dei servizi piu efficiente e più efficace grazie alla proliferazione dei sensori e all’ analisi di feed di dati di gran dimensione Le Operazioni Miglioramento del processo di post-vendita di manutenzione Con l’aggiunta di sensori per attrezzature per fornire livello crescenti di dati sulle operazioni di manutenzione dell’apparecchiatura Aumento della qualità complessiva del prodotto

Sanità Migliorare la qualità dei servizi sanitari e ridurre il numero di ospedalizzazioni. Sviluppo dei farmaci : uso dei dati per fornire medicinali efficace e in tempo breve Scambio di informazioni sulla salute

Conclusioni Nuove tecnologie come hadoop sono impiegate per affrontare le sfide di big data e fino ad oggi ci riescono abbastanza bene Finché i Cloud Computing, l’internet ed altri generatori di dati ci sarano, i problemi dei big data sarano di attualità : La tecnologia deve affrontare il dilemma di risolvere crescita esponenziale e continua di dati con risorse a capacità limitate e con esigenza degli utenti ancora piu accentuata Siamo ancora in fase sperimentale e di ricerca: permangono vari punti dubbi riguardo alle tecnologie, alle possibili “Killer application”, ad un utilizzo basico a livello di utenti.

GRAZIE PER L’ATTENZIONE