B.I. Strategy BUSINESS INTELLIGENCE Introduzione al Data Warehouse

Slides:



Advertisements
Presentazioni simili
Dalla Business Intelligence al Business Performance Management
Advertisements

EJB Enterprise Java Beans B. Pernici. Approccio Java.
FONDAMENTI DI INFORMATICA III WfMC-1. FONDAMENTI DI INFORMATICA III WfMC-2 WFMC Cose WfMC Workflow Management Coalition (WfMC), Brussels, è unorganizzazione.
Componenti dell’architettura Oracle
MIC 2008, Roma Antonio Pistoia Università Politecnica delle Marche MOODLELab Uno strumento per MOODLE per la gestione dei telelaboratori durante i corsi.
I modelli reticolari Rappresentano graficamente le procedure attraverso nodi e linee; 2. Ogni linea rappresenta unattività; 3. Su ogni linea è riportato.
Progetto Strutture e personale del Ministero
Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione.
RISK MANAGEMENT Breve overview sullo stato dellarte in Italia.
Presentazione Finale Team 2 1. Decomposizione in sottosistemi 2.
Sistema informativo IrisWIN
I processi auto valutativi e il miglioramento delle azioni della scuola Iseo, 20 novembre 2012 Bruna Baggio.
Un esempio: Registrazione e lettura di dati in un file
Antonio Torraca
GE.CO. Gestione per competenze. Introduzione a GE.CO. Orienta nella scelta di nuovi modelli organizzativi. Elabora modelli concettuali ed operativi. Introduce.
Microsoft Access Maschere.
Trieste 7 marzo 2013 SVILUPPO DELLE INFRASTRUTTURE ED EFFICIENZA DELLE CATENE LOGISTICHE IN PROVINCIA DI TRIESTE.
INNOVAZIONE NELLA SCUOLA E T.I.C.
Telemarketing & Market Research Advanced on Line Business Oriented Research Solutions ALBORS.
PROGETTO “NASTRO FERMI”
La risoluzione determina il dettaglio dell'immagine, quindi le massime dimensioni di stampa che potete raggiungere mantenendo una buona qualità. La fotocamera.
E/webgateway pixel. Cosa è e/webgateway non è solamente un programma che si occupa di aggiornare il sito di commercio elettronico della azienda verso.
Sito IntergruppoParma.it Nuovo Intergruppo Parma.
Alcune problematiche di replicazione dati in unorganizzazione geograficamente distribuita Collaborazione CASPUR - ENEA Silvia Eccher - CASPUR Franco Iannone.
I mille volti della formazione dalle-learning allemployergame Novembre 2012 I mille volti della formazione: dalle-learning allemployergame 4° Release Novembre.
Creare e gestire un sito Web scolastico P.O.N ITIS Marconi Nocera a.s
Il Booking Engine Html di HermesHotels è studiato per permettere I-Frame sui siti degli Hotels. Disponibile anche in modalità Pop- Up https, simile.
Struttura Aziendale Arianna Montervino 4° A T.G.A A.S 2009/2010 Stage.
"Ricerca-azione triennale sugli OBIETTIVI di SVILUPPO del MILLENNIO condotta attraverso le ICT nella scuola secondaria di II grado" Ipsia Carlo Cattaneo.
# Tre di Picche Marketing Ruolo del marketing
L’azienda prima dell’intervento:
LA GESTIONE DELLE ATTIVITÀ COMMERCIALI
POINT BREAKBREAK EVENTEVENT Prof. Pietro Samarelli.
I.S.F.I I nternational S chool F ashion & I ndustry CAMPUS S. PELLEGRINO - Misano (RN) Italy.
Sistemi Informativi Avanzati Presentazione Tesina
Mappa concettuale di sintesi
Quirky Social product development company Quirky si definisce social product development company. Dove il termine social è utilizzato per identificare.
Presenta Progetto Web Marketing 3.0. Hyper-code Via Domenico Mercante 6, Verona (VR) – Tel Cell mail.
Soluzione integrata per la gestione delle attività di
I sistemi G.I.S. Una breve panoramica. G Sta per GeographicG Sta per Geographic I GIS hanno a che fare con la cartografiaI GIS hanno a che fare con la.
1 Target Cross Intelligence Le decisioni d'impresa, spesso, non sono né giuste né sbagliate. Le decisioni d'impresa, spesso, non sono né giuste né sbagliate.
Tableau de bord Cruscotto di direzione
Relazione di: Rosario Maugeri Francesca Marcellino Oriana Guerreri
Sistema Informativo per Associazioni Agricole AgriManager Progetto realizzato da in collaborazione con.
Il software al servizio dei centri sportivi e polifunzionali.
DSS Identità oggetto Contenuto Modalità di uso Nome oggetto: numero
Analisi del video: Come può essere così difficile? Dopo aver visto il documentario, sul sito
Modulo 1 bis Menù Incolla Esercitazione Un computer è quasi umano, a parte il fatto che non attribuisce i propri errori a un altro computer. (Anonimo)
TAQ Identità oggetto Contenuto Modalità di uso Nome oggetto: numero
Architettura dei sistemi di elaborazione
La Ricerca/azione. cosè la ricercazione la ricercazione risponde alla necessità, per la sociologia, di un approccio più comprensivo, attento ai fattori.
Innovazioni versione 4 Bari, 17 ottobre Innovazioni versione 4 Il menù dinamico secondo logica operativa Il ruolo dei Ruoli Facilitare la scelta.
Istituto degli InnocentiRegione Molise C orso di formazione La comunicazione pubblica La redazione web Campobasso 12/13 Aprile 2004.
Ruolo di ARPA FVG nella gestione dei dati ambientali Dott. Giorgio Mattassi Direttore Tecnico Scientifico ARPA FVG Udine, 15 dicembre 2010 Auditorium regionale.
CD-Easy Sito per la vendita on-line di CD audio. di Annunziato Tonnara Matr A.A. 2003/2004.
ESSERE DEALER DEALER NEL 2005 NEL La Formazione come strumento di crescita si investe sul fare e si dedica poco tempo agli scenari (ci pare di risparmiare.
Unità 1 La Funzione di Marketing
ECDL Modulo 1 – Il computer nella vita di ogni giorno u.d. 5
Gli indici di bilancio di Valentina Grison.
INTERNET Internet è una rete a livello mondiale che permette alle persone di comunicare ed ad accedere a banca dati da qualunque parte del mondo e su qualunque.
AgentGroup MEnSA Project - Future work Agent and Pervasive Computing Group Dipartimento di Ingegneria dellInformazione Università degli Studi di Modena.
Gruppo 4: Gelmi Martina, Morelato Francesca, Parisi Elisa La mia scuola ha un sito Web: modelli per la qualità dei siti (Ingegneria del Web)
Sistema Informativo Demanio Idrico marzo Per aumentare lefficienza del servizio abbiamo realizzato un sistema in grado di gestire in modo integrato.
GAUDI Carpi 01 aprile Panoramica Visitatori On-line nuovo sito Visite medie quotidiane: 398 Visite medie quotidiane:
WORKSHOP BUSINESS INTELLIGENCE STEFANO CANESTRARI STRUMENTI DI BUSINESS INTELLIGENCE NEL S.I.L. PER LOSSERVATORIO DEL MERCATO DEL LAVORO DELLA REGIONE.
ICF e Politiche del Lavoro
Attività Formativa Sviluppo di un WORKFLOW ENGINE di Dott. Riccardo Gasperoni Alessandro Caricato Gabriele Trabucco in collaborazione con Progesi S.p.A.
Giancarlo Colferai - CEPAS
1 Roma, 18 febbraio 2004 Progetto disabili Telelavoro: La tecnologia come strumento per linserimento dei disabili nel mondo del lavoro.
Corso di Web Services A A Domenico Rosaci Patterns di E-Business D. RosaciPatterns per l'e-Business.
Transcript della presentazione:

B.I. Strategy BUSINESS INTELLIGENCE Introduzione al Data Warehouse

Definizione: Esistono molte definizioni che identificano il concetto di Data Warehouse, in particolare :   “ Una piattaforma sulla quale vengono archiviati e gestiti dati provenienti dalle diverse aree dell’organizzazione; tali dati sono aggiornati, integrati e consolidati dai sistemi di carattere operativo per supportare tutte le applicazioni di supporto alle decisioni ” (Gartner)  

Più chiaramente: Il Data Warehouse è una collezione di dati a supporto del processo decisionale: attraverso il Data Warehouse il management ha l’opportunità concreta di trovare le risposte a tutte quelle domande che hanno un alto impatto sulle performance aziendali chi ricopre ruoli decisionali deve avere la possibilità di usufruire di tutti gli strumenti che possono rendere la guida dell’azienda massimamente sicura.

Problematiche di management Le tipiche problematiche del management relativamente alla fruizione di dati possono essere riassunte come segue: Assenza di sintesi nella reportistica Risultati diversi da fonti diverse per la stessa tematica Impossibilità di navigare nei dati ragionando con oggetti  “business” Inaffidabilità di alcuni dati critici Costi elevati per sintetizzare report e analisi Scarsa “collaborazione” o impossibilità di comunicazione dei sistemi informativi transazionali per interrogare i dati Assenza di coerenza fra i dati. Lentezza nell’interrogazione di dati non ottimizzati per l’analisi Queste problematiche sono così universali che possono essere considerate come requirements  fondamentali per la costruzione di un sistema di Data Warehouse.

Caratteristiche fondamentali del DWH [1/2] Il Data Warehouse deve consentire l’accesso a dati aziendali garantendo bassi tempi di attesa fra l’interrogazione dei dati e l’output di risultati. I dati esposti devono essere consistenti: un particolare valore (le vendite del prodotto A nella città B nel periodo di tempo C) deve essere sempre lo stesso indipendentemente dal momento dell’interrogazione o dalla modalità di interrogazione dei dati. I dati esposti possono essere ricombinati e separati rispetto agli oggetti di calcolo definiti dal business. Nel concetto di data warehouse rientrano anche gli strumenti software necessari a facilitare l’interrogazione dei dati e a garantire una presentazione chiara della sintesi delle analisi. Il Data Warehouse deve contenere dati coerenti e “ripuliti”: capita che fonti importanti di dati per il  Data Warehouse trascinino errori di diverso genere che possono avere un impatto devastante sulla qualità dei dati stessi, parte fondamentale del processo di realizzazione di un sistema di Data Warehouse è rappresentata proprio da attività di recupero, trasformazione e pulitura dei dati.

Caratteristiche fondamentali del DWH [2/2] La qualità del Data Warehouse può mettere in luce problematiche nascoste all’interno dei processi aziendali, tipicamente l’assenza di dati relativamente ad una particolare attività dovuta all’opzionalità di compilazione dei dati (causa principale dell’assenza di dati) può evidenziare, proprio grazie al Data Warehouse, la necessità di verificare a livello di processi aziendali l’opportunità di definirla come obbligatoria (e non opzionale). Il Data Warehouse è un sistema in sola lettura, gli utenti non eseguono azioni di aggiunta, modifica o eliminazione dei dati.

Data Base vs Data Warehouse Il DWH è, quindi: Orientato ai soggetti di interesse Integrato e consistente Rappresentativo dell’evoluzione temporale Non volatile La differenza principale che intercorre tra un DB da un DWH è nel concetto di Denormalizzazione dei dati. Tale ridondanza permette di ottimizzare le caratteristiche per cui un DWH viene progettato.

Rappresentazione Multidimensionale La modellazione dati all’interno di un DWH riguarda tre concetti fondamentali propri del management: Fatto: un concetto sul quale centrare l’analisi modella un evento che accade nell’azienda es. Vendita di Prodotti. Misura: una proprietà atomica di un fatto da analizzare ne descrive un aspetto quantitativo es. Quantità venduta, incasso, ecc. Dimensione: descrive una prospettiva lungo la quale effettuare l’analisi es. Tempo, Negozio, ecc.

OLTP vs OLAP Le caratteristiche proprie del DWH, necessitano di porre l’attenzione sull’esistenza di due universi completamente diversi nell’ambito del trattamento dei dati aziendali : On line Transaction processing (OLTP) è l’insieme dei sistemi transazionali pensati e ottimizzati per garantire la massima sicurezza nella gestione delle transazioni. On line Analytical processing (OLAP) è l’insieme dei sistemi di analisi dei dati pensati e ottimizzati per garantire la massima performance e la massima “estensione” delle interrogazioni. Il recente successo della “filosofia” OLAP è dovuto in parte alla disponibilità di potenza elaborativa per gestire grossi volumi di dati a basso costo e la possibilità di distribuzione delle informazioni tramite tecnologia intranet/Internet.

OLAP Devono supportare analisi e calcoli sofisticati su diverse dimensioni e gerarchie Il modello logico dei dati più adatto e’ una struttura multidimensionale, il “data cube” Le dimensioni del cubo sono costituite dagli attributi secondo i quali si vogliono fare le ricerche (chiavi) Ogni dimensione può “contenere” a sua volta una gerarchia DATA {GIORNO - MESE – TRIMESTRE - ANNO} PRODOTTO {NOME - TIPO - CATEGORIA} es. (LAND ROVER - FUORISTRADA - AUTOVEICOLI) le celle del cubo contengono i valori metrici relativi ai valori dimensionali

Ambiente DWH [1/2] Dal punto di vista tecnico/architetturale la definizione di un ambiente data warehouse può essere così semplificata: I dati sorgente, oggetto dell'analisi, vengono forniti dai sistemi transazionali e possono essere di varia natura (sistemi ERP, fogli excel database personali, dati core di applicazioni aziendali, ecc.). Tali dati sono caricati nel data warehouse attraverso procedure di ETL (extraction, transformation e loading) (che possono essere il risultato dello sviluppo di un'interfaccia applicativa in SQL, C, ecc. o possono essere definite e costruite con complessi tool di ETL presenti sul mercato). Nel data warehouse i dati sono presenti al massimo dettaglio e storicizzati e spesso raggiungono dimensioni comunque poco compatibili con l'interrogazione diretta attraverso tool di analisi: vengono così generati dal data warehouse aggregati tematici di dati (datamart) sui quali verranno scatenate le query per le analisi.

Ambiente DWH [2/2] Un notevole numero di tool permettono di effettuare analisi di ogni tipo o di migliorare ulteriormente le performance delle interrogazioni, i server OLAP (database multidimensionali) possono precalcolare le possibili combinazioni analitiche e memorizzarle fisicamente in un file binario (con esplosione delle dimensioni), tool di analisi appositi possono interrogare i dati sfruttando puntatori che indicano la posizione del dato precalcolato anziché attendere i tempi di elaborazione del motore database. I server OLAP possono memorizzare i dati con diverse modalità utilizzando strutture relazionali (ROLAP) o multidimensionali (MOLAP), per database smisurati (centinaia di giga) spesso si utilizza una modalità ibrida (HOLAP).

Architettura per il Data Warehousing Sorgenti esterne Base dati operazionali Sorgenti dei dati Monitoraggio e Amministrazione Metadati E T L Enterprice Data Warehouse ETL Data Mart Strumenti di analisi Analisi dimensionali Visualizzazioni Data mining

Data mart Un Data mart è un raccoglitore di dati specializzato in un particolare soggetto. Contiene un'immagine dei dati che permette di formulare strategie sulla base degli andamenti passati. Collocato a valle di un DWH, è alimentato a partire da esso, di cui costituisce, in pratica, un estratto. Detto in termini più tecnici, un DM è un sottoinsieme logico o fisico di un DWH di maggiori dimensioni. La differenza fondamentale consiste nel fatto che la creazione del Data warehouse avviene in maniera generalizzata per poi venire incontro alle specifiche esigenze, mentre il Data mart viene generalmente creato per venire incontro ad un'esigenza specifica e già determinata. La necessità di creare un sistema separato per il DM rispetto al DWH può riassumersi nelle seguenti motivazioni: La necessità di utilizzare un diverso schema. Migliorare le performance separando il computer dedicato. Garantire una maggiore sicurezza dovendo autorizzare l'accesso ad un insieme minore di dati

Progettazione di un DWH [1\2] La progettazione di una DWH è diversa da quella di una DB operazionale; alcuni elementi da considerare in fase d’analisi sono sicuramente: Limitata frammentazione (denormalizzazione): l’analisi ha bisogno di una visione sintetica dei dati Nella progettazione sarà importante mettere in evidenza gli aspetti comuni Bisogna associare a ciascuna entità un significato che corrisponda all’intuizione dell’utente Fondamentale il ruolo dei metadati nel guidare all’uso del sistema Attività principali: analisi delle sorgenti informative esistenti integrazione progettazione (concettuale, logica e fisica)

Progettazione di un DWH [2\2] Requisiti dell’utenza Basi dati aziendali Altre sorgenti informative Selezione delle sorgenti informative Traduzione di un modello concettuale comune Analisi delle sorgenti informative Analisi Integrazione di schemi concettuali Integrazione Progettazione concettuale Progettazione logica Progettazione fisica Progettazione

Strumenti utili al ciclo di vita di un DWH Strumenti per la qualita’ dei dati: per la migrazione Trasformano e riformattano i dati dalle diverse fonti per la pulizia (scrubbing) Usano la conoscenza del dominio per pulire e omogeneizzare es. <jerry l. jonson, 16 clarke st., altuna, pa> = <gerry l. johnson, 16 clark street, altoona, penn> ??? per il controllo (auditing) Scoprono regole e relazioni tra i dati e ne verificano il rispetto Strumenti per il caricamento dei dati verificano violazioni di integrità referenziale; ordinano, aggregano, costruiscono dati derivati ,indici e altri percorsi di accesso.

L’integrazione delle sorgenti informative ha prodotto una descrizione globale del patrimonio informativo aziendale. Questo è però solo il risultato dell’integrazione di dati operazionali e non descrive necessariamente tutti i dati di interesse per il DWH. La progettazione di un DWH comprende tre fasi: concettuale completare la rappresentazione dei concetti dimensionali necessari per l’analisi ad esempio, dati storici e geografici logica identificare il miglior compromesso tra la necessità di aggregare i dati e quella di normalizzarli fisica individuare la distribuzione dei dati e le relative strutture di accesso

Strategie di progetto Approccio top-down: Interessante perché garantisce la coerenza interna del progetto Spesso fallimentare perché impresa lunga e ardua che scoraggia l’utenza L’analisi contemporanea di tutte le fonti informative è compito molto complesso La previsione contemporanea delle esigenze informative di tutti gli utenti è difficile e rischia di paralizzare il processo Approccio bottom-up: Costruzione incrementale assemblando più data mart Si abbina a tecniche di prototipazione veloce Incoraggia l’utenza che vede velocemente il prodotto operativo

Data mining La Statistica, il campo della matematica applicata connesso con l'analisi dei dati, può essere definita altrimenti come "estrazione di informazioni utili da insiemi di dati". Il concetto di data mining è analogo. L'unica differenza è che questa recente disciplina ha a che fare con cospicui insiemi di dati. In sostanza il data mining è l’analisi matematica eseguita su database di grandi dimensioni". Il termine data mining è diventato popolare nei tardi anni '90 come versione abbreviata della definizione appena esposta. Oggi il data mining ha una duplice valenza: Estrazione, con tecniche analitiche all'avanguardia, di informazione implicita, nascosta, da dati già strutturati, per renderla disponibile e direttamente utilizzabile; Esplorazione ed analisi, eseguita in modo automatico o semiautomatico, su grandi quantità di dati allo scopo di scoprire pattern (schemi) significativi. In entrambi i casi i concetti di informazione e di significato sono legati strettamente al dominio applicativo in cui si esegue data mining, in altre parole un dato può essere interessante o trascurabile a seconda del tipo di applicazione in cui si vuole operare.

Business Intelligence Architettura DWH – B.I. Sistemi di Strategic Performance Management Business Intelligence Modelling, costruzione scenari e simulazioni Data Mining (Knowledge discovery) Analisi multidimensionale ed interattiva dei dati (Sist. OLAP) Interrogazione puntuale del DB e report DataMart Marketing DataMart Produzione DataMart … Data Warehouse Metadati Altri sistemi di tipo operativo Sistemi esterni (Portali, DB, ecc) Strumento di Estrazione, Trasformazione, Caricamento e Modellazione dei Dati (ETL tools) Sistemi gestionali (Tradizionali o ERP) (Sistemi OLTP) Produzione Distribuzione Marketing …

Ricapitolando Un DWH è un sistema di Business Intelligence basato su una base dati relazionale. Si tratta di una base dati separata rispetto al sistema gestionale, strutturata per contenere una replica parziale del sistema informativo aziendale in un formato che renda ottimale l’analisi delle informazioni. Viene adottando per rispondere a queste esigenze: Trasformare i dati in informazioni Informazioni giuste al momento giusto alle persone giuste Integrazioni tra fonti dati eterogenee Elevata profondità storica e Indipendenza dai sistemi sorgente Pulizia dei dati e Certificazione dei dati a tutti i livelli Gestione per eccezioni dei processi aziendali