La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali LSA Knowledge Data Sources Warehouse Consolidated Data Prepared Data p(x) = 0.02.

Presentazioni simili


Presentazione sul tema: "Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali LSA Knowledge Data Sources Warehouse Consolidated Data Prepared Data p(x) = 0.02."— Transcript della presentazione:

1 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali LSA Knowledge Data Sources Warehouse Consolidated Data Prepared Data p(x) = 0.02 Data Mining Models Data Consolidation Selection and Preprocessing Data Mining & OLAP Cubes Interpretation and Evaluation 5 lezioni 2 lezioni 3 lezioni 4 lezioni OLAP 4 lezioni DM

2 Analisi OLAP (On-Line Analytical Processing) LSA - Laboratorio di Sistemi Informativi Economico-Aziendali Salvatore Ruggieri Dipartimento di Informatica, Università di Pisa

3 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Sorgente: OLAP ReportOLAP Report

4 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Datawarehouse, data marts, cubi Data warehouse OLAP Cubes Data mart: vista del dw di interesse ad un singolo processo di business Data mart ordini, clienti, contabilità, risorse umane, finanza Organiz. : datamart come collezione di tabelle fatti e dimensioni OLAP Cube : struttura di memorizzazione/visualizzazione dei fatti come celle di un ipercubo con un asse per ciascuna dimensione Data mart ordini: cubi su acquisti, vendite e magazzino

5 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Schema di un data mart: elementi Un fatto è un evento di interesse (vendite, spedizioni, acquisti) Specificato da attributi dimensioni e misure Una dimensione determina il contesto in cui è avvenuto il fatto fatto vendita: prodotto, negozio, cliente, tempo La dimensione può essere organizzata in una gerarchia di livelli dimensione tempo: gerarchia giorno esatto, mese, anno Ogni possibile contesto è detto membro della dimensione membri dim. tempo: 20 Feb. 2004, Febbraio 2004, 2004, ecc. Dimensioni comuni a più cubi/data mart sono dette condivise o conformate Una misura descrive quantitativamente il fatto fatto vendita: numero unità vendute, prezzo unitario, sconto Tabella dei fatti: collezione di fatti, uno per ogni riga della tabella, con colonne per le dimensioni e per le misure dei fatti Tabella di una dimensione: collezione dei membri della dimensione e delle loro relazioni gerarchiche

6 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Star Schema Date Month Year Date CustId CustName CustCity CustCountry Cust Sales Fact Table Date Product Store Customer unit_sales dollar_sales Yen_sales Measurements ProductNo ProdName ProdDesc Category QOH Product StoreID City State Country Region Store Chiavi Esterne

7 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Snowflake schema Date Month Date CustId CustName CustCity CustCountry Cust Sales Fact Table Date Product Store Customer unit_sales dollar_sales Yen_sales Measurements ProductNo ProdName ProdDesc Category QOH Product Month Year Month Year City State City Country Region Country State Country State StoreID City Store

8 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Gerarchie e aggregati di misure Nord CentroSud All MilanoTorinoFirenzeRomaNapoliPalermo All Zona Città Misura: numero di abitanti Aggregato: SUM Aggregato: AVG

9 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Gerarchie: bilanciate Nord CentroSud All MilanoTorinoFirenzeRomaNapoliPalermo All Zona Città CittàZona MilanoNord FirenzeCentro TorinoNord ……

10 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Gerarchie: non bilanciate Rossi BianchiNeri All TizioCaio Sempronio All Dirigenti Impiegati FiglioPadre TizioRossi NeriNULL SempronioBianchi ……

11 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Gerarchie: ragged Dollari Euro All New York Los Ang. ParisRome All Moneta Città San Marino

12 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Analysis Manager: editor di cubi

13 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Modello di memorizzazione ROLAP (Relational OLAP) : utilizza le funzionalità di unengine relazionale estesi in modo da permettere la materializzazione degli aggregati performance scalabilità MOLAP (Multidimensional OLAP) : array multidimensionale su disco/memoria efficiente su dati di dimensioni ridotte problemi di performance su dati sparsi HOLAP (Hybrid OLAP) : trade-off tra le due soluzioni precedenti fatti su tabella relazionale aggregazioni su array multidimensionale

14 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Analysis Manager: elab. di cubi

15 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Toscana Navigazione sum MilkBread…...sum Jan 96 …... sum Feb 96 Product Store Time Orange Roma Pisa Firenze All Products January 96, Pisa. Ogni dimensione contiene una gerarchia di valori una cella del cubo contiene valori aggregati (count, sum, max, etc.) LazioAll

16 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Navigazione di un cubo prodotto magazzino tempo Il manager regionale esamina la vendita dei prodotti in tutti i periodi relativamente ai propri mercati Il manager di prodotto esamina la vendita di un prodotto in tutti i periodo e in tutti i mercati Il manager finanziario esamina la vendita dei prodotti in tutti i mercati relativamente al periodo corrente e quello precedente Il manager strategico si concentra su una categoria di prodotti, unarea regionale e un orizzonte temporale medio

17 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Roll-up e drill-down Product Store Time All Time All Time Product All Drill-Down Roll-up Drill-Down Roll-up

18 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Slice and Dice Product Store Month Slice Product Store Month

19 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Altre operazioni Drill through: visualizza tutti i fatti relativi ad una cella del cubo Pivot: rotazione degli assi del cubo Drill across: collegamento ad altro cubo via dimensioni condivise ProdottiFornitoriClientiTempoStore VenditeAcquisti

20 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Analysis Manager: browsing

21 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Analysis Manager: misure calcolate

22 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Analysis Manager: misure calcolate Sintassi: EXP ::= Numeric | ( Member, Numeric ) Numeric ::= Measure | funzione_numeric(Parametri) | Numeric + Numeric | Numeric - Numeric | Numeric / Numeric | Numeric * Numeric Member ::= funzione_member(Parametri) Semantica: ( Member, Numeric ) lespressione Numeric è valutata sul membro Member ([Product].CurrentMember.Parent,[Measures].[Quantity]) è la misura Quantity valutata sul padre del membro corrente rispetto alla dimensione Product (ParallelPeriod([Time].[Year], 1), [Measures].[Quantity] ) è la misura Quantity valutata nello stesso periodo dellanno precedente

23 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Accesso ai dati multidimensionali API Microsoft OLE DB for OLAP, ADO.MD, ADO MD.NET Linquaggio MDX (MultiDimensional Expressions) JOLAP Java OLAP Interface, JSR-69JSR-69 Formato di interscambio XML for Analysis Client di visualizzazione Excel Explorer Data Analyser DBMiner …

24 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Excel

25 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Data Analyser

26 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali DBMiner 2.0

27 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Cubi e SQL: GROUP BY WITH CUBE -- fatti selezionati dalla clausola WHERE -- e aggregati dalla clausola GROUP BY -- su tutte le possibili (2^3) combinazioni di prodotto, dimensione e tempo SELECT F.product_id, F.customer_id, F.time_id, SUM(F.store_sales*F.unit_sales) FROM dbo.sales_fact_1997 AS F WHERE F.customer_id < 20 AND F.product_id < 200 GROUP BY F.product_id, F.customer_id, F.time_id WITH CUBE

28 Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali Cubi e SQL: GROUP BY WITH ROLLUP -- fatti selezionati dalla clausola WHERE -- e aggregati dalla clausola GROUP BY -- su prodotto, dimensione e tempo -- su prodotto e dimensione -- su prodotto -- su tutti I dati SELECT F.product_id, F.customer_id, F.time_id, SUM(F.store_sales*F.unit_sales) FROM dbo.sales_fact_1997 AS F WHERE F.customer_id < 20 AND F.product_id < 200 GROUP BY F.product_id, F.customer_id, F.time_id WITH ROLLUP


Scaricare ppt "Analisi multidimensionale Lab. Sistemi Informativi Economico-Aziendali LSA Knowledge Data Sources Warehouse Consolidated Data Prepared Data p(x) = 0.02."

Presentazioni simili


Annunci Google