La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Business Intelligence Dai dati alle decisioni. Modulo 4 Come reperire e trattare i dati Sono sbalordito dalla gente che vuole conoscere l'universo, quando.

Presentazioni simili


Presentazione sul tema: "Business Intelligence Dai dati alle decisioni. Modulo 4 Come reperire e trattare i dati Sono sbalordito dalla gente che vuole conoscere l'universo, quando."— Transcript della presentazione:

1 Business Intelligence Dai dati alle decisioni

2 Modulo 4 Come reperire e trattare i dati Sono sbalordito dalla gente che vuole conoscere l'universo, quando è già abbastanza difficile non perdersi nel quartiere cinese. (Woody Allen)

3 Architettura e ruolo di un data warehouse Vediamo lo schema concettuale di un data warehouse: William H. Inmon, il primo a parlare esplicitamente di data warehouse, lo definisce come una raccolta di dati integrata, orientata al soggetto, variabile nel tempo e non volatile di supporto ai processi decisionali. Metadati Logistica Marketing Analisi delle prestazioni Dati esterni Sistemi Transazionali Strumenti ETL OLAP Analisi dei cubi Analisi esplorativa serie storiche Datamining ottimizzazione Data warehouse Bilancio ERP CRM

4 Funzioni per manipolare il testo in Excel DESTRA SINISTRA LUNGHEZZA STRINGA.ESTRAI

5 Data warehouse Per DATA WAREHOUSE si intende un magazzino dati che contiene tutte le informazioni passate di una azienda. Tali informazioni devono essere immagazzinate in un database disegnato per favorire efficienti analisi dei dati e reporting dei dati e, usualmente,non per gestire dati correnti. Questi magazzini, conservano grandi quantità di dati che vengono solitamente suddivise in unità logiche più piccole, chiamati DATA MART, che sono i database che poi vengono utilizzati dai vari utenti aziendali. Il datawarehouse è quindi un database dove confluiscono tutte le informazioni aziendali e che attraverso tecniche olap vengono messe insieme per creare un punto unico dove andare a reperire le informazioni. Le fonti di questi dati sono solitamente i sistemi transazionali come ad esempio i sistemi ERP e CRM, e i dati esterni che possono essere conloro integrati. Architettura e ruolo di un data warehouse ERP = Enterprise Resource PlaningCRM = Customer Relationship Mnagment

6 Data warehouse Riassumendo : Concettualmente Formalmente Architettura e ruolo di un data warehouse Il data warehouse è una casa per i dati di seconda mano generati da tutte quelle attività usuali dellazienda, o appositamente ricercate Il data warehouse è un archivio stand- alone (repository) di informazioni integrate da tutti i database aziendali.

7 …dal DATA WAREHOUSE dobbiamo ottenere dei cubi dati da poter analizzare con le tecniche tipiche della Business Intelligence. Cubo dati OLAP

8 OLAP Cubo Dati Architettura di un cubo OLAP Stringhe ( Record ) multidimensionali di dati. I record di dati sono indicizzati da elementi (Periodi, Prodotti,…), costituiti non da numeri.

9 OLAP Architettura di un cubo OLAP I benefici della tecnologia OLAP Mostra come i risultati sono funzione dei diversi indici di prestazioni ( Key Drivers ). Dare la possibilità agli utenti di creare i loro propri record. Scegliere il livello di dettaglio che si vuol vedere. Navigando allinterno del database OLAP da la sensazione della dinamicità del business

10 OLAP Architettura di un cubo OLAP Alchimia dellAnalisi Lutilizzo della Business Intelligence non è solo un software. Lutilizzo della Business Intelligence deve anche includere la conoscenza della progettazione delle misure e la comprensione dei processi analitici di pertinenza delle varie funzioni aziendali. Ci sono tecniche e strategie per disegnare ( progettare ) misure OLAP.

11 OLAP Architettura di un cubo OLAP Elementi di Analisi Le classiche applicazioni di Business Intelligence nei cubi OLAP. Attributi di suddivisione. Dimensionamento dei profili. Conteggio delle misure Manipolazione della misura tempo ( periodo ). Altro…

12 Modulo Database Come immagazzinare i dati La sisumanità del computer sta nel fatto che, una volta programmato e messo in funzione, si comporta in maniera perfettamente onesta. (Isaac Asimov)

13 Database Tabelle - insieme di record e campi che si identificano con le entità del database. Relazioni (o join ) - Sono le relazioni tra più tabelle che permettono di associare campi di tabelle diverse ad uno stesso record. Si possono suddividere in tre tipologie. Uno a uno - Se ad ogni elemento di una entità di una tabella può corrispondere una ed una sola delle entità di unaltra tabella. Es. Nazione 1_________1 Capitale Uno a molti - Se ad ogni elemento di una entità di una tabella possono corrispondere più elementi e a questultima tabella possiamo associare solo un elemento della prima. Es. Squadra di calcio 1_________ Calciatore Molti a molti - Se ad ogni elemento di una entità possiamo far corrispondere più elementi di unaltra tabella e viceversa. Es. Autore _________ Libro Architettura di un database

14 Database Query – una tabella che rappresenta una selezione delle informazioni della tabella principale che risponde a particolari richieste (vincoli o filtri). Maschere – utilizzato per immettere, modificare e visualizzare record di dati disposti in un layout personalizzato. Report – per stampare i record disposti in un layout personalizzato. Un report può essere utilizzato per raggruppare record e per visualizzare i totali parziali e i totali complessivi dellintero report. Architettura di un database

15 Modulo 5 Customer Profiling e Data Mining Togli la causa e leffetto sparirà. (Miguel De Cervantes)

16 Customer Profiling Sistema informativo in grado di fornire, per ogni singolo cliente, un dettaglio del suo comportamento dacquisto attuale e atteso. Siamo identificati attraverso la transazione. B ANCA N. C ONTO A SSICURAZIONE N. P OLIZZA C ASA E DITRICE N.A BBONAMENTO G AS N. C ONTATORE T ELEFONO N. T ELEFONO TRANSAZIONE

17 Customer Profiling Avere come obbiettivo il monitoraggio della transazione è un sistema naturale di controllo se vogliamo aumentare lefficienza della P RODUZIONE e / o D ISTRIBUZIONE, ma se lobbiettivo è riconoscere, soddisfare e mantenere fedele il cliente dobbiamo cambiare punto di vista. Rapporto personale e sulla relazione. M ETODI DI ESPOSIZIONE DEI PRODOTTI T ESSERE F EDELTÀ RELAZIONE

18 Struttura di un sistema di customer profiling Le informazioni di cui unazienda può disporre sono descrittive e comportamentali. Tali informazioni sono solitamente disponibili sui sistemi amministrativi e vanno quindi integrati aumentando linterattività tra azienda e cliente.

19 Struttura di un sistema di customer profiling Persone Programmi Premio Aziende dati anagrafici socio-economici socio-demografici settore dimensione localizzazione comportamento di acquisto comportamento duso descrittive comportamentali

20 Struttura di un sistema di customer profiling Esempio Transazioni in banca. N. transaz.Cliente Conto 120A Conto 25B Conto 35C Conto 410B Conto 55B Conto 65B 20 transazione a settimana 10 transazione a settimana 5 transazione a settimana Focus sul Cliente B A C Focus sulla transazion e

21 Struttura di un sistema di customer profiling Bisogna quindi pensare a degli indici predittivi del comportamento futuro. Lufthansa Audi Vailant

22 Indici predittivi Indice della probabilità di abbandono Indice del valore attuale netto Indice della probabilità di frode e morosità Indice della probabilità di acquisto -Telefonia -Quattroruote -Finanziamenti -Amazon

23 Indici predittivi probabilità di abbandono valore attuale netto probabilità di frode probabilità di acquisto Tali indici vengono calcolati utilizzando come base il comportamento in un particolare periodo trascorso e applicando degli algoritmi di DATA MINING DATI STORICI + ESEMPI GIA NOTI = MODELLI PREVISIONALI Si parte quindi dai dati storici che utilizziamo per trovare indici applicabili ai nuovi dati. Possiamo così classificare Direct Marketing Punti Vendita Venditori efficacia Customer Services Agenti per leffettivo potenziale affidato

24 Esempio di Customer Profiling Reddito Debito Concediamo il prestito al cliente? debito pagato debito non pagato

25 Esempio di Customer Profiling Dobbiamo cercare un modello (D ATA M INING ) che mi possa assistere alla decisione: -Media -Iperpiano -Iperpiani paralleli -Clustering s If ( red < s ) Then ( debito non pagato ) s If (a red + b red < s ) Then ( debito non pagato ) b a (Non Supervisionato) (Supervisionato)

26 Data Mining

27 Il D ATA M INING si pone come processo di selezione, esplorazione e modellazione di grosse masse di dati, al fine di scoprire strutture, regolarità o relazioni non note a priori, e allo scopo di ottenere un risultato chiaro e utile al proprietario del database. Le regole statistiche tradizionali di analisi dei dati (ad esempio la regressione) vengono utilizzate per cercare conferma a fatti che lutente ipotizza o già conosce. Se il database è molto grande non si riesce ad avere una visione completa da cui estrapolare una regolarità e simmetrie. Lidea è che tali strutture non sfuggano ad una elaborazione automatica.

28 Tra le tecniche più diffuse troviamo: Clustering Reti Neurali Reti Bayesiane Alberi di decisioni Apprendimento genetico Analisi delle associazioni Tutte le tecniche comprendo metodi e algoritmi. Clustering con lalgoritmo k-means Data Mining

29 Clustering con lalgoritmo k-means Data Mining

30 Clustering (tecnica di Cluster Analysis) Esempio – Metodo k-means (k-medie) metodo partizionante A LGORITMO K - MEANS k-cluster record INPUTOUTPUT k funzione di media metrica

31 Clustering (tecnica di Cluster Analysis) 1. Scegliere un valore k=numero di cluster da determinare. 2. Scegliere in modo casuale k dati del detaset che saranno i (bari)centri del cluster. A LGORITMO K - MEANS k-cluster record INPUTOUTPUT k funzione di media metrica

32 Clustering (tecnica di Cluster Analysis) 3. Definire una metrica per calcolare la distanza dei punti dai centri. 4. Calcolare la media per ogni cluster. A LGORITMO K - MEANS k-cluster record INPUTOUTPUT k funzione di media metrica

33 Clustering (tecnica di Cluster Analysis) 5. Se le nuove medie sono identiche a quelle precedenti il processo termina; altrimenti utilizzare le nuove medie come centri dei cluster e ripetere i passi da 3. a 5. Solitamente si preferisce fermarsi quando siamo arrivati ad un errore quadratico predefinito. A LGORITMO K - MEANS k-cluster record INPUTOUTPUT

34 Clustering (tecnica di Cluster Analysis) Esempio su Excel

35 Algoritmi di Classificazione Valutati da Velocità Robustezza Scalabilità Interoperabilità Esempi di alberi di classificazione ALBERO BINARIOALBERO GENERICO Accetta Comunicazione Età Zona di residenza SI NO 45 >45 Nord Centro Sud Isole

36 Algoritmi di Classificazione Esempio di rete neurale Vettore di Input Vettore di Output x1x1 x2x2 x n-1 xnxn … f(x) Nodo di Output Nodi di Input Nodi Nascosti esempio…

37 Metodi Bayesiani di classificazione Metodo di Bayes è un metodo di inferenza statistica utilizzato per il calcolo delle probabilità a posteriori. Questi metodi hanno il vantaggio di giungere a descrizioni razionali anche quando non vi sono abbastanza informazioni. Esempio Banale - zona di residenza Esempio Complesso -

38 Esempio di probabilità a posteriori (probabilità a posteriori) A Londra in inverno piove nel 50% dei casi. A Londra è nuvoloso nell80% dei casi A Londra, quando piove è nuvoloso (100% dei casi) Oggi a Londra è nuvoloso, che probabilità cè che stia piovendo? Algoritmi di Classificazione Regola di Bayes (Teorema di Bayes) Ci sono 5 probabilità su 8 che a Londra piova!


Scaricare ppt "Business Intelligence Dai dati alle decisioni. Modulo 4 Come reperire e trattare i dati Sono sbalordito dalla gente che vuole conoscere l'universo, quando."

Presentazioni simili


Annunci Google