SEGMENTAZIONE PER OBIETTIVI: CHAID

Slides:



Advertisements
Presentazioni simili
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Apprendimento Automatico Apprendimento supervisionato
Variabili casuali a più dimensioni
Reti Neurali Alessandro Mazzetti.
Primo sguardo a metodi multivariati per l'analisi del ttH
Quali sono i clienti che l’azienda è in grado di soddisfare?
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Test Statistici Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°5.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Reti Neurali: studi sull'intelligenza artificiale
Valutazione delle ipotesi
Apprendimento di funzioni algebriche
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Gli Indici di Produttività di Divisia
ALBERI DECISIONALI prima parte
ALBERI DECISIONALI terza parte
Processi Aleatori : Introduzione – Parte I
Reti neurali naturali ed artificiali
Metodi di ricerca in Psicologia
Metodi della ricerca in Psicologia
Realizzazione e caratterizzazione di una semplice rete neurale per la separazione di due campioni di eventi Vincenzo Izzo.
CORSO DI MODELLI DI SISTEMI BIOLOGICI LAUREA IN INGEGNERIA CLINICA E BIOMEDICA.
BIOINGEGNERIA S. Salinari Lezione 4.
TECNOLOGIE DEI SISTEMI DI CONTROLLO
BIOINGEGNERIA S. Salinari Lezione 7. RETI CON APPRENDIMENTO SUPERVISIONATO A DISTANZA Nello sviluppo delle reti neurali si è proceduto indebolendo via.
Alternative al Paradigma Rappresentazionale
Modelli simulativi per le Scienze Cognitive Paolo Bouquet (Università di Trento) Marco Casarotti (Università di Padova)
Modelli simulativi per le Scienze Cognitive Paolo Bouquet (Università di Trento) Marco Casarotti (Università di Padova)
Modelli simulativi per le Scienze Cognitive
Modelli simulativi per le Scienze Cognitive
Reti Neurali Ricorrenti
Intelligenza Artificiale Algoritmi Genetici
Intelligenza Artificiale
Apprendimento Automatico Apprendimento non supervisionato:
In contrapposizione con i metodi convenzionali (hard computing), le tecniche di soft computing non si basano su procedimenti esprimibili in forma chiusa.
APPLICAZIONI DI INTELLIGENZA ARTIFICIALE ALLA MEDICINA
RETI NEURALI ARTIFICIALI
STATISTICA PER LE DECISIONI DI MARKETING
STATISTICA PER LE DECISIONI DI MARKETING
STATISTICA PER LE DECISIONI DI MARKETING
DATA MINING PER IL MARKETING
DATA MINING PER IL MARKETING
Perceptron. è la somma effettuata sul nodo i-esimo dello strato j n è il numero di nodi dello strato j-1 è l'output proveniente dal nodo k-esimo dello.
Rete di Hopfield applicata al problema del TSP Federica Bazzano
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Analisi Bivariata: Test Statistici
La regressione II Cristina Zogmaister.
La statistica.
ALGORITMI Un algoritmo (detto anche procedura, prescrizione, processo, routine, metodo) è un insieme di regole (dette anche direttive o istruzioni) che,
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
La verifica d’ipotesi Docente Dott. Nappo Daniela
L’analisi del contenuto Doppia funzione dell’analisi del contenuto: -Può essere un tipo di ricerca specifico -Può essere una tecnica di ricerca Come TECNICA.
RETI NEURALI - 2.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Intelligenza Artificiale
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Intelligenza Artificiale Reti Neurali
DATA MINING.
APPROSSIMAZIONE DI FUNZIONI
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
DATA MINING PER IL MARKETING Andrea Cerioli Sito web del corso GLI ALBERI DI CLASSIFICAZIONE Introduzione alla metodologia Zani-Cerioli,
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
ALGORITMO PER IL CALCOLO DELLA RADICE QUADRATA DI UN NUMERO METODO DI NEWTON Carlo Platella
REALIZZAZIONE DI UN SISTEMA DI CLASSIFICAZIONE Prof. Roberto Tagliaferri Studente: Ragognetti Gianmarco Corso di Reti Neurali e Knowledge Discovery A.A.
Esercitazione N°5 Approssimazione di Funzioni. Esercizio 1 Costruzione di una rete RBF Il metodo più semplice per approssimare una funzione mediante reti.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
Self-Organizing Map (SOM Kohonen, 1981) è una tecnica di visualizzazione dei dati multidimensionali SOM è una mappa mono- (bi-)dimensionale che rappresenta.
Transcript della presentazione:

INDICE DELL’INCONTRO Analisi di segmentazione per Obiettivi La segmentazione ad Albero: Chaid Cenni alle Reti Neurali

SEGMENTAZIONE PER OBIETTIVI: CHAID perché la Segmentazione ad Albero?... Consideriamo per esempio le domande d4-13 tot del file dati caffarel.sav, vale a dire la spesa che ciascun intervistato sarebbe disposto a sostenere per acquistare il gianduiotto. Relativamente alle variabili socio demo possiamo evidenziare delle differenze significative? Se consideriamo il gradimento per il prodotto (dom 4_6) e/o per la confezione (dom 4_7) e/o il percepito per la marca Caffarel (dom 4_10) e/o per il giunduitto stesso (dom 4_14), quali conclusioni possiamo trarre relativamente al gradimento complessivo? Proviamo in base a quanto visto sino ad ora a procedere …… (analisi bivariate, multivariate – regressione-….)

SEGMENTAZIONE PER OBIETTIVI: CHAID Il metodo CHAID permette di analizzare TUTTI gli incroci possibili evidenziandone solo quelli significativi Si basa su una procedura iterativa: nella prima fase, la popolazione viene divisa in due o più gruppi sulla base della variabile esplicativa più significativamente legata alla variabile dipendente prescelta ; ciascuno di questi gruppi ottenuti nella prima fase viene ulteriormente diviso in sottogruppi più piccoli sulla base delle rimanenti variabili esplicative. Il processo di divisione termina quando non possono più essere individuati predittori statisticamente significativi ; i sottogruppi finali (segmenti) vengono quindi rappresentati in un diagramma ad albero.

SEGMENTAZIONE PER OBIETTIVI: CHAID I segmenti individuati sono mutuamente esclusivi ed esaustivi. In altre parole, i segmenti non si sovrappongono e ciascuna unità della popolazione è contenuta in un unico segmento. Dal momento che ogni segmento è definito da combinazioni delle variabili esplicative, è possibile riclassificare ogni osservazione (azienda/clienti/prospect) nel segmento appropriato semplicemente conoscendo tali variabili

SEGMENTAZIONE PER OBIETTIVI: CHAID I segmenti individuati sono mutuamente esclusivi ed esaustivi. In altre parole, i segmenti non si sovrappongono e ciascuna unità della popolazione è contenuta in un unico segmento. Dal momento che ogni segmento è definito da combinazioni delle variabili esplicative, è possibile riclassificare ogni osservazione (azienda/clienti/prospect) nel segmento appropriato semplicemente conoscendo tali variabili Da un punto di vista marketing l’impiego di tale tecnica risulta molto interessante per “studiare/individuare” sottoinsiemi di clienti – nell’accezione più ampia del termine – latenti, ossia rappresentati come risultato dell’analisi congiunta di più variabili. Esempio: sempre con riferimento al gianduiotto Caffarel analizziamo il prezzo che gli intervistati sarebbero disposti a spendere file: dati Caffarel – questionario Caffarel sintassi: CHAID_DESCRITTIVA.sps

SEGMENTAZIONE PER OBIETTIVI: CHAID Esempio: proviamo quindi a rispondere alle domande precedenti file caffarel.sav, variabili d4_13tot d4_6_1- d4_6_7, d4_7_1-d4_7_2, d4_10_1-d4_10_9, d4_14_1-d4_14_7, UOMO, SIGLE, BAMBINI, LAUREA, MEDIE, età. Come e perchè ricodificate le variabili socio-demo.

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali Le reti neurali traggono ispirazione dalle scienze biologiche. Si tratta infatti di un’insieme connesso di unità che agiscono in modo equivalente ad un insieme di neuroni biologici. L’origine dello studio delle reti neurali si può far risalire alla fine degli anni ‘40, quando D.O. Hebb propose una legge di apprendimento che sta alla base delle modello di analisi delle reti neurali. Durante gli anni ‘50 e ‘60 si assistette ad una vera e propria esplosione di studi relativi alle reti neurali, studi che portarono al Perceptron, che sembrò rappresentare la risposta ottimale alla domanda che maggiormente stava a cuore dei ricercatori dell’epoca: come poter riprodurre artificialmente l’intelligenza umana. In realtà si trattò di una pura illusione; infatti tale modello, il Perceptron, era in grado solo di riprodurre alcune capacità del cervello umano. Per esempio risultò particolarmente efficacie nelle previsioni meteorologiche. Per circa un ventennio le reti neurali restarono un dominio per pochi studiosi almeno fino alla metà degli anni ‘80; quando grazie ai nuovi algoritmi (Back-propagation, 1986), ma soprattutto allo sviluppo delle capacità di calcolo degli elaboratori, si tornò a parlare delle possibili applicazioni delle reti neurali. Le reti neurali sono state originariamente create con l’intento di studiare il comportamento del sistema nervoso. Come è noto, tale sistema è costituito da un numero elevatissimo di cellule nervose (neuroni), collegati da connessioni dette sinapsi. Ogni neurone è in grado di eccitarsi e di trasmettere uno stimolo elettrico in risposta alle combinazioni di stimoli che riceve dagli altri neuroni. La trasmissione degli stimoli dipende dalla natura delle sinapsi e tale natura si modifica durante la crescita per effetto dell’apprendimento.

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali La struttura generale La struttura generale di una rete neurale è costituita da una serie di nodi di entrata (unità di input), una o più serie di nodi intermedi (livelli e unità nascoste) e una serie di nodi di uscita (unità di uscita). Qualora non esistano livelli nascosti si parlerà di percettroni, altrimenti di reti multistrato.

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali Un modello di rete neurale viene specificato attraverso 5 caratteristiche:   il modello generale del neurone l’architettura della rete la modalità di attivazione dei neuroni il paradigma di apprendimento la legge di apprendimento 1) Il modello generale del neurone: il neurone viene specificato attraverso: canali di ingresso: sono le fonti di informazioni del neurone; pesi delle connessioni: riproducono le sinapsi del cervello umano e hanno il compito di mediare il segnale trasmesso da un neurone ad un altro; w(ij) funzione di attivazione: associa attraverso una funzione (solitamente una somma) i pesi e i segnali in arrivo al neurone; NETj = funzione di uscita: rappresenta il reale valore di uscita dal neurone verso il neurone successivo (può essere una funzione lineare o no e può contenere un valore di soglia per cui il neurone trasmette l’informazione solo se tale valore viene superato). OUT = f’(NET)

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali 2) L’architettura della rete: è definita in funzione del tipo di neuroni e di connessioni esistenti fra gli stessi. Si parla di reti stratificate quando i neuroni sono connessi solo con quelli dello stato adiacente; viceversa si ha una rete cosiddetta completamente connessa quando ogni neurone è connesso con qualunque altro neurone della rete. Le più usate in ambito di previsionale sono quelle stratificate. RETI MULTISTRATO In relazione al numero ottimale di strati nascosti in generale 1o 2 strati risultano più che sufficienti; per quanto riguarda il numero dei nodi per ciascun strato in letteratura vengono forniti diversi proposte : - Media tra il numero di nodi di input e nodi di output - Radice quadrata della somma del numero dei nodi di input e di output - Metà del numero dei nodi di input -.... esperienza e soprattutto tante prove! In generale il secondo livello nascosto ha un numero di nodi superiori al primo.

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali 3) La modalità di attivazione dei neuroni: stabilisce il modo in cui i neuroni vengono attivati. Esistono due tipologie di attivazione dei neuroni, il modo parallelo (sincrono) in cui ad ogni istante t i neuroni si attivano e al tempo t+1 modificano il loro stato; il modo sequenziale (asincrono) in cui i neuroni vengono aggiornati uno alla volta. In generale la funzione di attivazione è quella funzione attraverso la quale i neuroni trasmettono le informazioni ricevute dai neuroni “precedenti” (NET = )ai neuroni “successivi” (OUT = f(NET)). Le principali funzioni di attivazione impiegate sono quella lineare, quella a soglia, quella logistica (in assoluto la più usata) la gaussiana e la tangente iperbolica.  

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali 4) Il paradigma di apprendimento: caratterizza il modo in cui una rete apprende. Esistono 3 tipologie di apprendimento: supervised learning (apprendimento con supervisione mediante esempi), unsupervised learning (apprendimento senza sueprvisione) e reinforcemente learning (apprendimento mediante rinforzo).   In generale un paradigma di apprendimento può essere definito come:  inizializzazione dei pesi delle connessioni (casuale) sottomissione alla rete di un pattern di input e corrispondente output desiderato calcolo del output della rete aggiornamento dei pesi riproposta del pattern di input fino a quando l’errore non è inferiore ad prefissato valore.

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali La rete adatta i pesi in funzione della differenza fra il valore di output ottenuto e quello desiderato   d = Y* - Y il paradigma è soddisfatto se d è moltiplicato per il valore di ciascun input x(i) e questo prodotto e aggiunto a ciascun peso. Negli anni ‘70 e ‘80 viene proposta l’algoritmo di apprendimento per reti multistrato denominato : Back-propagation In generale gli strati nascosti vengono addestrati ri-propagando all’indietro l’errore rilevato sull’output La funzione di attivazione impiegata è quella logistica (sigmoide) per cui Δw(ij) = η*δ (j)*x(i) ove δ è legato alla differenza tra il valore stimato e quello ottenuto dal modello (errore)

SEGMENTAZIONE PER OBIETTIVI: le Reti Neurali Alcune considerazioni relative all’algoritmo della Back-propagation:   i pesi iniziali, scelti in modo casuale, non devono essere troppo elevati è opportuno scegliere un tasso di apprendimento h alto all’inizio per favorire l’apprendimento diminuendone poi il valore con il procedere della fase di apprendimento. in alternativa si può introdurre un altro parametro (Momentum = a<1) cosicché il cambiamento dei pesi risulti proporzionale al cambiamento precedente: Δw(ij) = η*δ (j)*x(i) + α*wn-1(ij) Per ottimizzare l’algoritmo nel 1987 è stato proposto di normalizzare i dati in entrata nell’intervallo -1/2;+1/2 La Scatola Nera: il principale limite all’impiego di tale metodologia nell’analisi dei dati di marketing è legato alla difficoltà di “spiegare” il comportamento di una rete. Infatti una volta ottenuta una struttura che sia in grado non solo di “fittare” al meglio l’insieme dei dati forniti, ma anche di generalizzare interpretando delle nuove osservazioni, resta sempre il problema di poter valutare il ruolo delle diverse variabili indipendenti. A differenza delle tecniche statistiche non è possibile, se non in via approssimata, attribuire un peso alle diverse variabili esplicative.