Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoRoberta Napolitano Modificato 9 anni fa
1
Un’applicazione della segmentazione a priori: l’algoritmo CHAID
Di: Laura Croccia Daniele Medri Claudio Quevedo Romina Raimondi
2
OBIETTIVO:effettuare un’analisi di segmentazione a priori tramite l’algoritmo Chaid
Prima segmentazione effettuata utilizzando la variabile target “essere socio Coop” (50% del campione sono “soci”) Seconda segmentazione effettuata solo sui soci Coop utilizzando la variabile target “canale ipermercato o non ipermercato” (55 % del campione non usa il canale ipermercato)
3
Dataset “Coop” 7200 unità 42 variabili riguardanti:
- soddisfazione degli intervistati - variazione della soddisfazione degli intervistati - informazioni socio-demografiche - informazioni su variabili “Coop”
4
Opzioni utilizzate Nodo Tree del software Enterprise Miner
Numero massimo di split in ogni nodo: 3 ( scelta effettuata in base al numero di modalità delle variabili categoriche prese in considerazione) Minimo numero di osservazioni in una foglia: 20 ( per non avere foglie con poca numerosità)
5
Analisi di segmentazione su tutti le unità del dataset
Fase 1 Analisi di segmentazione su tutti le unità del dataset
6
Segmentazione con variabile target “Socio”
Costruiti 4 diversi alberi utilizzando: - tutte le variabili - le variabili socio-demografiche - le variabili sulla soddisfazione - le variabili “Coop” Dataset diviso in: - training set (70% del campione,5040 u.s.) - validation set (30% del campione,2160 u.s.)
7
Soddisfazione-Variazione
Problema di dipendenza tra soddisfazione e variazione Scarsa utilità dell’informazione apportata dalle variabili riguardanti la variazione perché manca un termina di confronto Test 2 per testare l’indipendenza tra soddisfazione e variazione della soddisfazione per i diversi aspetti del servizio Per tutti i confronti l’ipotesi nulla di indipendenza risulta rifiutata le variabili rappresentanti la variazione della soddisfazione sono state escluse dall’analisi
8
Segmentazione con tutte le variabili
Albero con 3 livelli di profondità e 5 nodi terminali Tasso di corretta classificazione=87% Le variabili ritenute significative per gli split sono “insegna” e “primo punto vendita”
9
Albero
10
Segmenti individuati Segmento1: soci Coop che scelgono Coop sia come insegna che come primo punto vendita (58% circa del campione). Segmento2: non soci Coop che scelgono Coop come insegna ma non come primo punto vendita (3% circa) Segmento3:esclusivamente non soci Coop che scelgono altre insegne e Coop come primo punto vendita (10%circa) Segmento4:esclusivamente soci Coop che scelgono altre insegne e non scelgono Coop come primo punto vendita (2% circa) Segmento5:coloro che presentano un valore mancante per la variabile insegna (26% circa)
11
Segmentazione con le variabili Socio-Demografiche
L’utilizzo delle suddette variabili non ha portato ad alcuna segmentazione. Si ritengono quindi ininfluenti queste variabili ai fini degli obiettivi anteposti. Si 50 % No 2520 1080 totale 5040 2160
12
Segmentazione con le sole variabili di soddisfazione
Albero con 4 livelli di profondità, 11 nodi terminali dei quali 4 relativi ai valori mancanti; Tasso di corretta classificazione=74% Le variabili ritenute significative per gli split sono “soddisfazione generale”, “soddisfazione verso promozioni” e “soddisfazione verso prodotti non alimentari”.
13
Albero
14
Segmentazione con le sole variabili di soddisfazione
Segmento1: soci che hanno dimostrato una soddisfazione alta a livello generale e per le promozioni (23% circa del campione); Segmento2: non soci che hanno dimostrato una soddisfazione alta a livello generale e in misura medio bassa verso le promozioni (32% circa); Segmento3: in maggioranza non soci che hanno rivelato soddisfazione generale alta ma non hanno dato giudizio di preferenza per le promozioni (1% circa); Segmento4: persone che hanno indicato una bassa soddisfazione generale, alta o bassa per le promozioni e media per i prodotti non alimentari; sono sia soci che non soci (12% circa); Segmento5: non soci che hanno indicato una bassa soddisfazione generale ma un’elevata soddisfazione per i prodotti non alimentari (1%); Segmento 6: non soci che hanno indicato una bassa soddisfazione generale alta o bassa soddisfazione per le promozioni e non hanno espresso opinioni sui prodotti non alimentari (2%); Segmento 7: non soci con bassa soddisfazione generale, soddisfazione media verso le promozioni e alta soddisfazione per i prodotti non alimentari (1%);
15
Segmentazione con le sole variabili di soddisfazione
Segmento8: soci con bassa soddisfazione generale, media soddisfazione verso le promozioni e i prodotti non alimentari (2% del campione) Segmento9: soci con bassa soddisfazione generale,media soddisfazione verso le promozioni e bassa soddisfazione verso i prodotti non alimentari (2%); Segmento10: non soci con bassa soddisfazione generale che non hanno espresso opinione nei confronti delle promozioni (1%); Segmento11: non soci che non ha espresso alcun giudizio di soddisfazione generale (24%).
16
Segmentazione con le sole variabili “Coop”
Albero con 3 livelli di profondità, 5 nodi terminali dei quali 1 relativo ai valori mancanti; Tasso di corretta classificazione=87% Le variabili ritenute significative per gli split sono “insegna” e “primo punto vendita”.
17
Albero
18
Segmentazione con le sole “Coop”
Segmento1: soci che scelgono l’insegna Coop e quest’ultima rappresenta il primo punto vendita (59% circa); Segmento2: non soci che scelgono l’insegna Coop ma per i quali non rappresenta il primo punto vendita (3% circa); Segmento3: esclusivamente non soci che scelgono altre insegne ma scelgono Coop come primo punto vendita (10% circa); Segmento4: esclusivamente soci Coop che scelgono altre insegne ma non Coop come primo punto vendita (2% circa); Segmento5: non soci Coop che non hanno dato giudizio di preferenza sull’insegna (26% circa).
19
Osservazione Utilizzando tutte le variabili e le sole variabili “Coop” si ottiene la medesima segmentazione, quindi deduciamo che queste variabili sono molto rilevanti per i nostri scopi.
20
Confronto tra gli alberi
Corretta Classificazione Tutte le variabili Variabili Socio-demografiche soddisfazione Coop Valore 0,87 0,5 0,74 0, 87 La segmentazione migliore risulta essere quella che utilizza tutte le variabili, mentre quelle socio-demografiche risultano inutili.
21
Analisi di segmentazione sui soci “Coop”
Fase 2 Analisi di segmentazione sui soci “Coop”
22
Segmentazione con variabile target “Canale”
3600 unità Costruiti 4 diversi alberi, utilizzando: - tutte le variabili - le variabili socio-demografiche - le variabili sulla soddisfazione - le variabili “Coop” Il Dataset “solo sui soci coop” è stato diviso in: - training set (70% del campione,2520 u.s.) - validation set (30% del campione, 1080 u.s.)
23
Segmentazione con tutte le variabili
Albero con 4 livelli di profondità e 11 nodi terminali Tasso di corretta classificazione=71 % Le variabili ritenute significative per la segmentazione sono la “zona geografica di appartenenza”, la soddisfazione sull’”assortimento”, il “pesce” e i “prezzi”
24
Albero
25
Segmentazione con tutte le variabili
Segmento1: Soci Coop il cui canale di vendita è ipermercato, residenti a Bologna con una bassa soddisfazione rispetto al pesce e all’assortimento(circa il 5%). Segmento2: Soci che comprano in ipermercato, residenti a Bologna che hanno una soddisfazione bassa per il pesce e media per l’assortimento (circa il 4%). Segmento3: Soci che comprano in ipermercato, residenti a Bologna con una bassa soddisfazione del pesce e alta per l’assortimento (circa il 3%). Segmento4: Soci che comprano in ipermercato, residenti a Bologna, hanno una soddisfazione del pesce alta o media (circa il 27%). Segmento5: Soci che NON comprano in ipermercato, residenti a Bologna, che non hanno dichiarato sulla soddisfazione del pesce e che hanno una soddisfazione dell’assortimento bassa (circa il 4%). Segmento6: Soci che NON comprano in ipermercato, residenti a Bologna, che non hanno dichiarato punteggi di soddisfazione per il pesce e con una media soddisfazione per l’assortimento (circa il 3%).
26
Segmentazione con tutte le variabili
Segmento7: Soci che comprano in ipermercato, residenti a Bologna, non dichiarano la soddisfazione sul pesce e che segnalano un’alta soddisfazione per l’assortimento(circa il 4%). Segmento8: Soci che NON comprano in ipermercato, residenti in Romagna-Marche con un’alta soddisfazione del pesce e dei prezzi (circa il 13%). Segmento9: Soci che NON comprano in ipermercato, residenti in Romagna-Marche con una soddisfazione alta del pesce e bassa dei prezzi (circa il 6%). Segmento10: Soci che NON comprano in ipermercato residenti nella zona Romagna-Marche che presentano valori missing per la soddisfazione riguardo al pesce (circa il 12%). Segmento 11: Soci che NON comprano in ipermercato e abitano nella Regione del Veneto (circa il 18%).
27
Segmentazione con le variabili Socio-Demografiche
Albero con 4 livelli di profondità e 6 nodi terminali Tasso di corretta classificazione= 68% Le variabili che risultano significative per la segmentazione sono la “zona di appartenenza geografica”, il “numero di familiari riceventi reddito” e “il numero di auto possedute”
28
Albero
29
Segmentazione con le variabili demografiche
Segmento 1: Soci che comprano in ipermercato,residenti a Bologna che hanno un auto (21% circa). Segmento 2: Soci che comprano in ipermercato, residenti a Bologna con più di un auto (23% circa). Segmento 3: Soci che comprano in ipermercato, residenti a Bologna, non hanno risposto sul numero delle auto che hanno più di una persona con reddito (2% circa). Segmento 4: Soci che NON comprano in ipermercato residenti a Bologna, non presentano un valore per il numero auto e hanno una persona con reddito (3% circa). Segmento 5: Soci che NON comprano in ipermercato che abitano nella zona Romagna-Marche (32% circa). Segmento 6: Soci che NON comprano in ipermercato che abitano in Veneto (18% circa).
30
Segmentazione con le variabili “Soddisfazione”
Albero con 4 livelli di profondità e 11 nodi terminali Tasso di corretta classificazione=68% Le variabili che risultano significative per la segmentazione sono la soddisfazione per “l’assortimento”, “il pesce”, “il personale”, “la carne” e “i prezzi”
31
Albero
32
Segmentazione con le variabili soddisfazione
Segmento 1: Soci che comprano in ipermercato con una soddisfazione del pesce e dei prezzi alta (24% circa). Segmento 2: Soci che NON comprano in ipermercato con una soddisfazione alta per il pesce, media per i prezzi e alta per la carne (6% circa). Segmento 3: Soci che usano il canale ipermercato, hanno un soddisfazione alta per il pesce, media per i prezzi e per la carne (11% circa). Segmento 4: Soci che comprano in ipermercato, hanno un soddisfazione alta per il pesce, media per i prezzi e bassa per la carne (6% circa). Segmento 5: Soci che NON comprano in ipermercato, molto soddisfatti del pesce poco soddisfatti dell’assortimento e dei prezzi (9% circa).
33
Segmentazione con le variabili soddisfazione
Segmento 6: Soci che NON comprano in ipermercato, con una soddisfazione alta per il pesce dell’assortimento media, bassa per i prezzi e media per l’assortimento (6% circa). Segmento 7: Soci che comprano in ipermercato, con una soddisfazione alta per il pesce, bassa per i prezzi e alta per l’assortimento (3% circa). Segmento 8: Soci che NON comprano in ipermercato, non dichiarano la soddisfazione per il pesce, con una bassa soddisfazione dell’assortimento (12% circa). Segmento 9: Soci che NON comprano in ipermercato che non dichiarano la soddisfazione rispetto al pesce e con una soddisfazione media per l’assortimento e (10% circa). Segmento 10: Soci che NON comprano in ipermercato che non dichiarano la soddisfazione rispetto al pesce, con un’alta soddisfazione per il personale e per l’assortimento (8% circa). Segmento 11: Soci che comprano in ipermercato, che non dichiarano sulla soddisfazione rispetto al pesce con una alta soddisfazione per l’assortimento e bassa o media per il personale(3% circa).
34
Segmentazione con le variabili “Coop”
Albero con 4 livelli di profondità e 4 nodi terminali Tasso di corretta classificazione=68% Le variabili che risultano significative sono “la zona di residenza” e “il primo punto vendita”
35
Albero
36
Segmentazione con le variabili coop
Segmento 1: Soci che NON comprano in ipermercato,risiedono a Bologna e che non usano Coop come primo punto vendita (2% circa). Segmento 2: Soci che comprano in ipermercato, residenti a Bologna per i quali Coop è primo punto di vendita (48% circa). Segmento 3: Soci che NON comprano in ipermercato e presentano come zona di residenza Romagna-Marche (32% circa). Segmento 4: Soci che NON comprano in ipermercato e risiedono in Veneto (18% circa).
37
Confronto tra gli alberi
Corretta Classificazione Tutte le variabili Variabili Socio-demografiche soddisfazione Coop Valore 0,71 0,68 La segmentazione migliore risulta essere quella che utilizza tutte le variabili
38
Osservazione: la questione “Pesce”
La variabile “soddisfazione per il pesce” risulta molto significativa nella segmentazione Per questo motivo si è ritenuto interessante andare ad osservare le caratteristiche socio-demografiche di coloro che rispondono alla soddisfazione riguardo al pesce e di coloro che non rispondono. Le distribuzioni di frequenza delle variabili socio-demografiche sono simili sia per coloro che rispondono sia per coloro che non rispondono. L’unica variabile che non si comporta nella stessa maniera è la “zona di residenza”. A Bologna sono presenti soprattutto coloro che consumano pesce, mentre in Veneto sono più presenti coloro che non lo consumano.
39
Fine
40
Test 2 di indipendenza 2 Variabile p-Value Generale 131,8635
<.0001 Prezzi 135,2667 Promozioni 184,3285 Assortimento 130,3224 Personale 166,8153 Pulizia 78,5411 Prodotti Freschi 117,5924 Ortofrutta 240,6919 Carne 231,4176 Pane 171,2372 Salumi 173,8725 Pesce 167,6061 Non_Food 90,6038
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.