La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

La segmentazione a priori: CHAID Elena Pallini Elena Santi Elena Santi Francesco Bontempone Rosangelo Giampaolo Rosangelo Giampaolo Dott.ssa Elena Pallini.

Presentazioni simili


Presentazione sul tema: "La segmentazione a priori: CHAID Elena Pallini Elena Santi Elena Santi Francesco Bontempone Rosangelo Giampaolo Rosangelo Giampaolo Dott.ssa Elena Pallini."— Transcript della presentazione:

1 La segmentazione a priori: CHAID Elena Pallini Elena Santi Elena Santi Francesco Bontempone Rosangelo Giampaolo Rosangelo Giampaolo Dott.ssa Elena Pallini Dott.ssa Elena Santi Dott. Francesco Bontempone Dott. Rosangelo Giampaolo

2 Obiettivo dell’analisi Suddividere in gruppi omogenei un insieme di individui, intervistati presso i punti vendita COOP, in funzione delle loro caratteristiche in funzione delle loro caratteristiche socio-demografiche, comportamentali e di giudizio

3 Struttura del dataset Fonte statistica: Fonte statistica: interviste effettuate in punti vendita Coop osservazioni 3 classi di variabili: variabili socio-demografiche ed economiche punteggi di soddisfazione sul servizio di distribuzione e relative variazioni variabili “Coop”

4 Modello statistico test delChi-quadro Grado di omogeneità all’interno dei gruppi e di eterogeneità tra i gruppi è valutato con il test del Chi-quadro fattore di Bonferroni Significatività statistica normalizzata con il fattore di Bonferroni CHAID (Chi-squared Automatic Interaction Detection) Tecnica di segmentazione multipla CHAID (Chi-squared Automatic Interaction Detection)

5 “completo” Primo livello: data set “completo” Variabile target SOCIO SOCIO (sì / no) Variabili indipendenti 1. Prima fase: 1. Prima fase: Sono state incluse nell’analisi tutte le variabili 2. Seconda fase: 2. Seconda fase: Sono state incluse nell’analisi le variabili “a blocchi”

6 “non soci” Secondo livello: data set “non soci” Variabile target CANALE CANALE (iper / non iper) Variabili indipendenti 1. Prima fase: 1. Prima fase: Sono state incluse nell’analisi tutte le variabili 2. Seconda fase: 2. Seconda fase: Sono state incluse nell’analisi le variabili “a blocchi”

7 Alberi: impostazioni comuni Data set partizionato in: 70% Training Set 30% Validation Set 50 Minimo numero di osservazioni per foglia: 50 6 Massima profondità dell’albero: 6

8 Distribuzione variabile target SOCIO  Variabile target: SOCIO (sì / no)

9 Alberi 1° livello tutte le variabili variabili socio-demografiche ed economiche punteggi di soddisfazione variabili “Coop” SOCIO SOCIO (sì/no) (1) (2) 1)I risultati ottenuti sono identici a quelli con le sole variabili “Coop” 2)Le variabili considerate non hanno alcun valore esplicativo

10 SOCIO*** Punteggi di soddisfazione sul servizio di distribuzione e relative variazioni Punteggi di soddisfazione sul servizio di distribuzione e relative variazioni

11 Tasso di corretta classificazione 7 Il confronto tra le curve del training set e del validation set suggerisce di scegliere l’albero con 7 foglie finali 0,744 validation set 0,744 0,755 training set 0,755 SOCIO – Punteggi di soddisfazione e variazioni

12 Matrice di confusione  Il 3% dei “soci” sono malclassificati  Il 46% dei “non soci” sono malclassificati SOCIO – Punteggi di soddisfazione e variazioni

13 1° livello: Albero “soddisfazione” SOCIO Variabile target: SOCIO (sì / no) Variabili indipendenti: punteggi di soddisfazione e variazioni Data set completo

14 Segmenti finali: caratteristiche I “non soci” sono sensibili alle variazioni nei servizi per i prodotti no food Le promozioni inducono gli acquirenti a diventare “soci”

15 SOCIO*** Variabili “Coop” Variabili “Coop”

16 Tasso di corretta classificazione 5 Il confronto tra le curve del training set e del validation set suggerisce di scegliere l’albero con 5 foglie finali 0,871 validation set 0,871 0,884 training set 0,884 SOCIO – Variabili Coop

17 Matrice di confusione  Il 1% dei “soci” sono malclassificati  Il 22% dei “non soci” sono malclassificati SOCIO – Variabili Coop

18 1° livello: Albero “varCoop” SOCIO Variabile target: SOCIO (sì / no) Variabili indipendenti: variabili “Coop” Data set completo

19 Segmenti finali: caratteristiche Soci Coop “Contenti” (segmento 1) “Attenti alle promozioni” (segmento 4) Non soci “Attratti da Coop ma impossibilitati ad andarci” (segmento 2) “Non attratti da Coop ma costretti ad andarci” (segmento 3)

20 Distribuzione variabile target CANALE  Variabile target: CANALE (iper / non iper)

21 “non soci” Alberi 2° livello: data set “non soci” tutte le variabili variabili socio-demografiche ed economiche punteggi di soddisfazione variabili “Coop” CANALE (iper / non iper) (*) Le variabili considerate non hanno alcun valore esplicativo (*)

22 CANALE*** Tutte le variabili Tutte le variabili

23 Tasso di corretta classificazione 6 Il confronto tra le curve del training set e del validation set suggerisce di scegliere l’albero con 6 foglie finali 0,753 validation set 0,753 0,787 training set 0,787 CANALE – Tutte le variabili

24 Matrice di confusione  Il 63% dei frequentatori “iper” sono malclassificati  Il 5% dei frequentatori “non iper” sono malclassificati CANALE – Tutte le variabili

25 2° livello: Albero “ALL” CANALE Variabile target: CANALE (iper / non iper) Variabili indipendenti: tutte le variabili Data set: NON SOCI

26 Segmenti finali: caratteristiche 2 macro-zone Bolognaiper Bologna: i ricercatori di varietà scelgono l’iper Veneto, Romagna e Marche “non iper” Veneto, Romagna e Marche: i ricercatori di varietà scelgono il “non iper”

27 CANALE*** Punteggi di soddisfazione sul servizio di distribuzione e relative variazioni Punteggi di soddisfazione sul servizio di distribuzione e relative variazioni

28 Tasso di corretta classificazione 5 Il confronto tra le curve del training set e del validation set suggerisce di scegliere l’albero con 5 foglie finali 0,763 validation set 0,763 0,768 training set 0,768 CANALE – Punteggi di soddisfazione e variazioni

29 Matrice di confusione  Il 51% dei frequentatori “iper” sono malclassificati  Il 12% dei frequentatori “non iper” sono malclassificati CANALE – Punteggi di soddisfazione e variazioni

30 2° livello: Albero “soddisfazione” CANALE Variabile target: CANALE (iper / non iper) Variabili indipendenti: punteggi di soddisfazione e variazioni Data set: NON SOCI

31 Segmenti finali: caratteristiche Chi è molto interessato all’assortimento e alle promozioni frequenta l’ “iper” Chi è poco interessato all’assortimento frequenta il “non iper”

32 Conclusioni 3 alberi su 4 malclassificano una delle due modalità della variabile target con valori superiori al 40% Albero “varCoop” con variabile target SOCIO L’unico albero utilizzabile per l’analisi: Albero “varCoop” con variabile target SOCIO

33 Conclusioni insufficiente contenuto informativo del data set categorizzazione delle variabili non sufficientemente accurata nel caso di CANALE può essere dovuta anche allo sbilanciamento del campione rispetto al target I modelli hanno una scarsa capacità classificatoria. Perché? Possibili interpretazioni:

34 Variabili socio-demografiche ed economiche  Sesso  Età  Professione  Titolo di studio  Stato civile  Area di acquisto  Numero componenti famiglia  Numero minorenni  Numero percettori di reddito  Numero occupati  Numero auto possedute

35 Qualità del servizio  Generale  Prezzi  Promozioni  Assortimento  Personale, servizio  Pulizia, igiene  Qualità prodotti freschi  Reparto ortofrutta  Reparto carne  Reparto pane, pasticceria  Reparto salumi, formaggi e gastronomia  Reparto pesce fresco  Prodotti no-food N.B. Per ogni variabile sono stati rilevati sia la soddisfazione sul servizio che la relativa variazione rispetto al passato

36 Variabili “Coop”  Canale di vendita (IPER / NON IPER)  Socio (SI / NO)  Insegna  Numero soci in famiglia  Preferenza su Coop  Area di acquisto


Scaricare ppt "La segmentazione a priori: CHAID Elena Pallini Elena Santi Elena Santi Francesco Bontempone Rosangelo Giampaolo Rosangelo Giampaolo Dott.ssa Elena Pallini."

Presentazioni simili


Annunci Google