La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

LA SEGMENTAZIONE DEL MERCATO Un caso di analisi CHAID COOP Emilio GagliardiDebora FacchiniGiulia Bravo

Presentazioni simili


Presentazione sul tema: "LA SEGMENTAZIONE DEL MERCATO Un caso di analisi CHAID COOP Emilio GagliardiDebora FacchiniGiulia Bravo"— Transcript della presentazione:

1

2 LA SEGMENTAZIONE DEL MERCATO Un caso di analisi CHAID COOP Emilio GagliardiDebora FacchiniGiulia Bravo

3 Strumento di analisi ed obiettivo CHAID Chi-squared Automatic Interaction Detection Tecniche di segmentazione a priori basate sull implementazione dell algoritmo CHAID ( Chi-squared Automatic Interaction Detection ) test 2 fattore di Bonferroni valutazione del grado di omogeneità entro i gruppi e di eterogeneità tra gli stessi tramite il test 2, la cui significatività statistica viene normalizzata con fattore di Bonferroni analisi di un collettivo oggetto di studio al fine di suddividere lo stesso in gruppi di consumatori omogenei al loro interno ma tra loro eterogenei sulla base di variabili maggiormente correlate ad uno specifico target, per poter così predisporre specifiche politiche di marketing OBIETTIVO

4 Analisi preliminare Dataset iniziale: 7200 osservazioni, ciascuna delle quali riferita ad unintervista effettuata in un PV Coop a soci Coop o ad individui appartenenti a nuclei familiari che comprendono soci Coop Variabili: - socio-demografiche ed economiche - punteggi di soddisfazione sul servizio di distribuzione e relative variazioni - variabili coop tutte le variabili sono state categorizzate per limitare l impatto della metrica sui predittori, e presentano le modalità di seguito illustrate:

5 Età Età: meno di 35 anni; da 36 a 50 anni; da 51 a 65 anni; più di 65 anni Professione Professione: 1; 2; 3; 4 Titolo di studio Titolo di studio: elementare/media inferiore; media superiore/università Stato civile Stato civile: celibe/nubile; sposato/a; vedovo/a Area di acquisto Area di acquisto: Romagna/Marche; Veneto; Bologna Componenti della famiglia Componenti della famiglia: 1; 2; 3; più di 3 Numero minorenni Numero minorenni: 1; più di 1 Numero percettori reddito Numero percettori reddito: 1; 2; più di 2 Numero occupati Numero occupati: modalità corrispondenti Numero auto possedute Numero auto possedute: 1; più di 1 Analisi preliminare

6 Punteggi soddisfazione relativi al servizio distributivo Punteggi soddisfazione relativi al servizio distributivo: - bassa (da 1 a 7) - media(8) - alta (9-10) Giudizi su variazioni del servizio distributivo Giudizi su variazioni del servizio distributivo: - peggiorato/molto peggiorato - più o meno uguale - migliorato Preferenza su Coop Preferenza su Coop: dicotomica si/no Canale di Vendita Canale di Vendita: iper; non iper (supermercato,discount,tradizionali,mercato,altro) Numero di soci presenti in famiglia Numero di soci presenti in famiglia: 1; da 2 in poi I VALORI MISSING VENGONO INCLUSI NELLANALISI COME CATEGORIA DISTINTA Analisi preliminare

7 Scelta della variabile target CANALE DI VENDITA Target: CANALE DI VENDITA MISSING 20.45% 29.65% 49.90% Variabili indipendenti: - tutte insieme - a blocchi Primo livello di analisi

8 SOCIO Target: SOCIO NON IPERCANALE DI VENDITA per la modalità NON IPER di CANALE DI VENDITA Scelta della variabile target 43.95% 56.05% Variabili indipendenti: - tutte insieme - a blocchi Secondo livello di analisi

9 Primo livello di analisi Intero data set CANALE DI VENDITA variabile target CANALE DI VENDITA

10 CANALE SEGMENTAZIONE IN BASE ALLA VARIABILE TARGET CANALE Variabile target: CANALE con modalità - IPER - NON IPER Variabili indipendenti: - Socio-demografiche ed economiche - Punteggi di soddisfazione sul servizio di distribuzione e relative variazioni - Variabili Coop

11 Tasso di corretta classificazione Dimensione dellalbero che ottimizza il tasso di corretta classificazione: 14 nodi terminali

12 Matrice di Confusione IPERNON IPER Totale IPER % % % NON IPER % % % Totale % % % Frequenza valori mancanti=1 Tassi di corretta classificazione

13 Rappresentazione grafica dellalbero CANALE Variabile target CANALE

14 Variabili esplicative maggiormente influenti sulla variabile target CANALE Variabile target CANALE

15 Descrizione nodi terminali …….continua NODO DESCRIZIONE NODO %IPER %NON IPER Numerosità NODO 1Unità che frequentano PV in Romagna-Marche aventi medio-bassa soddisfazione per pesce 36%64%488 2Unità che frequentano PV in Veneto aventi medio-bassa soddisfazione per pesce 26%74%214 3 Unità che frequentano PV in Romagna-Marche e Veneto aventi alta soddisfazione per pesce 44%56%367 4Unità che frequentano PV in zona Bologna aventi alta soddisfazione per pesce 69%31%454 5Unità con media soddisfazione per lassortimento e soddisfazione non nota per pesce 19%81%402 6Unità con bassa soddisfazione per lassortimento e soddisfazione non nota per pesce 6%94%662 7Unità con alta soddisfazione per lassortimento che frequentano PV in zona Bologna e hanno una medio-bassa soddisfazione per pesce 78%22%243 8Unità che frequentano PV in Veneto con alta soddisfazione per lassortimento e soddisfazione sconosciuta per pesce 10%90%79 9Unità che frequentano PV in Romagna_Marche con alta soddisfazione per lassortimento e soddisfazione sconosciuta per pesce 23%77%175

16 Descrizione nodi terminali CANALE Variabile target CANALE 10Unità che frequentano PV in Zona Bologna con alta soddisfazione per lassortimento e soddisfazione sconosciuta per pesce 67%33%151 11Soci Coop con media soddisfazione per lassortimento, frequentano punti vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce 69%31%270 12Non soci coop con media soddisfazione per lassortimento, frequentano punti vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce 45%55%128 13Soci Coop con bassa soddisfazione per lassortimento, frequentano punti vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce 56%44%185 14Non soci coop con bassa soddisfazione per lassortimento, frequentano punti vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce 27%73%146

17 CANALE SOCIO-DEMOGRAFICHE ED ECONOMICHE SEGMENTAZIONE: VARIABILE TARGET CANALE VARIABILI INDIPENDENTI SOCIO-DEMOGRAFICHE ED ECONOMICHE Variabile target: CANALE con modalità - IPER - NON IPER Variabili indipendenti: - Sesso - Età - Professione - Titolo di studio - Stato civile - Area di acquisto - Numero componenti famiglia - Numero minorenni - Numero percettori reddito - Numero occupati - Numero auto possedute

18 Tasso di corretta classificazione Dimensione dellalbero ottimale: 4 nodi terminali

19 Matrice di confusione IPERNON IPER Totale IPER % % % NON IPER % % % Totale % % % Frequenza valori mancanti=1 Tassi di corretta classificazione

20 Rappresentazione grafica dellalbero CANALE SOCIO-DEMOGRAFICHE Variabile target: CANALE variabili indipendenti: SOCIO-DEMOGRAFICHE ECONOMICHE ed ECONOMICHE

21 Variabili esplicative maggiormente influenti sulla variabile target CANALE SOCIO-DEMOGRAFICHE Variabile target: CANALE variabili indipendenti: SOCIO-DEMOGRAFICHE ECONOMICHE ed ECONOMICHE

22 Descrizione nodi terminali NODO DESCRIZIONE NODO %IPER %NON IPER 1Unità frequentanti PV situati in Romagna-Marche29%71% 2Unità frequentanti PV situati in Veneto16%84% 3Unità che possiedono 1 o più auto e la cui zona dacquisto è Bologna 55%45% 4Unità il cui numero di auto possedute non è conosciuto, ma la cui zona dacquisto è Bologna 35%65% CANALE SOCIO-DEMOGRAFICHE Variabile target: CANALE variabili indipendenti: SOCIO-DEMOGRAFICHE ECONOMICHE ed ECONOMICHENODO DESCRIZIONE NODO %IPER %NON IPER Numerosità NODO 1Unità frequentanti PV situati in Romagna-Marche29%71%1308 2Unità frequentanti PV situati in Veneto16%84%653 3 Unità che possiedono 1 o più auto e la cui zona dacquisto è Bologna 55%45% Unità il cui numero di auto possedute non è conosciuto, ma la cui zona dacquisto è Bologna 35%65%172

23 CANALE PUNTEGGI DI SODDISFAZIONE SERVIZIO DISTRIBUTIVO E RELATIVE VARIAZIONI SEGMENTAZIONE: VARIABILE TARGET CANALE VARIABILI INDIPENDENTI PUNTEGGI DI SODDISFAZIONE SERVIZIO DISTRIBUTIVO E RELATIVE VARIAZIONI Variabile target: CANALE con modalità -IPER -NON IPER Variabili indipendenti: - Generale - Prezzi - Promozioni - Assortimento - Personale, servizio - Pulizia, igiene - Qualità prodotti freschi - Reparto ortofrutta - Reparto carne - Reparto pane, pasticceria - Reparto salumi, formaggi, Gastronomia - Reparto pesce fresco - Prodotti non food.

24 Tasso di corretta classificazione Dimensione dellalbero ottimale: 12 nodi terminali

25 Matrice di confusione IPERNON IPER Totale IPER % % % NON IPER % % % Totale % % % Tassi di corretta classificazione Frequenza valori mancanti=1

26 Rappresentazione grafica dellalbero

27 Variabili esplicative maggiormente influenti sulla variabile target CANALE PUNTEGGI SODDISF. SERV. DISTRIB.E RELATIVE VARIAZ. Variabile target: CANALE variabili indipendenti: PUNTEGGI SODDISF. SERV. DISTRIB.E RELATIVE VARIAZ.

28 Descrizione dei nodi terminali ……continua NODO DESCRIZIONE NODO %IPER %NON IPER Numerosità NODO 1Unità con bassa soddisfazione per assortimento ed una media-bassa soddisfazione per pesce 33%67%570 2Unità con media-alta soddisfazione per le promozioni ed unalta soddisfazione per pesce 61%39%700 3Unità con bassa soddisfazione per le promozioni ed unalta soddisfazione per pesce 37%63%121 4Unità con una media soddisfazione per lassortimento la cui soddisfazione per pesce non è nota 18%81%402 5Unità con bassa soddisfazione per lassortimento la cui soddisfazione per pesce non è nota 6%94%662 6Unità con alta soddisfazione per i prezzi, per lassortimento ma medio-bassa per pesce 78%22%190

29 Descrizione dei nodi terminali CANALE PUNTEGGI SODDISF. SERV. DISTRIB.E RELATIVE VARIAZ. Variabile target: CANALE variabili indipendenti: PUNTEGGI SODDISF. SERV. DISTRIB.E RELATIVE VARIAZ. 7Unità con una media soddisfazione per i prezzi, alta per lassortimento e medio-bassa per pesce 68%32%162 8Unità con bassa soddisfazione per i prezzi, alta per lassortimento e medio-bassa per pesce 44%56%82 9Unità con media soddisfazione per le promozioni e per lassortimento e medio-bassa per pesce 55%45%378 10Unità con alta/bassa soddisfazione per le promozioni, media per lassortimento e medio-bassa per pesce 40%60%292 11Unità con alta soddisfazione per il personale, per lassortimento e con soddisfazione per pesce non nota 28%71%277 12Unita con medio-bassa soddisfazione per il personale, alta per lassortimento e con soddisfazione per pesce non nota 54%46%128

30 CANALE COOP SEGMENTAZIONE: VARIABILE TARGET CANALE VARIABILI INDIPENDENTI COOP Variabile target: CANALE con modalità -IPER -NON IPER Variabili indipendenti: - Canale di vendita - Socio/non socio - Insegna - Numero soci in famiglia - Preferenza su Coop - Area di acquisto

31 Tasso di corretta classificazione Numero di foglie ottimale

32 Matrice di confusione IPERNON IPER Totale IPER % % % NON IPER % % % Totale % % % Tassi di corretta classificazione Frequenza valori mancanti=1

33 Rappresentazione grafica dellalbero CANALE COOP Variabile target: CANALE variabili indipendenti: COOP

34 Variabili esplicative maggiormente influenti sulla variabile target CANALE COOP Variabile target: CANALE variabili indipendenti: COOP

35 Descrizione nodi terminali CANALE COOP Variabile target: CANALE variabili indipendenti: COOP NODO DESCRIZIONE NODO %IPER %NON IPER Numerosità NODO 1 Unità che frequentano punti vendita in Romagna-Marche 29%71% Unità che frequentano PV in Veneto 16%84%653 3 Unità che scelgono altre insegne e che frequentano PV di Bologna 30%70%239 4 Unità che frequentano PV di Bologna di cui non è nota la preferenza per linsegna 2%98%147 5 Unità non soci che frequentano PV Coop a Bologna 49%51%435 6 Unità soci che frequentano PV Coop a Bologna 66%34%1182

36 Confronto tra modelli nametargetTarget event Root ASEValid: root ASE CANALE_TUTTEcanalenon iper0, , CANALE_COOPcanalenon iper0, , CANALE_SODDISFcanalenon iper0, , CANALE_DEMOGcanalenon iper0, , canale_demog il modello canale_demog presenta un errore superiore agli altri modelli considerati

37 Confronto tra modelli nametargetTarget event Misclassification Rate Valid: Misclassification Rate CANALE_TUTTEcanalenon iper0, , CANALE_COOPcanalenon iper0, , CANALE_SODDISFcanalenon iper0, , CANALE_DEMOGcanalenon iper0, , canale_coop canale_soddisf canale_tutte i modelli canale_coop e canale_soddisf presentano un tasso di errata classificazione pressoché simile a quello del modello completo canale_tutte

38 Confronto tra modelli canale_tutte canale_soddisf Confrontando le curve, nel primo decile i modelli canale_tutte e canale_soddisf hanno un potere di classificazione migliore rispetto agli altri due modelli. canale_coop canale_soddisf Dal quinto allottavo decile il modello canale_coop acquisisce un potere di classificazione superiore rispetto al modello canale_soddisf.

39 Confronto tra modelli lift canale_tutte canale_soddisf baseline La funzione lift evidenzia che i modelli canale_tutte e canale_soddisf consentono di ottenere un miglioramento rispetto ad una classificazione casuale delle unità (baseline).

40 Secondo livello di analisi NON IPER dataset NON IPER SOCIO variabile target SOCIO

41 Segmentazione con tutte le variabili SOCIO Variabile target: SOCIO modalità - SI - NO Variabili indipendenti: - Variabili Socio-demografiche ed economiche - Punteggi di soddisfazione sul servizio di distribuzione e relative variazioni - Variabili Coop

42 Tasso di corretta classificazione la dimensione dellalbero che ottimizza il tasso di corretta classificazione è pari a 5 foglie

43 NOSITotale NO % % % SI % % % Totale % % % Tassi di corretta classificazione Matrice di confusione

44 Rappresentazione grafica dellalbero SOCIO NON IPER Variabile target: SOCIO per canale di vendita NON IPER

45 Variabili esplicative maggiormente influenti sulla variabile target SOCIO NON IPER Variabile target: SOCIO per canale di vendita NON IPER

46 Descrizione nodi terminali SOCIO NON IPER Variabile target: SOCIO per canale di vendita NON IPER NODODESCRIZIONE % SOCI % NON SOCI Numerosità NODO 1 Unità di cui non si conosce il valore per la variabile insegna 7%93%276 2 Unità che frequentano come primo PV Coop 81%19% Unità che non frequentano come primo PV Coop 11%89%100 4 Unità che frequentano come primo PV altre insegne 0%100%395 5 Unità che non frequentano come primo PV altre insegne 100%0%85

47 Segmentazione con variabili socio-demografiche ed economiche SOCIO Variabile target: SOCIO con modalità - SI - NO Variabili indipendenti: - Sesso - Età - Professione - Titolo di studio - Stato civile - Area di acquisto - Numero componenti famiglia - Numero minorenni - Numero percettori reddito - Numero occupati - Numero auto possedute

48 Tasso di corretta classificazione lalbero si arresta a tre nodi terminali

49 NOSITotale NO % % % SI % % % Totale % % % Tassi di corretta classificazione Matrice di confusione

50 Rappresentazione grafica dellalbero SOCIO NON IPER SOCIO-DEMOGRAFICHE ED ECONOMICHE Variabile target: SOCIO per canale di vendita NON IPER e variabili indipendenti SOCIO-DEMOGRAFICHE ED ECONOMICHE

51 Descrizione dei nodi terminali L unica variabile utilizzata nella costruzione dellalbero è ZONA NODODESCRIZIONE % SOCI % NON SOCI Numerosità NODO 1Unità che frequentano PV in zona Bologna49%51%959 2 Unità che frequentano PV in zona Romagna-Marche 60%40%957 3Unità che frequentano PV in zona Veneto66%34%531

52 Segmentazione con variabili relative alla soddisfazione SOCIO Variabile target: SOCIO con modalità -SI -NO Variabili indipendenti: - Generale - Prezzi - Promozioni - Assortimento - Personale, servizio - Pulizia, igiene - Qualità prodotti freschi - Reparto ortofrutta - Reparto carne - Reparto pane, pasticceria - Reparto salumi, formaggi, Gastronomia - Reparto pesce fresco - Prodotti non food

53 dimensione ottimale dellalbero: 8 nodi terminali Tasso di corretta classificazione

54 NOSITotale NO % ,02% % SI % % % Totale % % % Tassi di corretta classificazione Matrice di confusione

55 Rappresentazione grafica dellalbero

56 Variabili esplicative maggiormente influenti sulla variabile target SOCIO NON IPER SODDISFAZIONE Variabile target: SOCIO per canale di vendita NON IPER e variabili indipendenti di SODDISFAZIONE

57 Descrizione nodi terminali NODODESCRIZIONE % SOCI % NON SOCI Numerosità NODO 1 Unità con alta soddisfazione per le promozioni ed una soddisfazione generale medio-alta 76%24%544 2 Unità con medio-bassa soddisfazione per le promozioni ed una soddisfazione generale medio-alta 64%36%946 3 Unità con soddisfazione per le promozioni non nota ed una soddisfazione generale medio-alta 40%60%30 4 Unità per le quali la soddisfazione per pesce è migliorata e che presentano bassa soddisfazione generale ed una soddisfazione generica per carne 38%62%93 5 Unità per le quali la soddisfazione per pesce è peggiorata e che presentano bassa soddisfazione generale ed una soddisfazione generica per carne 47%53%426 6 Unità per le quali la variazione di soddisfazione per pesce non è nota e che presentano bassa soddisfazione generale ed una soddisfazione generica per carne 62%38%165 7 Unità di cui non è nota la soddisfazione per carne, con bassa soddisfazione generale 26%74%94 8 Unità con soddisfazione generale non nota 4%96%149

58 Segmentazione con variabili coop SOCIO Variabile target: SOCIO c on modalità - SI - NO Variabili indipendenti: - Canale di vendita - Insegna - Numero soci in famiglia - Preferenza su Coop - Area di acquisto

59 lalbero si arresta a cinque nodi terminali Tasso di corretta classificazione

60 NOSITotale NO % % % SI % % % Totale % % % Tassi di corretta classificazione Matrice di confusione

61 Rappresentazione grafica dellalbero SOCIO NON IPER COOP Variabile target: SOCIO per canale di vendita NON IPER e variabili indipendenti COOP

62 Variabili esplicative maggiormente influenti sulla variabile target SOCIO NON IPER COOP Variabile target: SOCIO per canale di vendita NON IPER e variabili indipendenti COOP

63 Descrizione nodi terminali SOCIO NON IPER COOP Variabile target: SOCIO per canale di vendita NON IPER e variabili indipendenti COOP NODODESCRIZIONE % SOCI % NON SOCI Numerosità NODO 1Unità di cui non è nota la preferenza per insegna7%93%276 2Unità il cui primo PV è Coop81%19%1591 3Unità il cui primo PV non è Coop11%89%100 4Unità il cui primo PV è rappresentato da altre insegne0%100%395 5 Unità il cui primo PV non è rappresentato da altre insegne 100%0%85

64 Confronto tra modelli nametargetTarget eventRoot ASE Valid: root ASE SOCIO_COOPsociosi SOCIO_SODDISsociosi SOCIO_DEMOsociosi SOCIO_TUTTEsociosi socio_demog il modello socio_demog presenta un errore superiore agli altri modelli considerati

65 nametargetTarget eventMisclassification Rate Valid: Misclassification Rate SOCIO_COOPsociosi SOCIO_SODDISsociosi SOCIO_DEMOsociosi SOCIO_TUTTEsociosi Confronto tra modelli socio_coop socio_tutte il modello socio_coop presenta un tasso di errata classificazione corrispondente a quello del modello completo socio_tutte, a conferma dei risultati ottenuti nella costruzione degli alberi

66 Confronto tra modelli socio_tutte socio_coop Confrontando le curve, i modelli socio_tutte e socio_coop hanno il medesimo potere di classificazione (le curve sono sovrapposte), superiore rispetto agli altri due modelli.

67 Confronto tra modelli lift socio_tutte socio_coop baseline La funzione lift evidenzia che i modelli socio_tutte e socio_coop (curve sovrapposte) consentono di ottenere un miglioramento rispetto ad una classificazione casuale delle unità (baseline).


Scaricare ppt "LA SEGMENTAZIONE DEL MERCATO Un caso di analisi CHAID COOP Emilio GagliardiDebora FacchiniGiulia Bravo"

Presentazioni simili


Annunci Google