La segmentazione a priori: CHAID

Slides:



Advertisements
Presentazioni simili
Prodotto, innovazione e binomio prodotto-cliente
Advertisements

Monitor Alimentare DOXA Terza Edizione Primavera 2002 Parma, 9 maggio 2002.
Monitor Alimentare DOXA Seconda Edizione Autunno 2001 Roma, 5 dicembre 2001 per Federalimentare.
LA MICROSEGMENTAZIONE DEL MERCATO
Segmentazione, scelta dei mercati obiettivo e posizionamento
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
CLUSTER ANALYSIS Insieme di tecniche con l’obiettivo di unire le unità di un insieme statistico in un numero finito di classi o gruppi i quali devono.
Quali sono i clienti che l’azienda è in grado di soddisfare?
PIANO DI MARKETING.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Apprendimento Automatico: Valutazione delle Prestazioni
GRIGLIA PER LA LETTURA DI UN LAVORO SCIENTIFICO
ANALISI DEGLI EFFETTI COMPETITIVI TRA MARCHE
ALBERI DECISIONALI prima parte
ALBERI DECISIONALI terza parte
LA SEGMENTAZIONE DEL MERCATO Un caso di analisi CHAID
Le funzioni di Engel Presentazione a cura di : Giulia Bravo
ANALISI DI SEGMENTAZIONE: un’applicazione del metodo CHAID
attraverso la segmentazione
Lezioni per Insegnanti mod 4 Prof. Giovanni Raho 1 I metodi della ricerca sociale Corso S. I. S. S Mod. 4.
Regione Lombardia Tavolo Osservatorio Prezzi Lindice dei prezzi per i Prodotti Confezionati di Largo Consumo nei punti di vendita della Distribuzione Moderna.
Capitolo 7 Strategia di marketing orientata al cliente Creare valore per il cliente obiettivo.
LA SEGMENTAZIONE INTERNAZIONALE
U.O. Statistica ASCOLTARE I CITTADINI: MONITOR SULLA SODDISFAZIONE DEI SERVIZI DELLA CITTA DI FERRARA SERVIZIO ATTIVITA PRODUTTIVE - COMMERCIO.
Analisi della varianza
Federconsumatori Basilicata - Matera Prezzi sotto la lente.
STATISTICA PER LE DECISIONI DI MARKETING
Statistica Descrittiva
ANALISI DEL CONTESTO Caratteristiche socio/economiche Tasso di occupazione e disoccupazione Statistiche sul livello culturale della popolazione Presenza.
XLVII Riunione Scientifica della Società Italiana di Economia, Demografia e Statistica Milano, 27, 28 e 29 maggio 2010 Motivazioni esclusive e concorrenti.
Il mercato dei prodotti per la cura personale. Comune di Ardea – Assessorato allo Sviluppo Economico ed Attivit à Produttive Mercato di riferimento Personal.
STATISTICA PER LE DECISIONI DI MARKETING
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
STATISTICA PER LE DECISIONI DI MARKETING
Il Marketing Classe V C Istituto tecnico commerciale Volpe di Grottaminarda.
ISMEA LE STELLE DI NATALE
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
Principi di marketing.
Metaclassificazione Giovedì, 18 novembre 2004 Francesco Folino ( Combinare Classificatori Lecture 8.
Indagine conoscitiva sulla dispersione scolastica Anno scolastico 2006/2007 Rete Successi.
Questionario Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°7.
Variabili temporali Analisi statistica
Cap. 2 LA MISSIONE DELLE IMPRESE COMMERCIALI NEI DIVERSI CONTESTI SETTORIALI CLAM Corso di Marketing Distributivo.
ISMEA IL MERCATO DEI PRODOTTI FLOROVIVAISTICI Rilevazione Luglio 2009 Paola Lauricella Indagine effettuata da ISMEA/Nielsen-CRA a cura di:
Prime valutazioni sugli esiti post-diploma L’efficacia e l’efficienza dell’azione educativa di un Istituto superiore si evidenzia in particolare dagli.
DATA MINING PER IL MARKETING
5 C A P I T O L O 5 Marketing J. Paul Peter James H. Donnelly, Jr. La segmentazione del mercato.
ECONOMIA AZIENDALE E GESTIONE DELLE IMPRESE
Analisi discriminante lineare - contesto
Modelli di Attrazione ad effetti completi
Modelli di scelta del piano telefonico
DATA MINING.
“Teoria e metodi della ricerca sociale e organizzativa”
Un’applicazione della segmentazione a priori: l’algoritmo CHAID
Esercizio Alberi di classificazione DATI Un’azienda vuole valutare l’efficacia di una promozione effettuata attraverso buoni acquisto. Per questo motivo.
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
DATA MINING PER IL MARKETING Andrea Cerioli Sito web del corso GLI ALBERI DI CLASSIFICAZIONE Introduzione alla metodologia Zani-Cerioli,
1 A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi.
L’equilibrio dei mercati finanziari Istituzioni di Economia Politica II.
Caso RETAILER IIIIIIIV I. Presentazione del DB OBIETTIVO Analizzare il portafoglio di clienti intermedi dell’azienda allo scopo di individuare tra i retailer.
Direzione Centrale Servizi ai Contribuenti Customer Satisfaction 2014 servizi web Informazioni generali.
Cos’è il marketing È la funzione tecnica dello scegliere che cosa vendere, a chi vendere e programmare le azioni conseguenti I possibili approcci: Imprese.
GfK per ASSOROLOGI Milano, 13 Marzo 2015.
Elaborazione dei valori di fondo nelle acque sotterranee del SIN laguna di Marano e Grado Dr. A. Felluga ARPA FVG - Laboratorio di Udine 27 giugno 2013.
Statistica – L33 (prof. Pellegrini)
DEFINIRE I REQUISITI DEL CLIENTE SVILUPPARE E VALUTARE IL QUESTIONARIO IMPIEGARE IL QUESTIONARIO Dimensioni della qualità 1.Perfomance 2.Optionals 3.Affidabilità.
IL TERMINE “SOLIDALE” VIENE USATO PER DISTIGUERE I GAS DAI GRUPPI D’ACQUISTO TOUT- COURT, CHE POSSONO NON PRESENTARE CONNOTAZIONI ETICHE, MA ESSERE SOLO.
Direzione Centrale Gestione Tributi Customer Satisfaction 2015 RLI web.
Cos’è la ricerca sociale? La raccolta di informazioni relative ad una realtà, ad un fenomeno sociale secondo obiettivi specifici:
Laboratorio di Creazione d’Impresa L-A Strategia, Business, Settore.
Transcript della presentazione:

La segmentazione a priori: CHAID Elena Pallini Elena Santi Francesco Bontempone Rosangelo Giampaolo Dott.ssa Elena Pallini pallinielena@yahoo.it Dott.ssa Elena Santi santi_elena@libero.it Dott. Francesco Bontempone frabon@micso.net Dott. Rosangelo Giampaolo rosangelogiampaolo@libero.it

Obiettivo dell’analisi Suddividere in gruppi omogenei un insieme di individui, intervistati presso i punti vendita COOP, in funzione delle loro caratteristiche socio-demografiche, comportamentali e di giudizio

Struttura del dataset Fonte statistica: interviste effettuate in punti vendita Coop 7200 osservazioni 3 classi di variabili: variabili socio-demografiche ed economiche punteggi di soddisfazione sul servizio di distribuzione e relative variazioni variabili “Coop”

Modello statistico Tecnica di segmentazione multipla CHAID (Chi-squared Automatic Interaction Detection) Grado di omogeneità all’interno dei gruppi e di eterogeneità tra i gruppi è valutato con il test del Chi-quadro Significatività statistica normalizzata con il fattore di Bonferroni

Primo livello: data set “completo” Variabile target SOCIO (sì / no) Variabili indipendenti Prima fase: Sono state incluse nell’analisi tutte le variabili Seconda fase: Sono state incluse nell’analisi le variabili “a blocchi”

Secondo livello: data set “non soci” Variabile target CANALE (iper / non iper) Variabili indipendenti Prima fase: Sono state incluse nell’analisi tutte le variabili Seconda fase: Sono state incluse nell’analisi le variabili “a blocchi”

Alberi: impostazioni comuni Data set partizionato in: 70% Training Set 30% Validation Set Minimo numero di osservazioni per foglia: 50 Massima profondità dell’albero: 6

Distribuzione variabile target Variabile target: SOCIO (sì / no)

variabili socio-demografiche Alberi 1° livello (1) tutte le variabili SOCIO (sì/no) variabili socio-demografiche ed economiche (2) punteggi di soddisfazione variabili “Coop” I risultati ottenuti sono identici a quelli con le sole variabili “Coop” Le variabili considerate non hanno alcun valore esplicativo

SOCIO *** Punteggi di soddisfazione sul servizio di distribuzione e relative variazioni

Tasso di corretta classificazione validation set 0,744 training set 0,755 SOCIO – Punteggi di soddisfazione e variazioni Il confronto tra le curve del training set e del validation set suggerisce di scegliere l’albero con 7 foglie finali

SOCIO – Punteggi di soddisfazione e variazioni Matrice di confusione SOCIO – Punteggi di soddisfazione e variazioni Il 3% dei “soci” sono malclassificati Il 46% dei “non soci” sono malclassificati

1° livello: Albero “soddisfazione” - 1 - - 2 - - 3 - - 4 - - 5 - - 6 - - 7 - Variabile target: SOCIO (sì / no) Variabili indipendenti: punteggi di soddisfazione e variazioni Data set completo

Segmenti finali: caratteristiche Le promozioni inducono gli acquirenti a diventare “soci” I “non soci” sono sensibili alle variazioni nei servizi per i prodotti no food

SOCIO *** Variabili “Coop”

Tasso di corretta classificazione validation set 0,871 training set 0,884 SOCIO – Variabili Coop Il confronto tra le curve del training set e del validation set suggerisce di scegliere l’albero con 5 foglie finali

Matrice di confusione Il 1% dei “soci” sono malclassificati SOCIO – Variabili Coop Il 1% dei “soci” sono malclassificati Il 22% dei “non soci” sono malclassificati

1° livello: Albero “varCoop” Variabile target: SOCIO (sì / no) Variabili indipendenti: variabili “Coop” Data set completo - 1 - - 2 - - 3 - - 4 - - 5 -

Segmenti finali: caratteristiche “Contenti” (segmento 1) Soci Coop “Attenti alle promozioni”(segmento 4) “Attratti da Coop ma impossibilitati ad andarci” (segmento 2) Non soci “Non attratti da Coop ma costretti ad andarci” (segmento 3)

Distribuzione variabile target Variabile target: CANALE (iper / non iper)

Alberi 2° livello: data set “non soci” tutte le variabili CANALE (iper / non iper) variabili socio-demografiche ed economiche (*) punteggi di soddisfazione variabili “Coop” (*) (*) Le variabili considerate non hanno alcun valore esplicativo

CANALE *** Tutte le variabili

Tasso di corretta classificazione validation set 0,753 training set 0,787 CANALE – Tutte le variabili Il confronto tra le curve del training set e del validation set suggerisce di scegliere l’albero con 6 foglie finali

CANALE – Tutte le variabili Matrice di confusione CANALE – Tutte le variabili Il 63% dei frequentatori “iper” sono malclassificati Il 5% dei frequentatori “non iper” sono malclassificati

2° livello: Albero “ALL” Variabile target: CANALE (iper / non iper) Variabili indipendenti: tutte le variabili Data set: NON SOCI - 2 - - 1 - - 3 - - 4 - - 5 - - 6 -

Segmenti finali: caratteristiche Bologna: i ricercatori di varietà scelgono l’iper 2 macro-zone Veneto, Romagna e Marche: i ricercatori di varietà scelgono il “non iper”

CANALE *** Punteggi di soddisfazione sul servizio di distribuzione e relative variazioni

Tasso di corretta classificazione validation set 0,763 training set 0,768 CANALE – Punteggi di soddisfazione e variazioni Il confronto tra le curve del training set e del validation set suggerisce di scegliere l’albero con 5 foglie finali

CANALE – Punteggi di soddisfazione e variazioni Matrice di confusione CANALE – Punteggi di soddisfazione e variazioni Il 51% dei frequentatori “iper” sono malclassificati Il 12% dei frequentatori “non iper” sono malclassificati

2° livello: Albero “soddisfazione” Variabile target: CANALE (iper / non iper) Variabili indipendenti: punteggi di soddisfazione e variazioni Data set: NON SOCI - 2 - - 1 - - 3 - - 4 - - 5 -

Segmenti finali: caratteristiche Chi è poco interessato all’assortimento frequenta il “non iper” Chi è molto interessato all’assortimento e alle promozioni frequenta l’ “iper”

Conclusioni 3 alberi su 4 malclassificano una delle due modalità della variabile target con valori superiori al 40% L’unico albero utilizzabile per l’analisi: Albero “varCoop” con variabile target SOCIO

I modelli hanno una scarsa capacità classificatoria. Conclusioni I modelli hanno una scarsa capacità classificatoria. Perché? Possibili interpretazioni: insufficiente contenuto informativo del data set categorizzazione delle variabili non sufficientemente accurata nel caso di CANALE può essere dovuta anche allo sbilanciamento del campione rispetto al target

Variabili socio-demografiche ed economiche Sesso Età Professione Titolo di studio Stato civile Area di acquisto Numero componenti famiglia Numero minorenni Numero percettori di reddito Numero occupati Numero auto possedute

Qualità del servizio Reparto ortofrutta Generale Reparto carne Prezzi Promozioni Assortimento Personale, servizio Pulizia, igiene Qualità prodotti freschi Reparto ortofrutta Reparto carne Reparto pane, pasticceria Reparto salumi, formaggi e gastronomia Reparto pesce fresco Prodotti no-food N.B. Per ogni variabile sono stati rilevati sia la soddisfazione sul servizio che la relativa variazione rispetto al passato

Variabili “Coop” Canale di vendita (IPER / NON IPER) Socio (SI / NO) Insegna Numero soci in famiglia Preferenza su Coop Area di acquisto