ANALISI DEI COMPORTAMENTI DI SPESA DELLE FAMIGLIE ITALIANE: CONSUMI ANNO 2001 Funzioni di Engel
Presentazione a cura di: Raspanti Alessandro Facchini Debora Quevedo Claudio Carloni Valeria
Funzioni di Engel OBIETTIVO: Verificare se la spesa per: Latte, Abbigliamento, Trasporti, Oli e grassi, delle famiglie italiane nel 2001 varia al variare del reddito e di altre variabili strutturali quali zona geografica, titolo di studio e posizione professionale del capofamiglia.
Processo di analisi Suddivisione in classi della spesa totale; Creazione di classi per l’area geografica, titolo di studio e posizione professionale; Calcolo delle medie per classi di spesa e le diverse modalità delle variabili socioeconomiche e territoriali considerate; Trasformazione logaritmica delle medie precedentemente calcolate; Stima delle funzioni di Engel utilizzando come pesi le frequenze relative di ogni classe di spesa nelle diverse modalità delle variabili categoriche.
Variabili categoriche Zona ZonaFrequenzaPercentuale Dati mancanti Centro Nord Est Nord Ovest Sud Isole
Variabili categoriche Titolo di studio StudioFrequenzaPercentuale alto basso media inferiore media superiore
Variabili categoriche Posizione Professionale PosizioneFrequenzaPercentuale Dati mancanti dirigente quadro altro dipendente autonomo impiegato operaio
Capitolo di spesa: LATTE, FORMAGGI E UOVA Latte intero o scremato Latte in polvere o concentrato Yogurt Formaggi freschi e stagionati Uova Altri prodotti derivati dal latte Rappresenta il 2,55% della spesa totale
Latte – Zona geografica Verifica delle ipotesi relative ai coefficienti l’ipotesi H01 viene rifiutata (test significativo); l’ipotesi H02 viene non rifiutata (test non significativo). Coefficienti diversi da 0, ma non significativamente diversi tra loro per ogni modalità della variabile categorica zona geografica. Valore FPr > F < Contrast H01 b1=b2=b3=b4=0 H02 b1=b2=b3=b4=b R 2 = 0,93
Latte – Zona geografica ParameterStimaErrore standardValore tPr > |t| Centro <.0001 Nord-Est <.0001 Nord-Ovest <.0001 Sud-Isole <.0001 Coefficienti – “Stime”
Latte – Zona geografica Verifica delle ipotesi relative alle intercette l’ipotesi H03 viene rifiutata (test significativo); le intercette sono significativamente diverse tra loro rette parallele: i comportamenti delle famiglie si differenziano soltanto nei livelli di consumo Contrast H03 a1=a2=a3=a4=a Valore FPr > F R 2 = 0,92
Latte – Zona geografica Dai confronti a coppie e dalle stime dei parametri si evidenzia quali modalità della variabile categorica siano tra loro diverse e quali simili. In particolare: le stime per C e N_E risultano essere simili tra loro, mentre per N_O e S_I sono “significativamente” diverse. ParameterStima zona C zona N_E zona N_O zona S_I Coefficiente ß
Latte – Zona geografica Il valore del p-value indica diversità tra le intercette Intercette “contrasti” ParameterStimaErrore standardValore tPr > |t| a1-a a1-a a1-a a2-a a2-a a3-a
Latte – Zona geografica Rappresentazione grafica:
Latte – Titolo di studio Verifica delle ipotesi relative ai coefficienti l’ipotesi H01 viene rifiutata (test significativo); l’ipotesi H02 viene non rifiutata (test non significativo). Coefficienti diversi da 0, ma non significativamente diversi tra loro per ogni modalità della variabile categorica titolo di studio. Contrast H01 b1=b2=b3=b4=0 H02 b1=b2=b3=b4=b Valore FPr > F 88.94< R 2 = 0,93
Latte – Titolo di studio Coefficienti – “Stime” ParameterStimaErrore standardValore tPr > |t| Studio alto <.0001 Studio basso <.0001 Studio m_i <.0001 Studio m_s <.0001
Latte – Titolo di studio Verifica delle ipotesi relative alle intercette l’ipotesi H03 viene non rifiutata (test non significativo); le intercette non sono significativamente diverse tra loro retta unica: i comportamenti di consumo delle famiglie risultano essere omogenei, non influenzati dalle diverse modalità della variabile considerata. Contrast H03 a1=a2=a3=a4=a Valore FPr > F R 2 = 0,92
Latte – Titolo di studio ParameterStima Studio alto Studio basso Studio m_i Studio m_s Coefficiente ß Questi sono i parametri stimati: Le intercette non sono significativamente diverse tra loro; Unico coefficiente angolare ß.
Latte – Titolo di studio Rappresentazione grafica :
Latte – Posizione professionale Verifica delle ipotesi relative ai coefficienti l’ipotesi H01 viene rifiutata (test significativo); l’ipotesi H02 viene non rifiutata (test non significativo). Coefficienti diversi da 0, ma non significativamente diversi tra loro per ogni modalità della variabile categorica posizione professionale. Contrast H01 b1=b2=b3=b4=0 H02 b1=b2=b3=b4=b Valore FPr > F 58.07< Latte – Posizione professionale R 2 = 0,88
Latte – Posizione professionale Coefficienti – “Stime” ParameterStimaErrore standardValore tPr > |t| Pos DirQ <.0001 Pos adip Pos aut <.0001 Pos imp <.0001 Pos oper <.0001
Latte – Posizione professionale Verifica delle ipotesi relative alle intercette l’ipotesi H03 viene non rifiutata (test non significativo); le intercette non sono significativamente diverse tra loro retta unica: i comportamenti di consumo delle famiglie risultano essere omogenei, non influenzati dalle diverse modalità della variabile considerata. Contrast H03 a1=a2=a3=a4=a Valore FPr > F Latte – Posizione professionale R 2 = 0,88
Latte – Posizione professionale ParameterStima Pos DirQ Pos adip Pos aut Pos imp Pos oper Coefficiente ß Questi sono i parametri stimati: Le intercette non sono significativamente diverse tra loro; Unico coefficiente angolare ß.
Latte – Posizione professionale Rappresentazione grafica:
Capitolo di spesa: ABBIGLIAMENTO Abbigliamento Calzature Biancheria intima Altri articoli e accessori di abbigliamento Pellicce e articoli di pellicceria Tessuti per confezioni su misura Spese per confezionare e riadattare abiti nuovi e usati Rappresenta il 6,72% della spesa totale
Abbigliamento – Zona geografica Verifica delle ipotesi relative ai coefficienti l’ipotesi H01 viene rifiutata (test significativo); l’ipotesi H02 viene non rifiutata (test non significativo) Coefficienti diversi da 0, ma non significativamente diversi tra loro per ogni modalità della variabile categorica zona geografica. ContrastDFValore FPr > F H01 b1=b2=b3=b4= <.0001 H02 b1=b2=b3=b4=b R 2 = 0,96
Abbigliamento – Zona geografica ParameterStimaErrore standardValore tPr > |t| CENTRO <.0001 NORD_EST <.0001 NORD_OVEST <.0001 SUD_ISOLE <.0001 Coefficienti – “Stime”
Abbigliamento – Zona geografica Verifica delle ipotesi relative alle intercette l’ipotesi H03 viene rifiutata (test significativo); le intercette sono significativamente diverse tra loro Rette parallele: i comportamenti delle famiglie si differenziano soltanto nei livelli di consumo ContrastDFValore FPr > F H03 a1=a2=a3=a4=a R 2 = 0,96
Abbigliamento – Zona geografica In particolare: C(a1), N_E(a2), N_O(a3)sono uguali; l’unica intercetta significativamente diversa è ‘S_I(a4)’ ParameterStima zona C (a1) zona N_E (a2) zona N_O (a3) zona S_I (a4) Parametro comune alle quattro zone: ß=
Abbigliamento – Zona geografica <.0001 ParameterStimaErrore standardValore tPr > |t| C-N_E C-N_O C-S_I N_E-N_O N_E-S_I N_O-S_I Il valore del p-value indica diversità tra le intercette Intercette “contrasti”
Abbigliamento – Zona geografica ParameterStimaErrore standardValore tPr > |t| zona C <.0001 zona N_E <.0001 zona N_O <.0001 zona S_I <.0001 ß unico <.0001 Intercette “stime”
Abbigliamento – Zona geografica Rappresentazione grafica:
Abbigliamento – Titolo di studio Verifica delle ipotesi relative ai coefficienti l’ipotesi H01 viene rifiutata (test significativo); l’ipotesi H02 viene non rifiutata (test non significativo) Coefficienti diversi da 0, ma non significativamente diversi tra loro per ogni modalità della variabile categorica titolo di studio. ContrastDFValore FPr > F H01 b1=b2=b3=b4= <.0001 H03 b1=b2=b3=b4=b R 2 = 0,97
Abbigliamento – Titolo di studio ParameterStimaErrore standardValore tPr > |t| Studio alto <.0001 Studio basso <.0001 Studio m_i <.0001 Studio m_s <.0001 Coefficienti – “Stime”
Abbigliamento – Titolo di studio Verifica delle ipotesi relative alle intercette l’ipotesi H03 viene rifiutata (test significativo); le intercette sono significativamente diverse tra loro Rette parallele: i comportamenti delle famiglie si differenziano soltanto nei livelli di consumo ContrastDFValore FPr > F H03 a1=a2=a3=a4=a R 2 = 0,97
Abbigliamento – Titolo di studio ParameterStima Studio alto (a1) Studio basso (a2) Studio m_i (a3) Studio m_s (a4) In particolare: l’unica intercetta che si differenzia è: ‘a2’- Studio basso Parametro comune stimato dal modello: ß=
Abbigliamento – Titolo di studio ParameterStimaErrore standardValore tPr > |t| alto-basso alto-m_i alto-m_s basso-m_i basso-m_s m_i-m_s Il valore del p-value indica diversità tra le intercette Intercette – “contrasti”
Abbigliamento – Titolo di studio ParameterStimaErrore standardValore tPr > |t| Studio alto <.0001 Studio basso <.0001 Studio m_i <.0001 Studio m_s <.0001 ß unico <.0001 Intercette “stime”
Abbigliamento – Titolo di studio Rappresentazione grafica:
Abbigliamento Posizione Professionale Verifica delle ipotesi relative ai coefficienti Coefficienti diversi da 0, ma non significativamente diversi tra loro per ogni modalità della variabile categorica Posizione Professionale. ContrastDFValore FPr > F H01 b1=b2=b3=b4=b5= <.0001 H02 b1=b2=b3=b4=b5=b R 2 = 0,94
Abbigliamento Posizione Professionale ParameterStimaErrore standardValore tPr > |t| Pos DirQ <.0001 Pos adip <.0001 Pos aut <.0001 Pos imp <.0001 Pos oper <.0001 Coefficienti “Stime”
Abbigliamento Posizione Professionale Verifica delle ipotesi relative alle intercette test F non significativo: le intercette non sono significativamente diverse tra loro RETTA UNICA : Comportamenti omogenei delle famiglie “La spesa per abbigliamento è indipendente rispetto alle modalità della variabile posizione professionale” ContrastDFValore FPr > F H03 a1=a2=a3=a4=a5=a R 2 = 0,94
Abbigliamento Posizione Professionale a1-a a1-a a1-a a1-a a2-a a2-a a2-a a3-a a3-a a4-a I valori dei p-value evidenziano che le intercette non sono significativamente diverse tra loro Intercette “contrasti”
Abbigliamento Posizione Professionale ParameterStimaErrore standardValore tPr > |t| Pos DirQ <.0001 Pos adip <.0001 Pos aut <.0001 Pos imp <.0001 Pos oper <.0001 ß unico <.0001 Intercette “stime”
Abbigliamento Posizione Professionale Rappresentazione grafica:
Capitolo di spesa: TRASPORTI Benzina per auto e moto Gasolio e altri combustibili per auto e moto Biglietti e abbonamenti per bus, metro e tram Taxi Parcheggi,pedaggi per autostrade, ponti, gallerie, ecc Rappresenta il 5,58% della spesa totale
ZONA DI RESIDENZA (TRASPORTI) -La prima ipotesi (H 1 ) viene rigettata (p-value signif.) -La seconda ipotesi (H 2 ) viene non rifiutata (p-value non sign.) -La terza ipotesi (H 3 ) viene non rifiutata (p-value non signif.) Il consumo dei trasporti non è significativamente diverso secondo la zona di residenza (elasticità uniforme per tutte le zone). E’ diverso secondo l’ammontare del reddito analizzato. R 2= 0,83
Grafico Zona (Trasporti) Possiamo vedere che le rette sono molto vicine e,malgrado non si veda l’ intercetta, si nota che la stessa non è significativamente diversa per le 4 modalità della variabile zona. Anche i coefficienti angolari non sono diversi.
Coefficiente Angolare ed Intercette - Zona
TITOLO STUDIO (TRASPORTI) -La prima ipotesi (H 1 ) viene rigettata (p-value signific.) -La seconda ipotesi (H 2 ) viene rifiutata (p-value sign.) Il consumo dei beni di questo capitolo è significativamente diverso in funzione del titolo di studio(elasticità diverse e livelli di consumo diversi). R 2= 0,91
Grafico Studio (Trasporti) In questo grafico possiamo vedere che le rette hanno coefficienti angolari diversi, questo origina rette libere. Si può anche vedere come all’aumentare il livello di istruzione cala il coefficiente angolare della spesa in trasporti (rette più orizzontali): infatti, in un livello di studio basso è molto maggiore l’aumento. Mentre nel livello alto di studio la spesa in trasporti aumenta di molto meno.
Coefficienti Angolari ed intercette - Studio Abbiamo verificato le ipotesi H01 e H02 e i coefficienti angolari sono risultati significativamente diversi. Con un basso livello d’istruzione il consumo di trasporti aumenta un 1.59% per ogni 1% di aumento del reddito, mentre per le altre modalità questo incremento è della metà.
POSIZIONE PROF. (Trasporti) - La prima ipotesi (H 1 ) viene rigettata (p-value signif.) -La seconda ipotesi (H 2 ) viene non rifiutata (p-value non sign.). Perciò dobbiamo calcolare la terza ipotesi: -La terza ipotesi (H 3 ) viene non rifiutata (p-value non sign.) Il consumo dei beni di questo capitolo non è significativamente diverso in funzione della posizione nella professione. Al variare del reddito varia il consumo in trasporti senza nessuna influenza della variabile categorica posizione professionale. R 2= 0,87 R 2= 0,86
Grafico POS.Prof. (TRASPORTI) Le rette sono molto vicine, abbiamo retta unica, (intercette vicine con coefficienti angolari non significativamente diversi). Pertanto il carattere posizione professionale non spiega il consumo di trasporti
Coefficiente Angolare e Intercette - Posizione Professionale
Capitolo di spesa: OLI E GRASSI Olio di oliva Olio di semi e di sansa Burro Margarina e altri grassi vegetali Lardo, strutto e altri grassi animali Rappresenta lo 0,70% della spesa totale
Oli e grassi – Zona geografica Verifica delle ipotesi relative ai coefficienti l’ipotesi H01 viene rifiutata (test significativo); l’ipotesi H02 viene non rifiutata (test non significativo). Coefficienti non sono significativamente diversi tra loro per ogni modalità della variabile categorica: zona geografica. Ipotesi saggiatedfValore di F Pr > F H01: b1=b2=b3=b4= <.0001 H02: b1=b2=b3=b4=b R 2 = 0.915
Parametri ß stimati ParametriStimaErrore SdtP> | t | Centro <.0001 Nord-est <.0001 Nord-ovest <.0001 Sud-Isole <.0001
Oli e Grassi – Zona geografica Verifica delle ipotesi relative alle intercette l’ipotesi H03 viene non rifiutata (test non significativo); le intercette non sono significativamente diverse tra loro: posso usare il modello ridotto perché non ci sono differenze nel comportamento di spesa dovute alla ripartizione territoriale di residenza. RETTA UNICA DFValore di FPr > F H03: a1=a2=a3=a4=a
Oli e Grassi – Intercette ConfrontiTest tPr < | t | C - N_E * C - N_O * C - S_I * N_E -N_O * N_E -S_I * N_O -S_I * STIME C N_E N_O S_I * NON SIGNIFICATIVAMENTE DIVERSI A COPPIE POSSO USARE COME UNICA INTERCETTA LA MEDIA DELLE STIME e sulla base di questi risultati, come coefficiente : ß unico Errore SdtP > |t| <.0001 R 2 =0.981
Oli e Grassi – Grafico Zona Il nord-est ha i livelli più bassi Rette quasi coincidenti: oltre all’elasticità, non varia di molto il livello di spesa. L’omogeneità si suppone anche dovuta al fatto che al centro-sud molte delle voci di questo capitolo vengono prodotte in casa e quindi procurate con prezzi e mezzi differenti.
Oli e grassi – Titolo di Studio Verifica delle ipotesi relative ai coefficienti l’ipotesi H01 viene rifiutata (test significativo); l’ipotesi H02 viene non rifiutata (test non significativo). Coefficienti non sono significativamente diversi tra loro per ogni modalità della variabile categorica: Titolo di studio. Ipotesi saggiatedfValore di F Pr > F H01: b1=b2=b3=b4= <.0001 H02: b1=b2=b3=b4=b R 2 = 0.915
Parametri ß stimati ParametriStimaErrore SdtP> | t | Alta <.0001 Basso <.0001 Media - Inf <.0001 Media - Sup <.0001
Oli e Grassi – Titolo di studio Verifica delle ipotesi relative alle intercette l’ipotesi H03 viene rifiutata (test è significativo); le intercette sono significativamente diverse tra loro: modello a rette parallele DFValore di FPr > F H03: a1=a2=a3=a4=a313.36<.0001 ß unicoErrore SdtP > |t| <.0001 Il comportamento d’acquisto di Oli e grassi non varia a seconda del titolo di studio, è il livello di spesa ad essere differente. R 2 = 0,89
Oli e Grassi – Grafico Titolo di studio Le rette sono ben distinte ma l’elasticità non è significativamente diversa. I livelli di consumo di oli e grassi sono fortemente differenti fra titoli di studio
Oli e grassi – Posizione Prof. Verifica delle ipotesi relative ai coefficienti l’ipotesi H01 viene rifiutata (test significativo); l’ipotesi H02 viene non rifiutata (test non significativo). Coefficienti non sono significativamente diversi tra loro per ogni modalità della variabile categorica: posizione professionale. Ipotesi saggiatedfValore di F Pr > F H01: b1=b2=b3=b4=b5= <.0001 H02: b1=b2=b3=b4=b5=b R 2 = 0,83
Parametri ß stimati ParametriStimaErrore SdtP> | t | Dirig./Quadro <.0001 Altro Dipendente <.0001 Autonomo <.0001 Impiegato <.0001 Operaio <.0001
Oli e Grassi – Posizione Prof. Verifica delle ipotesi relative alle intercette l’ipotesi H03 viene rifiutata (test è significativo); le intercette sono significativamente diverse tra loro: retta unica Questo risultato vale per il livello di significatività del 0.05 e vediamo quali sono le diversità… DFValore di FPr > F H03: a1=a2=a3=a4=a5=a *
Oli e Grassi – Intercette …………2 SU 10 CONFRONTI RISULTANO SIGNIFICATIVAMENTE DIVERSI ConfrontiTest tPr < | t | A1 – A2-2.97* A1 – A5-2.75* STIME 1Dir/Quad Altro Dip Autonomo Impiegato Operaio TUTTAVIA POSSO USARE COME UNICA INTERCETTA LA MEDIA DELLE STIME: e sulla base di questi risultati, come coefficiente: ß unicoErrore SdtP > | t | <.0001 * COPPIE SIGNIFICATIVAMENTE DIVERSE R 2 =0,81
Oli e Grassi - Grafico Posizione Professionale Le tipologie di lavoro medio-alte realizzano un livello nel consumo di oli più basso, ma l’elasticità non varia.