La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

LEZIONE A.3 Rappresentazioni grafiche TQuArs – a.a. 2010/11 Tecniche quantitative per l’analisi nella ricerca sociale Giuseppe A. Micheli.

Presentazioni simili


Presentazione sul tema: "LEZIONE A.3 Rappresentazioni grafiche TQuArs – a.a. 2010/11 Tecniche quantitative per l’analisi nella ricerca sociale Giuseppe A. Micheli."— Transcript della presentazione:

1 LEZIONE A.3 Rappresentazioni grafiche TQuArs – a.a. 2010/11 Tecniche quantitative per l’analisi nella ricerca sociale Giuseppe A. Micheli

2 In questa lezione.. In questa lezione acquisteremo familiarità con tabellare  La rappresentazione di una variabile statistica in forma tabellare grafica  La rappresentazione di una distribuzione di frequenza nella forma grafica più adatta al corrispondente livello di misurazione. Introdurremo così i:  Diagrammi a barre  Diagrammi ad aste  Istogrammi miscugli di popolazioni Infine, proprio perché la rappresentazione grafica di una variabi-le è uno strumento molto potente e efficace, prenderemo spunto da questa per introdurre il concetto di miscugli di popolazioni.

3 La rappresentazione tabellare Abbiamo già visto che la forma ‘in punta di forchetta’ di una v.s. è quella (orizzontale) di una suc- cessione ordinata di coppie di va-lori {x i, n i } univocamente associati x 1 x 2 x 3 x 4 x k X = n 1 n 2 n 3 n 4 n k D’ora in poi useremo questa rappre- sentazione tabellare ‘in verticale’. nini n1n1 n2n2 n3n3 n4n4 n5n5 N f i = n i /N … … … … … … xixi x1x1 x2x2 x3x3 x4x4 x5x5 x i n i … … … … … … Essa consente di affiancare alle colonne di modalità e numerosità altre colonne con elaborazioni successive dei dati (per esempio le frequenze relative), e quindi ci permette di seguire passo passo i calcoli per ogni misura di sintesi delle variabili.

4 Ripasso: una tipologia di variabili Anche la rappresentazione tabella- re può essere troppo dettagliata. Come ‘fotografare’ una distribuzio- ne di frequenza? associamo ad ogni coppia (x i, n i ) un punto sul piano Trascriviamo le modalità (x i ) sul- l’asse delle ascisse di un piano cartesiano, e le numerosità (n i ) sull’asse delle ordinate. Così fa- cendo associamo ad ogni coppia (x i, n i ) un punto sul piano. Qualitative nominali Qualitative ordinali Quantitative discrete Quantitative per classi xixi x1x1 x2x2 x3x3 x4x4 x5x5 nini n1n1 n2n2 n3n3 n4n4 n5n5 Ma c’è un problema: non tutte le moda- lità di una v.s. sono tranquillamente associabili a punti su un piano. Dovremo dare regole di costruzione dei grafici diverse per tipo di variabile: n1n1 x1x1 (x i, n i )

5 Diagrammi a barre per variabili nominali xixi nini fifi Appartamento in condominio340,667 Casa rurale60,117 Villino mono-bifamiliare110, ,000 Unica regola per la costruzione dei diagrammi a barre: la lun- ghezza delle barre deve essere proporzionale a n i oppure a f i. Popolazione italiana secondo il tipo di abitazione (dati di fantasia, numerosità in milioni) Diagramma a ‘barre’ Nota: è del tutto arbitraria la scelta sia dell’ordine tra le modalità, sia della distanza tra barre

6 Altri rappresentazioni diagrammatiche E’ talmente libera la scelta della rappresentazione gra- fica, che essa può assumere anche altre forme più o meno accattivanti.. Diagramma a torta Altre iconografieDiagramma a nastri

7 Diagrammi a barre, variabili ordinali xixi nini fifi Sinistra200,113 Centrosin.450,254 Centro390,220 Centrodes.590,290 Destra200, ,000 Due regole per costruire diagrammi a barre per variabili ordinali:  Lunghezza delle barre propor- zionale a n i oppure a f i.  Ordine tra le modalità obbliga- to (non la distanza) Abacus Social Barometer 1996, Autocolloca- zione politica. Giovani di anni, NordOvest n i f i NB:Che le ordina- te del grafico sia- no proporzionali a n i o a f i il risul- tato non cambia: f i n i * f i = n i * (1/N)

8 Diagrammi ad aste, variabili discrete Numero di azionisti per dimensione del pacchetto azionario xixi nini Per costruire grafici per variabili discrete le regole diventano tre:  Lunghezza delle aste pro- porzionale a n i oppure a f i.  Ordine tra le modalità obbli- gato.  Ora anche la distanza tra le modalità è obbligata!!!  la v.s. quantitativa discreta assume solo tre valori; essa non esiste, ad esempio, per x = 33,56 oppure per x = 0  il diagramma rappresenta davvero uno spazio bidimen- sionale, in cui ogni punto ha coordinate (x i, f i ) o (x i, n i )  le modalità sono poste sull'asse delle ascisse e le frequenze sull'asse delle ordinate per convenzione Diagramma ad ‘aste’ xixixixi nininini

9 Variabili per classi: il diagramma sbagliato Che fare, se una variabile è per classi? In questo caso non pos- siamo associare a ogni coppia (x i,n i ) un punto sul piano poiché le modalità non sono puntuali. Pazienti anoressiche per età di insorgen- za (Selvini, 1998) x i -x i+1 nini alzare su ogni segmento dell’ascisse, associa- to a una classe (), un ret- tangolo di giusta altezza. Dovremo piuttosto alzare su ogni segmento dell’ascisse, associa- to a una classe (x i -x i+1 ), un ret- tangolo di giusta altezza. Ma quale altezza è giusta? Morale: meglio far sì che siano le aree ad essere pro- porzionali alle numerosità nininini xixixixi Qualcosa non qua- dra: usando le nu- merosità come or- dinate, i 45 pazien-ti della classe (11-14) sembrano dav- vero pochi rispetto ai 63 della classe (14-19). Il grafico non rispetta le pro-porzioni tra classi

10 Variabili per classi: l’istogramma giusto Il diagramma con altezze proporzionali alle densità e basi alle ampiezze delle classi si chiama ISTOGRAMMA x i -x i+1 nini Vogliamo che le aree dei rettangoli ri- spettino le proporzioni tra le numerosità. densità. Poiché “Area rettangolo=base x altezza” e la base dei rettangoli è l’ampiezza delle rispettive classi (  i = x i+1 - x i ), l’altezza dei rettangoli deve essere h i =n i / i. Questo rapporto si chiama densità. Densità: h i =n i / i hihihihi xixixixi ii hi=ni/ihi=ni/i 25,50 315,00 512,60 63,83 Condizione di area:  i h i  i =N Ora la terza classe (14-19) con- tinua ad avere area più estesa, ma la sua altezza è inferiore al-la classe (11-14) dato che corri- sponde a una classe più ampia

11 Due cose che è bene sapere sull’istogramma/1 x i -x i+1 nini fifi , , , O, ,000 La prima cosa è che, come per i diagrammi a aste l’ordinata può essere indifferentemente proporzionale a n i o a f i, anche l’istogramma può calibrare le ordinate non alla densità assolute h i =n i / i ma alle densità relative  i =f i / i. Le proporzioni del grafico non mutano. La condizione d’area diventa  i  i  i =1  i  i  i =1. f xf xf xf x x ii   i =f i / i 20, , , ,0262

12 Due cose che è bene sapere sull’istogramma/2 La seconda cosa è che, frammentando indefinitamente i segmenti di base, le ampiezze  i diventano differenziali (dx) e le variabili tendono a funzioni di densità di frequenza continue per le quali vale la condizione d’area f xf xf xf x x f(x)dx=1 Cioè l’area sottesa alla curva è =1. Non preoccupatevi, comunque. Nella prima e nella seconda parte del corso useremo variabili continue solo come forme idealtipiche per cogliere l’essenza di una legge di frequenza.  f(x)dx = 1

13 Due esempi di leggi matematiche di frequenza Solo nell’analisi dell’inferenza ritroveremo ‘distribuzioni notevoli’, cioè leggi teoriche che stimano il valore della densità di frequenza in funzio- ne del valore delle modalità: y = f(x). Ci limitiamo a due esempi. Distribuzione rettangolare o uni- forme. R Distribuzione rettangolare o uni- forme. Ricordate l’istogramma?  i f i  i  i = f i /  i f xf xf xf x f xf xf xf x ab xx f x f x = 1 / (b-a) Distribuzione esponenziale (ne- gativa) Distribuzione esponenziale (ne- gativa) (esempio: tempi di attesa) f x f x = e - x / 1/

14 Un esempio per classi x i |- x i+1 0 | | | | | | |-300 nini fifi 11,5 39,9 31,5 11,2 3,4 2,0 0,5 100 ii hihi 6,30 21,95 17,30 6,15 1,85 0,37 0,04 ii 0,0057 0,0199 0,0157 0,0056 0,0017 0,0003 0,0001 xixi hihi General Survey Lombarda 2000 Distribuzione famiglie per reddito annuo (milioni lire) Nota: sull’asse orizzontale i redditi sono stati divisi per 10 (cioè espressi in decine di milioni) per pura comodità, senza che ne risenta la forma del grafico Nota: la classe (80-100) ha numerosità che è solo il 60% superiore a quella della classe seguente, ma la densità è cinque volte tanto!

15 Miscugli di popolazioni. Un esempio Spesso una popolazione non è omogenea al suo interno, rispetto a un ca- rattere osservato. Facciamo il caso della struttura per età degli immigrati presenti in Lombardia Età x i |-x i+1 Totale f i ampiez za densità h i 15 |-25 15,7101,57 25 |-35 49,7104,97 35 |-45 27,3102,73 45 |-65 7,3200,37 100,0

16 Subpopolazioni e distribuzioni di frequenza Ma popolazioni di diversa provenienza hanno diverse strutture per età. Per esempio: Età x i |-x i+1 Peru f i Albania f i 15 |-25 9,729,5 25 |-35 45,541,1 35 |-45 30,823,8 45 |-65 14,05,6 100,0 Più vecchia la struttura per età dei peruviani Più giovane la struttura per età albanese Il numero di immigrati di anni sarà pari alla somma delle numerosità di immigrati dei diversi paesi. media aritmetica ponderata La corrispondente frequenza relativa f(15-25) sarà invece la media aritmetica delle frequenze nei diversi gruppi nazionali, ciascuna ponderata per la numerosità del corrispondente gruppo (un dato che non possediamo!).

17 Un secondo esempio Abbiamo già imparato a classificare le province ita- liane secondo il tasso di di- soccupazione. miscuglio. Disegnando gli istogrammi possiamo capire cosa signi- fica dire che una popola- zione è un miscuglio. x i |-x i+1 niNniN niSniS niTniT 0– Miscuglio è un aggregato di subpopolazioni rispetto a uno stesso carattere. La distribuzione di numerosità del miscuglio è la somma delle di- stribuzioni delle singole subpopo- lazioni. La distri- buzione di fre- quenza (relativa) è la loro media ponderata. Tornateci su quando avremo introdotto il concetto di media ponderata..

18 Un terzo esempio Il caso della curva dei decessi per età (Lexis) dxdxdxdx x d x L’andamento standard della frequenza dei decessi per età ( d x ) è quello riportato con linea spessa. Un secolo fa W. Lexis ha ipotizzato che la legge di frequenza dei decessi sia il risultato di un miscuglio di due popolazioni. La curva rossa indica la subpopolazione congenitamente debole, che viene eliminata nei primi anni con andamento esponenziale negativo. La curva blu indica la legge dei decessi per la popolazione ‘normale’, simmetrica campanulare (la chiameremo curva Normale o di Gauss).

19 Un esempio riassuntivo x i |- x i+1 0,0 |- 0,8 0,8 |- 1,2 1,2 |- 1,6 1,6 |- 2,0 2,0 |- 2,4 2,4 |- 2,8 2,8 |- 3,2 3,2 |- 3,6 3,6 |- 4,0 4,0 |- 4,4 4,4 |- 4,8 4,8 |- 5,2 5,2 |- 6,0 6,0 |- 8,0 8,0 |- 12 nini ii 0,8 0,4 0,8 2,0 4,0 fifi hihi 5,0 2,5 17,5 25,0 22,5 57,5 27,5 37,5 20,0 15,0 7,5 3,7 4,0 0,7 ii 0,0437 0,0225 0,1525 0,2200 0,1975 0,5050 0,2400 0,3300 0,1750 0,1325 0,0650 0,0325 0,0350 0,0065 Esercitiamoci su dati di sur- vey che ci consentono di svi- luppare l’intera procedura di calcolo di variabili per classi. I dati riportati nelle prime due colonne riguardano le frequenze relative dei redditi ‘equivalenti’ delle 114 fami- glie di Milano città incluse nella General Social Survey. Conoscendo le f i e N (114) possiamo ricostruire le nu- merosità specifiche n i. Date le ampiezze ( i ) calco- liamo anche le densità.

20 I redditi di Milano città x i |- x i+1 0,0 |- 0,8 0,8 |- 1,2 1,2 |- 1,6 1,6 |- 2,0 2,0 |- 2,4 2,4 |- 2,8 2,8 |- 3,2 3,2 |- 3,6 3,6 |- 4,0 4,0 |- 4,4 4,4 |- 4,8 4,8 |- 5,2 5,2 |- 6,0 6,0 |- 8,0 8,0 |- 12 fifi ii 0,0437 0,0225 0,1525 0,2200 0,1975 0,5050 0,2400 0,3300 0,1750 0,1325 0,0650 0,0325 0,0350 0,0065 Notate come la classe dei ricchi (6-8) pur essendo molto più numerosa delle precedenti (70 contro 26) ha ampiezza maggiore e densità assai minore. Nota: sull’ordinata sono riportate le densità relative (verificate le proporzioni!) ma moltiplicate per cento per comodità (numeri più compatti). Nessun danno per il grafico! ii

21 I redditi dei piccoli comuni x i |- x i+1 0,0 |- 0,8 0,8 |- 1,2 1,2 |- 1,6 1,6 |- 2,0 2,0 |- 2,4 2,4 |- 2,8 2,8 |- 3,2 3,2 |- 3,6 3,6 |- 4,0 4,0 |- 4,4 4,4 |- 4,8 4,8 |- 5,2 5,2 |- 6,0 6,0 |- 8,0 8,0 |- 10 fifi ii 0,0137 0,0350 0,2200 0,4100 0,3500 0,4900 0,2700 0,2000 0,1200 0,1625 0,0600 0,0425 0,0237 0,0105 0,0012 Questa invece è la distri- buzione di frequenza dei redditi nei piccoli comuni Anche sull’ascissa le modalità sono modificate in proporzione (moltipli-cate per dieci) per como-dità, senza danni per una corretta lettura del grafico

22 L’utilità del confronto Rosso = Milano Blu = Paesi Più redditi alti in città Più poveri in città Più redditi mediobassi nei paesi La sovrapposizione tra le due distribuzioni consente di cogliere minuziosamente alcune importanti differenze

23 Miscugli: una porta verso l’analisi a 2 variabili Acqua potabile (dati 1996) Nord e Centro n i Sud e Isole n i Totale (x1000) Sufficiente sempre Insufficien te 3 mesi Insufficien te 6+ mesi Totale Acqua potabile Nord e Centro f i Sud e Isole f i Totale f i Suff 88,3%29,9%66,6% Insuff 3 mesi 7,5%20,8%12,5% Insuff 6+ mesi 4,2%49,3%20,9% Totale Popolazione italiana secondo l’accesso all’acqua potabile e la ripartizione geografica Miscugli si hanno anche per variabili qua- litative. Per esempio, hanno acqua a suffi- cienza 2 italiani su 3, ma solo 3 su 10 al Sud, e 9 su 10 al Nord. Le distribuzioni di frequenze relati- ve del Nord e del Sud corrispondo- no (se moltiplicate per le rispettive numerosità complessive) alla tabel- la delle numerosità congiunte per ‘Accesso all’acqua’ e ‘Ripartizione’. Il confronto tra subpopolazioni di un miscuglio è una porta di passaggio dell’analisi da una a due variabili!!


Scaricare ppt "LEZIONE A.3 Rappresentazioni grafiche TQuArs – a.a. 2010/11 Tecniche quantitative per l’analisi nella ricerca sociale Giuseppe A. Micheli."

Presentazioni simili


Annunci Google