La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Caratteri In corrispondenza di ogni unità statistica si possono osservare dei caratteri. Un carattere può assumere modalità differenti per le varie unità

Presentazioni simili


Presentazione sul tema: "Caratteri In corrispondenza di ogni unità statistica si possono osservare dei caratteri. Un carattere può assumere modalità differenti per le varie unità"— Transcript della presentazione:

1 Caratteri In corrispondenza di ogni unità statistica si possono osservare dei caratteri. Un carattere può assumere modalità differenti per le varie unità (maschio e femmina; viaggio per lavoro, per vacanza, per studio, ecc…) I caratteri si distinguono in: Qualitativi sconnessi (sesso, luogo di nascita, colore degli occhi, luogo di destinazione di un viaggio,…) Qualitativi ordinati (titolo di studio, grado di soddisfazione, posizione in graduatoria, mese …) Quantitativi (numero di figli, pm percorsi, voto ad un esame, numero di posti letto…)

2 Caratteri (o variabili) Tipo di carattereOperazioni che posso fare Qualitativi sconnessi = Qualitativi ordinati=, >, < Quantitativi =, >, <, posso misurare di quanto è minore o maggiore

3 Matrice di dati X1X1 X2X2 X3X3 X4X4 X5X5 ……XpXp 1X 11 X 12 X 13 X 14 X 15 ……X 1p 2X 21 X 22 X 23 X 24 X 25 ……X 2p 3X 31 X 32 X 33 X 34 X 35 ……X 3p 4X 41 X 42 X 43 X 44 X 45 ……X 4p 5X 51 X 52 X 53 X 54 X 55 ……X 5p 6X 61 X 62 X 63 X 64 X 65 ……X 6p ……………………… ……………………… ……………………… n-1X n-11 X n-12 X n-13 X n-14 X n-15 ……X n-1p nX n1 X n2 X n3 X n4 X n5 ……X np

4 Distribuzione di frequenza La distribuzione di frequenza di una variabile è una rappresentazione nella quale ad ogni valore della variabile viene associata la frequenza con la quale esso si presenta nei dati. Distribuzione di frequenza della variabile sesso Frequenza assoluta Frequenza relativa Frequenza percentuale Frequenza assoluta cumulata Frequenza relativa cumulata Frequenza percentual e cumulata njnj fjpjNjNj FjPj Maschi Femmine Totale

5 Distribuzione di frequenza In un collettivo composto da n elementi una variabile statistica X può assumere k modalità diverse x 1, x 2, x 3, …….. x p In modo che la modalità x 1 si presenta n 1, la modalità x 2 si presenta n 2 …….. la modalità x k si presenta n k n 1 + n 2 + n 3 + …….. + n k-1 + n n = n

6 I grafici Devo tenere conto di: Fenomeno oggetto di studio Tipo di variabile esaminata Distribuzione di frequenza Il grafico deve avere le proprietà della Chiarezza – immediatamente chiaro Accuratezza – presenza dellunità di misura Proporzionalità – indicazioni sulle reali dimensioni del fenomeno Il grafico deve sempre contenere: Intestazione – titolo Variabili Unità di misura Fonte dei dati

7 I grafici – variabili sconnesse o qualitative ordinabili Grafici a barre – ogni modalità viene rappresentato da una barra (orizzontale o verticale) la cui lunghezza misura la frequenza (assoluta, relativa o %) Diagrammi circolari – sono a forma di cerchio (torta) - gli spicchi del cerchio sono proporzionali alle modalità da rappresentare. Per ottenere gli spicchi bisogna calcolare langolo corrispondente alla modalità (es: usando le frequenze percentuali si usa la proporzione 360° : 100 = ß : p j Diagrammi in coordinate polari – grafici circolari espressi in coordinate polari – indicati per rappresentare i fenomeni ciclici (giorni della settimana, mesi) Cartogrammi – per rappresentare le serie territoriali – cartine geografiche dove sono rappresentate le partizioni territoriali con sfumature differenti a seconda della frequenza Pictogrammi – grafico con finalità divulgative in cui figure e disegni e simboli simili al fenomeno considerato sono utilizzati con dimensione e numero variabile per indicare la frequenza

8 I grafici – variabili quantitative Istogramma – le classi possono essere di pari ampiezza o con ampiezza diversa. In questo caso la lettura del grafico si basa sulle aree delle colonne e non sullaltezza – dobbiamo calcolare la densità di frequenza (frequenza / ampiezza della classe) Diagrammi in coordinate cartesiane a canne dorgano – per caratteri quantitativi discreti Diagrammi in coordinate cartesiane ortogonali – grafico a linea, si usa per le serie storiche ponendo il tempo sulle ascisse e lintensità del fenomeno sulle ordinate

9 Misure di tendenza centrale La distribuzione di frequenza è una descrizione completa della variabile cioè di come la variabile è distribuita nella popolazione In molte situazioni abbiamo bisogno di indici di sintesi della distribuzione MODA: è la modalità della variabile che si presenta nella distribuzione con maggiore frequenza Si può applicare a tutti i tipi di variabili

10 Misure di variabilità La moda segnala il valore maggiore, ma nulla ci dice su come è distribuita la variabile. Una variabile sconnessa ha una distribuzione massimamente OMOGENEA quando tutti i casi si presentano con la stessa modalità (il 100% del collettivo presenta una unica modalità) – è più omogenea quanto più essa è concentrata È massimamente eterogenea quando i casi sono equidistribuiti fra le modalità

11 Misure di tendenza centrale Data una distribuzione ordinata in senso crescente la mediana è il valore che biripartisce la distribuzione lasciando uguali numero di termini a destra e a sinistra MEDIANA: è la modalità mediana Si può applicare alle variabili ordinabili (non ai caratteri qualitativi sconnessi) Se n è dispari la mediana è il valore o la modalità che occupa la posizione (n+1)/2 Me = x (n +1)/2 Se n è pari la mediana è il valore o la modalità che occupa la posizione (n/2)+1 Me = (x (n /2) + x (n/2+1) )/2

12 Misure di tendenza centrale Data una distribuzione ordinata in senso crescente i quartili sono tre indici che dividono la distribuzione ordinata in 4 parti uguali. Il primo quartile (Q 1 ) è il valore che lascia alla propria sinistra il 25% dei termini e il 75% alla destra. Il secondo quartile (Q 2 ) coincide con la mediana, ed è il valore cha divide in due parti uguali la distribuzione. Il terzo quartile (Q 3 ) è il valore che la scia alla propria sinistra il 75% dei termini e il 25% alla destra.

13 La media Data un insieme di valori quantitativi e un funzione f f (x 1, x 2, …., x n ) si definisce media dei valori x 1, x 2, …., x n secondo il criterio f quel valore M tale che f (x 1, x 2, …., x n ) = f (M, M,, …, M ) La media M rappresenta il valore che sostituito ai singoli valori della distribuzione mantiene inalterato il totale. La media M è semrpe un valore interno allintervallo di valori di x j cioè x min <= M <= x max

14 La media aritmetica La media aritmetica μ di un insieme di n valori x 1, x 2, …., x n di un carattere quantitativo X è pari alla somma dei valori divisa per il loro numero μ =( x 1 + x 2 + …. + x n ) / n μ = ( x i ) / n

15 La media aritmetica Se la distribuzione del carattere è una distribuzione di frequenza la media aritmetica μ si calcola come una media ponderata, cioè sommando i prodotti delle singole modalità x j per j=1, …., k e le rispettive frequenze n j per j = 1, …., k diviso la numerosità del collettivo μ =( x 1 n 1 + x 2 n 2 + …. + x k n k ) / n μ = ( x j n j ) / n Se ho le frequenze relative la formula diventa μ = x j f j

16 La media aritmetica La media aritmetica risente fortemente dei valori estremi della distribuzione. Se sono presenti valori anomali (outlier), il valore medio calcolato può non rappresentare bene la distribuzione. La media aritmetica è molto sensibile ai valori anomali. A volte si usa la media troncata (trimmed mean) ossia la media calcolata solo sui valori centrali della distribuzione La trimmed mean al 90% significa calcolare la media escludendo il 5% dei valori più piccoli e il 5% dei valori più grandi

17 Proprietà della media aritmetica 1) La somma dei valori x 1 + x 2 + …. + x n è uguale alla media moltiplicata per il numero di unità A x i = n μ 2) La somma degli scarti positivi dalla media aritmetica è uguale in valore assoluto a quella degli scarti negativi e quindi la somma degli scarti (positivi e negativi) è uguale a zero Scarto (x i – μ) ( x i – μ) = 0

18 Proprietà della media aritmetica 1) La media M è sempre un valore interno allintervallo di valori di x j cioè x min <= M <= x max 2) La somma dei valori x 1 + x 2 + …. + x n è uguale alla media moltiplicata per il numero di unità n x i = n μ 3) La somma degli scarti positivi dalla media aritmetica è uguale, in valore assoluto, a quella degli scarti negativi e quindi la somma degli scarti (positivi e negativi) è uguale a zero Scarto (x i – μ) ( x i – μ) = 0

19 Proprietà della media aritmetica 4) La somma dei quadrati degli scarti dalla media aritmetica è minore della somma dei quadrati degli scarti da qualsiasi numero c μ Scarto (x i – μ) Scarto (x i – c) ( x i – c) 2 = min per c= μ

20 Medie e Caratteri Tipo di carattereMedie che posso fare Qualitativi sconnessi Moda Qualitativi ordinatiModa, Mediana, Quartile Quantitativi Moda, Mediana, Quartile e Media

21 Variabilità La sola rappresentazione della distribuzione con gli indici di posizione e con le medie non consente spesso di descrivere la distribuzione. Si utilizzano allora delle misure di variabilità. La variabilità esprime la tendenza delle unità di un collettivo ad assumere diverse modalità del carattere Un indice di variabilità V(x) ha le seguenti proprietà: V(x) = 0 se tutte le unità presentano la medesima modalità V(x) > 0 cresce al crescere della diversità tra le modalità V(x + c) = V(x) + c aggiungendo una costante alle modalità di x la variabilità non cambia Se V(x) >= V(y) allora il carattere x è più variabile del carattere y

22 Variabilità 3 categorie di indici: 1. Indici di dispersione intorno alla media 2. Indici di disuguaglianza a coppie 3. Indici di mutabilità che misurano lomogeneità ed eterogeneità tra modalità UNA ULTERIORE DISTINZIONE in: Indici ASSOLUTI: utilizzano la stessa unità di misura della distribuzione e non consentono di fare confronti tra modalità espresse con unità di misura diverse Indici RELATIVI: depurano la distribuzione dellunità di misura e sono adatti per operare dei confronti.

23 Variabilità rispetto ad una media Misura la presenza o no di una certa stabilità dei valori assunti dalle unità rispetto ad una media – indici si basano sul concetto di scarto o scostamento rispetto alla media delle varie unità La VARIANZA σ 2 = ( ( x i – μ) 2 ) / n Se ho una distribuzione di frequenza la varianza sarà σ 2 = ( ( x j – μ) 2 n j ) / n σ 2 = ( x j – μ) 2 f j

24 Variabilità rispetto ad una media La DEVIANZA è la somma degli scarti al quadrato (è il numeratore della varianza) DEV = ( x i – μ) 2 La varianza ha il limite di utilizzare come unità di misura lunità di misura del carattere elevata al quadrato Per questo si utilizza lo scarto quadratico medio o deviazione standard che è la RADICE QUADRATA della varianza

25 Coefficiente di variazione Le misure viste fino ad ora sono indici ASSOLUTI, ossia strettamente legati alle unità di misura È difficile fare dei confronti tra distribuzioni diverse Il più diffuso indice di variabilità relativa è il coefficiente di variazione (CV) che si ottiene dividendo la deviazione standard con la media CV = σ / μ Molto spesso il CV è espresso in termini % cioè moltiplicato per 100 CV = (σ / μ)*100

26 Campo di variazione Tra le misure che si basano sul confronto di misure caratteristiche della distribuzione cè il CAMPO DI VARIAZIONE o RANGE Dato un insieme n di valori x 1, x 2, …., x n ordinati il campo di variazione è la differenza tra il valore più grande e il più piccolo R = x n - x 1 È un indice molto grezzo e molto sensibile ai valori anomali (è = 0 quando tutti i valori sono uguali e crescere al crescere della variabilità)

27 Differenza interquartile È un indice semplice ma che mitiga leffetto dei valori anomali Dato un insieme n di valori x 1, x 2, …., x n ordinati la differenza interquartile (DQ) è la distanza tra il terzo (Q 3 ) e il primo (Q 1 ) quartile DQ = Q 3 - Q 1 Se lintervallo interquartilico è piccolo vuol dire che la metà delle osservazioni si trova intorno alla mediana, allaumentare della distanza interquartilica aumenta la dispersione del 50% delle osservazione centrali intorno alla mediana


Scaricare ppt "Caratteri In corrispondenza di ogni unità statistica si possono osservare dei caratteri. Un carattere può assumere modalità differenti per le varie unità"

Presentazioni simili


Annunci Google