La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto.

Presentazioni simili


Presentazione sul tema: "La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto."— Transcript della presentazione:

1 La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto di una indagine statistica Unità statistica: ciascun elemento di una popolazione Campione: sottoinsieme della popolazione PROIEZIONI DI VOTO (elezioni) Popolazione: tutti gli aventi diritto al voto Campione: solo gli aventi diritto interrogati

2 La statistica descrittiva ESEMPIO Introduzione 2 Carattere: ogni aspetto del fenomeno da individuare Modalità: ciascuno dei diversi modi con cui un carattere può presentarsi RELATIVAMENTE AL FENOMENO COLLETTIVO GIOVANI Il carattere Titolo di studio si può presentare nelle seguenti modalità: licenza media, qualifica professionale, diploma di scuola media superiore, laurea triennale, laurea specialistica, dottorato. Il carattere Utilizzo del tempo libero si può presentare nelle seguenti modalità: riposo, letture varie, cinema e teatro, discoteche, bar e pub, attività sportive, visite a musei o mostre, ecc.

3 La statistica descrittiva Caratteri qualitativi e quantitativi 3 CARATTERE Qualitativo: le sue modalità non sono espresse da numeri e vengono dette mutabili statistiche. Quantitativo: le sue modalità sono espresse da numeri e vengono dette variabili statistiche. Discreto (numeri naturali): ad esempio in una popolazione il numero di figli. Continuo (intervalli di numeri reali): ad esempio in una popolazione laltezza.

4 La statistica descrittiva Le distribuzioni di frequenze 4 I dati di unindagine statistica possono essere raccolti in una distribuzione di frequenze (assolute o relative) nella quale ogni modalità x i del carattere è associata a un numero f i, la sua frequenza assoluta, che indica quante volte quel carattere compare. Frequenza relativa: p i = (T : totale delle osservazioni) fifi T In forma percentuale: p i (percentuale) = p i 100% Rappresentazione della distribuzione di frequenze x x1x2…xnx1x2…xn Freq. ass. f1f2…fnf1f2…fn Freq. rel. p1p2…pnp1p2…pn Dove: x: carattere x i : modalità del carattere f i : frequenze assolute p i : frequenze relative

5 La statistica descrittiva Rappresentazione grafica 5 Una distribuzione di frequenze può essere rappresentata graficamente mediante: Un diagramma a rettangoli o ortogrammi

6 La statistica descrittiva Rappresentazione grafica 6 Un diagramma circolare o areogramma

7 La statistica descrittiva Rappresentazione grafica 7 Un diagramma cartesiano (per dati quantitativi di natura discreta)

8 La statistica descrittiva Rappresentazione grafica 8 Un istogramma (per dati quantitativi di natura continua) Laltezza dei rettangoli si ottiene dividendo la frequenza per lampiezza della relativa classe.

9 La statistica descrittiva Sintesi dei dati 9 Indici di variabilità Scarto quadratico medio o deviazione standard σ Varianza σ Indici di posizione Medie ferme: aritmetica, geometrica, armonica Medie lasche: moda, mediana

10 La statistica descrittiva Le medie ferme 10 Si dice media aritmetica semplice fra n numeri x 1, x 2, ……., x n il rapporto M fra la loro somma ed n ; x 1 + x 2 + ……., + x n M = = n n Σ i = 1 xixi n ESEMPIO mese1 N. ore Unazienda ha raccolto i dati relativi al numero di ore di lavoro mensili complessive dei dipendenti. Calcoliamo il numero medio di ore lavoro mensili M = = 14684,25 12 La media aritmetica può essere calcolata solo per dati di tipo quantitativo.

11 La statistica descrittiva Le medie ferme 11 Se i dati di una variabile statistica si presentano con una certa frequenza per calcolare il valor medio si usa la media ponderata. Una media in cui ogni dato ha un suo peso (rappresentato dalla sua frequenza) si dice ponderata. Se f 1, f 2, …… f n sono le frequenze delle modalità x 1, x 2, …… x n, la media aritmetica M(x) è data dalla formula x 1 f 1 + x 2 f 2 + ……., + x n f M(x) = = f 1 + f 2 + … f n Σ i = 1 xifixifi n Σ fifi n

12 La statistica descrittiva Le medie ferme 12 ESEMPIO Num. Dei maschi nelle famiglie x Freq. assoluta f Prodotto x f TOTALE Possiamo dire che in media, ogni famiglia ha un numero di maschi pari a: M = = 2,72

13 La statistica descrittiva Le medie ferme 13 Nel caso di una distribuzione per classi, il calcolo della media viene fatto sostituendo ciascuna classe con il suo termine centrale, ottenuto calcolando la semisomma dei valori estremi. Altezze [ ) [ ) [ ) [ ) [ ) [ ) [ ) [ ) [ ) Maschi = = = ,5 250 = ,5 330 = = = = = 920 TOTALE ,5 177, Valori centrali Freq.Prodotti Maschi = = = ,5 260 = ,5 196 = = = = = Freq.Prodotti Altezza media dei maschi: M = = 176,24 (cm) Altezza media delle femmine: M = = 168,27 (cm)

14 La statistica descrittiva Le medie ferme 14 Si chiama scarto della media la differenza fra il valore osservato e la media stessa. Dati cioè gli n valori x 1, x 2, …… x n, gli scarti dalla loro media M sono i valori x 1 – M, x 2 – M, ……., x n – M Proprietà della media aritmetica. La somma degli scarti della media è sempre nulla: (x 1 – M) = 0 i = 1 n Σ Se si considerano i quadrati degli scarti, cioè (x 1 – M) 2, (x 2 – M) 2 ….., (x n – M) 2, la somma dei quadrati degli scarti della media aritmetica è minima (rispetto a una qualunque altra media).

15 La statistica descrittiva Le medie ferme 15 Media geometrica semplice M G fra n numeri positivi x 1, x 2, ….., x n : radice n-esima del loro prodotto. M G = x 1 x 2, ….., x n ESEMPIO Dati i numeri 3, 6, 9, 15, 24, 36 M G = ,32 6

16 La statistica descrittiva Le medie ferme 16 Nel caso di una media geometrica ponderata: ESEMPIO Dove f i : pesi e F = f 1 + f 2 + ….. f n x f TOTALE (F)30 M G = ( x 1 ) f 1 (x 2 ) f 2, ….., (x n ) f n F M G = ,32 30 Nel caso di distribuzioni per classi si trova prima il valore centrale della classe e poi si effettua il calcolo della media ponderata.

17 La statistica descrittiva Le medie ferme 17 Media quadratica semplice M Q fra n numeri i x 1, x 2, x 3 ….., x n : radice quadrata della media aritmetica dei quadrati dei dati. ESEMPIO Dati i numeri 3, 5, 7, 9, 12 x 1 + x 2 +…+ x n n M Q = = n i = 1 n Σ xi2xi M Q = 7,85 5

18 La statistica descrittiva Le medie ferme 18 ESEMPIO Nel caso di una media ponderata: x 1 2 f 1 + x 2 2 f 2 +….., x n 2 f n f 1 + f 2 +…… f n M Q = x f TOTALE (F) M Q = 7,67 30 = 1767 Nel caso di distribuzioni per classi si usa il termine centrale di ogni classe.

19 La statistica descrittiva Le medie ferme 19 Media armonica semplice M A fra due numeri x 1, x 2, ….., x n : reciproco della media aritmetica dei reciproci dei dati. 1 n M A = = 1 x1x1 1 x2x2 1 xnxn + + …. + n 1 x1x1 1 x2x2 1 xnxn Nel caso di una media ponderata: f 1 + f 2 + ….. + f n M A = f1f1 x1x1 f2f2 x2x2 fnfn xnxn + + …. +

20 La statistica descrittiva Le medie ferme 20 Nel caso di distribuzioni per classi si utilizza il termine centrale. ESEMPIO x f TOTALE (F)30 Tutte le medie finora definite si possono calcolare solo per dati di tipo quantitativo. 30 M A = ,14

21 La statistica descrittiva Le medie lasche 21 Si dice moda (valore modale) di una distribuzione di frequenze, il termine, se esiste, cui corrisponde la massima frequenza nella distribuzione. Località marine è la moda per i turisti italiani. Città di interesse storico/artistico è la moda per i turisti stranieri. Una distribuzione può avere più di un termine modale o può non averne (distribuzione in cui ogni modalità ha la stessa frequenza).

22 La statistica descrittiva Le medie lasche 22 Nel caso in cui una distribuzione sia per classi, si parla di classe modale. Se le classi della distribuzione hanno tutte uguale ampiezza, allora la classe modale è quella che presenta frequenza più alta. Se le classi hanno ampiezze diverse si valuta il rapporto tra frequenza e ampiezza della classe. La classe cui corrisponde laltezza maggiore è la classe modale.

23 La statistica descrittiva ESEMPIO Le medie lasche 23 Mediana M C di una distribuzione: il termine che, disposti i dati in ordine crescente o decrescente, occupa il posto centrale. Se i termini fra cui calcolare il valore mediano sono n e n è dispari, la mediana è il valore che occupa il posto ; se n è pari, tutti i punti dellintervallo [x, x ] sono valori mediani; di solito si prende il termine centrale di questo intervallo. 2 n n 2 Date le distribuzioni di 7 termini e di 8 termini 1, 2, 3, 5, 7, 11, 20 Il termine mediano è quello di posto = 4 cioè M e = , 2, 3, 5, 7, 9, 12, 15, 34 Il termine mediano è il termine centrale dellintervallo [7, 9] cioè M e = 8

24 La statistica descrittiva ESEMPIO Le medie lasche 24 Se i valori della distribuzione hanno un loro peso, bisogna calcolare le frequenze cumulate (frequenze relative a una data modalità uguali alla somma delle frequenze di tutte le modalità minori o uguali a esse). Numero voti Frequenza TOTALE (F)30 Freq. cumulate Consideriamo adesso la metà del totale delle frequenze (30 : 2 = 15); poiché n = 30, quindi è pari, il valore mediano è il termine centrale dellintervallo [x 15, x 16 ] ed è quindi necessario trovare quali sono questi elementi. continua

25 La statistica descrittiva Le medie lasche 25 Allora, 2 posti sono occupati dalla modalità 1, 8 posti sono occupati dalla modalità 2 (in totale abbiamo 10 posti, cioè il valore della colonna delle frequenze cumulate in corrispondenza della seconda modalità), 12 sono i posti occupati dalla modalità 3 (in totale abbiamo contato 22 posti, cioè abbiamo superato la metà); quindi il quindicesimo e il sedicesimo posto sono occupati entrambi dalla modalità 3. La mediana della distribuzione è quindi il valore centrale dellintervallo [3, 3], cioè M e = 3. Nel caso in cui n è dispari, la mediana corrisponde allelemento di posto ; per trovarlo basta cercare nella colonna delle frequenze cumulate il primo numero che è maggiore o uguale di tale valore e leggere lelemento corrispondente. 2 n + 1

26 La statistica descrittiva Le medie lasche 26 Se la distribuzione è per classi bisogna calcolare la frequenza cumulata. Ricoveri [0-4] [5-9] [10-14] [15-19] [20-24] [25-30] Freq. Assol TOTALE (F)2000 Freq. cumulate La metà delle osservazioni è 1000 e quindi per arrivare alla mediana dobbiamo contare le prime 1000 persone disposte in ordine crescente di numero di ricoveri subiti; poiché il valore 1000 e il valore 1001 delle frequenze cumulate cadono nella seconda classe, possiamo dire che la classe mediana è la [5 – 9]. Possiamo allora calcolare: 2 N A ( ) F f M e = i + N: numero totale osservazioni F: frequenza cumulata fino alla mediana esclusa f: frequenza della classe mediana A: ampiezza della classe mediana i: estremo inferiore della classe mediana ESEMPIO

27 La statistica descrittiva Le misure di sisperione 27 Per avere informazioni su come i dati di una indagine statistica si distribuiscono attorno ai valori di sintesi e quindi poter confrontare distribuzioni, si studiano gli indici di variabilità. Campo di variabilità di un insieme di n dati numerici x 1, x 2, ….. x n : differenza tra il valore massimo e il valore minimo degli x i. ESEMPIO Supponiamo che i rilevamenti compiuti su un campione di individui sulla pressione minima sanguigna abbia dato i seguenti risultati: Il campo di variabilità di questi dati è dato da 115 – 60 = 55; se basassimo le nostre considerazioni solo su questo valore, saremmo portati a dire che in quel gruppo di persone vi è unalta variabilità fra i dati, mentre in realtà, osservando meglio, si nota che la maggior parte di essi (tranne due) si distribuiscono in un ambito più ristretto compreso fra 80 e 95.

28 La statistica descrittiva Le misure di dispersione 28 Scarto quadratico medio o deviazione standard σ: media quadratica degli scarti dalla media aritmetica M. σ = n i = 1 n Σ (x i – M) 2 Nel caso di dati semplici σ = i = 1 n Σ {(x i – M) 2 f i } Σ i = 1 n fifi Nel caso di dati ponderati con pesi f i Varianza (σ) 2 : quadrato dello scarto quadratico medio. Per il calcolo di σ (e quindi di σ 2 ) si può anche usare la formula: σ = media dei quadrati degli x i quadrato della media

29 La statistica descrittiva Le misure di dispersione 29 ESEMPIO Ad otto gruppi di persone è stato chiesto di provare due tipi particolari di shampoo che indicheremo con A e B, e di sceglierne quindi uno. Gli esiti di questa scelta sono riportati nella seguente tabella. A15 B Sommando le preferenze accordate ai due prodotti, sia A che B ne hanno totalizzate 104. Mediamente = 13 voti da ciascun gruppo continua

30 La statistica descrittiva Le misure di dispersione 30 ESEMPIO Preferenze di A TOTALE Scarti (Scarti) 2 Preferenze di B Scarti (Scarti) 2 TOTALE Calcoliamo lo scarto quadratico medio della distribuzione di A e di B. σ A = 8 i = 1 8 Σ (x i – 13) 2 = = 3, σ B = 8 i = 1 8 Σ (x i – 13) 2 = = 5,


Scaricare ppt "La statistica descrittiva ESEMPIO Introduzione 1 Oggetto della statistica: studio dei fenomeni collettivi Popolazione: insieme degli individui oggetto."

Presentazioni simili


Annunci Google