La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

STATISTICA ASSISTITA Esercitazione 25.10.2010 dott.ssa Clelia Cascella.

Presentazioni simili


Presentazione sul tema: "STATISTICA ASSISTITA Esercitazione 25.10.2010 dott.ssa Clelia Cascella."— Transcript della presentazione:

1 STATISTICA ASSISTITA Esercitazione 25.10.2010 dott.ssa Clelia Cascella

2 Argomenti della lezione Descrizione statistica dei dati: –INDICI DI SINTESI: medie razionali (media aritmetica, media geometrica e media armonica) medie di posizione (moda, mediana, primo e terzo quartile) VAI, VAS e box plot –MISURE DI VARIABILITA’: variabilità assoluta (varianza, scarto quadratico medio, ecc.) variabilità relativa (coefficienti di variazione, rapporto di concentrazione, ecc.)

3 Come affrontare un esercizio Capire l’obiettivo dell’esercizio Scegliere gli strumenti statistici migliori tenendo a mente l’obiettivo cognitivo la natura dei dati (disponibili nel testo dell’esercizio) Individuare e calcolare le informazioni mancanti In vostro aiuto vi è anche il formulario (disponibile sul CD- ROM e sul sito del prof. Perna alla voce “materiale di supporto)

4 Misure di sintesi: 3 tipologie da tenere bene a mente Distribuzione per unità Distribuzione di frequenza Distribuzione in classi AdolescentiPeso Gemma67 Flora57 Giuseppe85 Antonio86 Carla61 Giulia57 Fabio91 totale504 Classi d’etàPopolazione 0 – 1418807 15 – 2937537 30 – 4436748 45 – 5935070 60 – 7429382 75 – 8911981 90 – 104635 Totale170196 etàstudenti 3117 2619 2524 26 3230 3431 3034 2837 3344 2745 2965 tot372

5 Tipo 1: distribuzione per unità AdolescentiPeso Gemma67 Flora57 Giuseppe85 Antonio86 Carla61 Giulia57 Fabio91 totale504 x n = determinazioni della variabile N= numerosità del collettivo

6 Tipo 2: distribuzione di frequenze x n = determinazioni della variabile n i = frequenze N= numerosità del collettivo etàstudentietà* freq 3117527 2619494 2524600 2426624 3230960 34311054 30341020 28371036 33441452 27451215 29651885 tot37210867 Metodo I. Calcolare le frequenze assolute cumulate ed individuare il valore mediano, cioè quello associato alla posizione n/2. Metodo II. Calcolare le frequenze relative cumulate ed individuare il valore mediano, e cioè quello corrispondente al valore immediatamente superiore allo 0,5.

7 Calcolo della mediana etàfrfr ass cum 2426 252450 261969 2745114 2837151 2965216 3034250 3117267 3230297 3344341 3431372 etàfrfr relfreq rel cum 24260,070 25240,0650,134 26190,0510,185 27450,1210,306 28370,0990,406 29650,1750,581 30340,0910,672 31170,0460,718 32300,0810,798 33440,1180,917 34310,0831,000 372 Il valore mediano è quello associato alla posizione n/2  372/2=186 che cade nell’6° posto delle frequenze cumulate. Il valore 186 è maggiore di 151. Esso è quindi contenuto qui Il valore modale associato è quindi

8 Tipo 3: distribuzione in classi classi di età pololazio nev.c.v.c. * fr ampiezza classed.frelativecumulate 01418.8077131.649141.343,360,11118.807 152937.53722825.814142.681,210,22156.344 304436.748371.359.676142.627,430,21693.092 455935.070521.823.640142505,000,206128.162 607429.382671.968.594142.098,710,173157.544 758911.98182982.44214855,790,070169.525 901046359761.5951446,640,004170.160 7.153.410 1,00 xixi nini LiLsNi b)Determino di ciascuna classe il valore centrale Li+Ls 2 c)Moltiplico il v.c. per la frequenza della rispettiva classe d)Calcolo l’amipiezza della classe Ls-Li e)Trovo la densità di frequenza rapportando n i /a.c. f)Relativizzo le frequenze n i /N i g)Cumulo le frequenze mimi m i * nini

9 classi di etàpopolazionev.c.v.c. * frampiezzad.f fr rel fr cum 01418.8077131.649141.343,360,11118.807 152937.53722825.814142.681,210,22156.344 304436.748371.359.676142.627,430,21693.092 455935.070521.823.640142505,000,206128.162 607429.382671.968.594142.098,710,173157.544 758911.98182982.44214855,790,070169.525 901046359761.5951446,640,004170.160 7.153.410 1,00 m i = valore centrale n i = frequenze N =collettivo Q1 1/4N42540 L inf 15 Σfq118807 Fq137537 c14 Q123,85 Mediana N/285080 L inf 30 Σf56344 Fmed36748 c14 Me40,95 Q3 3/4N127620 L inf 45 Σfq393092 Fq3 35070 c14 Q358,78

10 Moda L115 |Δ1|18730 |Δ2|825 |Δ1|+|Δ2 | 19591 amp classe14 classi di etàpololazionev.c.v.c. * fr Ampiezza classerelativecumulate 01418.8077131.649140,11118.807 152937.53722825.814140,22156.344 304436.748371.359.676140,21693.092 455935.070521.823.640140,206128.162 607429.382671.968.594140,173157.544 758911.98182982.442140,070169.525 901046359761.595140,004170.160 7.153.410 1,00 Limite inferiore della classe modale Freq classe modale MENO freq. classe premodale Freq. classe modale MENO freq. classe postmodale

11 0-1415-2930-4445-5960-7475-8990-104 18807 37537 36748 35070 29382 11981 635 Frequenze Classe modale Classe mediana Classe 1 quartile Classe 3 quartile Istogramma Classi

12 spesafreq.v.c.vc*freqampd.f.freq. rel%freq. cum 123251,5487,513250,022,60325 26571422844142,750,044,57896 6101.9678157364491,750,1515,772.863 10156.866138582551.373,200,5555,069.729 15252.711205422010271,10,2121,7412.440 2530 28825560,000,2412.470 159377,5 1100 Mediana16,38 N/26235 Linf10 Σf cl_premediana 2.863 f cl_mediana 6.866 c13 Q1Q1 10,48 1/4N3117,5 Linf10 Σf cl_prequartilica 2.863 f cl_quartilica 6.866 c13 Q3Q3 22,29 3/4N9352,5 Linf10 Σf cl_prequartilica 2.863 f cl_quartilica 6.866 c13 Moda = 12,71 L1 10 |Δ1| 4899 |Δ2| 4155 |Δ1|+|Δ2 | 9054 d 5 L1 10 Limite inferiore della classe modale Freq classe modale MENO freq. classe premodale Freq. classe modale MENO freq. classe postmodale

13 Eventuali outliers Valore adiacente superiore Eventuali outliers Valore adiacente inferiore Q3 Terzo quartile Q1 Primo quartile Mediana scala di misurazione del carattere La costruzione di un boxplot consente di rappresentare visivamente alcune caratteristiche fondamentali di una distribuzione statistica: il grado di dispersione dei dati; la simmetria; la presenza di valori anomali. Il confronto tra boxplot riferiti a diverse condizioni (es. temporali o spaziali) consente inoltre di effettuare valutazioni ulteriori (es. dinamiche). Richiami teorici

14 Q3 – Q1 = r differenza interquartilica Si definisce: Valore adiacente superiore (VAS) il valore osservato più grande che sia inferiore o uguale a Q3 + 1.5r quindi VAS ≤ Q3 + 1.5r Valore adiacente inferiore (VAI) il valore osservato più piccolo che sia superiore o uguale a Q1 – 1.5r quindi VAI ≥ Q1 – 1.5r I valori esterni a questi limiti sono definiti valori anomali (outliers). Nella rappresentazione grafica del boxplot sono segnalati individualmente, poiché costituiscono una anomalia rispetto agli altri dati della distribuzione. I valori che si discostano dal quartile di riferimento tra 1,5 e 3 volte la distanza interquartilica possono essere considerati nella norma; quelli che si discostano oltre 3 volte meritano una verifica ulteriore, per escludere con sicurezza banali errori di misura o trascrizione.

15 Frequenze/ampiezze: densità Classi di modalità 0,50-2,00 2,00-6,00 6,00-10,00 10,00-15,00 15,00-25,00 25-30,00 Classe 1 quartile Classe mediana Classe 3 quartile Classe modale 30 2.711 6.866 1.967 571 325 VAIQ1-1,5*(Q3-Q1)3,38 VASQ3+1,5*(Q3-Q1)21,54 Q1Q1 Mediana Q3Q3 10,4816,3822,29 3,3821,54

16 La media armonica Data la seguente tabella si vuol sapere quanto tempo dura, mediamente, ogni quaderno. Durata quadernoAlunni ReciprociRec*ni 826 0,133,25 1035 0,103,50 1215 0,081,25 1517 0,071,13 1632 0,062,00 1823 0,061,28 Totale148 12,41 Ci consente di mediare i rapporti i cui termini hanno tendenze inversamente proporzionali all’interno di un fenomeno (in questo caso “uso/durata”). Xi nini 1/ x i

17 La variabilità Variabilità assolutaVariabilità relativa  campo di variazione;  campo di variazione medio;  differenza media.  coefficienti di variazione  rapporto tra indice di variabilità assoluta e la media  scostamento semplice medio;  varianza;  scostamento quadratico medio;  semidifferenza interquartile (equidistanza tra i quartili e la mediana).  rapporto di concentrazione

18 Variabilità assoluta: la varianza classi di etàpopolaz.v.c.vc*frvc^2fr*(vc^2) 01418.8077131.64949921.543 152937.53722825.81448418.167.908 304436.748371.359.6761.36950.308.012 455935.070521.823.6402.70494.829.280 607429.382671.968.5944.489131.895.798 758911.98182982.4426.72480.560.244 90104635976159594095974715 170.160 7.153.41025.228382.657.500

19 Alternativamente Somma dei quadrati degli scarti dalla media*frequenze Totale delle frequenze classi di etàpololazionev.c. Xi-M(Xi-M) 2 (Xi-M) 2 * ni 01418.8077 -35,041227,801623.091.264,69 152937.53722 -20,04401,601615.074.919,26 304436.74837 -5,0425,4016933.457,9968 455935.07052 9,9699,20163.479.000,112 607429.38267 24,96623,001618.305.033,01 758911.98182 39,961596,801619.131.279,97 9010463597 54,963020,60161.918.082,016 170.160 6994,411281.933.037,06 Scarti fra Xi e media Quadrati degli scarti Quad. degli scarti * freq.

20 Gli argomenti della prossima esercitazione Variabilità relativa  la CONCENTRAZIONE Metodo dei trapezi Metodo di Gini Rapporti statistici  Numeri indice Introduzione alla curva Normale N.B. Al fine di velocizzare le esercitazioni, le slide successive contengono i testi degli esercizi che verranno svolti durante la prossima esercitazione

21 Concentrazione – metodo dei trapezi classi di retibuzioneaziende 02000100 20004000135 4000800049 80001500054 150003000032 370

22 Concentrazione – metodo di Gini soggettiReddito (in migliaia di €) Enrica174 Fabio190 Giovanni198 Carlo203 Clelia238 Luca264 1267

23 Numeri indice anniprezzo lavatrici 1983402 1984422 1985475 1986475 1987487 1988491

24 Introduzione alla curva Normale Il tempo impiegato per la produzione di un certo componente si distribuisce secondo una Normale con media 45 minuti e S.Q.M. 9 minuti. Determinare, in una produzione di 1000 pezzi, il numero dei pezzi che hanno richiesto oltre un'ora di lavorazione (60 minuti).

25 Per la prossima volta Rifare gli esercizi visti oggi, calcolando per ciascuno di essi tutti gli indici proposti in questa esercitazione. Svolgere altre tracce (gli Excel contenuti nel CD- ROM vi guideranno passo per passo spiegandovi cosa fare e come commentare il risultato!!) Per qualsiasi problema, il prof. Perna ed io siamo in dipartimento negli orari pubblicati on line.


Scaricare ppt "STATISTICA ASSISTITA Esercitazione 25.10.2010 dott.ssa Clelia Cascella."

Presentazioni simili


Annunci Google