La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Laboratorio di Statistica ATTIVITÀ PIANO LAUREE SCIENTIFICHE UNIVERSITÀ DEGLI STUDI DI NAPOLI Federico II CLASSI QUARTE.

Presentazioni simili


Presentazione sul tema: "Laboratorio di Statistica ATTIVITÀ PIANO LAUREE SCIENTIFICHE UNIVERSITÀ DEGLI STUDI DI NAPOLI Federico II CLASSI QUARTE."— Transcript della presentazione:

1 Laboratorio di Statistica ATTIVITÀ PIANO LAUREE SCIENTIFICHE UNIVERSITÀ DEGLI STUDI DI NAPOLI Federico II CLASSI QUARTE

2 Indagine “Terra promessa” Analisi delle relazioni tra variabili

3 qualitativa Chi quadrato

4 LA VERIFICA DELLE IPOTESI 1.formulazione delle ipotesi statistiche; 2.scelta delle regola di decisione adeguata; 3.confronto del valore campionario calcolato con la distribuzione campionaria sotto H 0 ; 4.rifiuto dell’ipotesi sotto H 0 in base al fatto che il valore campionario calcolato cada in una particolare regione di valori nella distribuzione campionaria specificata nell’ipotesi H 0.

5 Verifica di ipotesi statistica Conclusioni 1.L’ipotesi nulla è conservata (si è verificato un risultato probabile) 2. L’ipotesi nulla è respinta (si è verificato un risultato altamente improbabile)

6 H 0 : I DUE CARATTERI SONO INDIPENDENTI H 1 : I DUE CARATTERI NON SONO INDIPENDENTI  : errore di I tipo = 0,05 Funzione test: chi-quadrato Regola di decisione:  2 ≤  2 accetto H 0  2 >  2 rifiuto H 0

7 POSSIBILI DECISIONI NELLA VERIFICA D’IPOTESI NELLA POPOLAZIONE È VERA H0H0 H1H1 IN BASE AI DATI CAMPIONARI NON SI RESPINGE H 0 DECISIONE CORRETTA (PROBABILITÀ 1-  ) ERRORE 2° TIPO (PROBABILITÀ  ) SI RESPINGE H 0 ERRORE 1° TIPO (PROBABILITÀ  ) DECISIONE CORRETTA (PROBABILITÀ 1-  )

8 Esiste una relazione tra la variabile «Hai fiducia in te stesso?» e «We are the Champions»? "We are the Champions" SINOtotale SI "Hai fiducia in te stesso?"NO totale ESEMPIO: Verifica di indipendenza in tabelle 2  2 (tetracoriche)

9 CALCOLO DELLE FREQUENZE TEORICHE o ATTESE a, b, c, d frequenze attese a=348 x 366 / 495a = 257,3 b=348 x 129 / 495 b = 90,7 c=147 x 366 / 495 c = 108,7 d=147 x 129 / 495 d = 38,3 "We are the Champions" SINOtotale SI257,3 (a)108,7 (c)366 "Hai fiducia in te stesso?"NO90,7 (b)38,3 (d)129 totale

10 FREQUENZE OSSERVATE E FREQUENZE ATTESE NELL’IPOTESI DI ASSENZA DI ASSOCIAZIONE We are the champions TOTALE SìNo Hai fiducia in te stesso? SI 276 O A 257,3 90 O A 108,7 366 NO 72 O A 90,7 57 O A 38,3 129 TOTALE Per ciascuna cella si calcola la differenza tra la frequenza osservata e quella attesa (contingenza)

11 TEST  2 (CHI-QUADRATO) Il valore del chi-quadrato indica presenza o assenza di associazione?

12 Per interpretare il risultato ottenuto si deve confrontare il valore calcolato del chi-quadrato con il valore critico della distribuzione del chi-quadrato (essendo vera H 0 ) che corrisponde ad una probabilità di errore pari a 0,05. Per trovare il valore critico del chi-quadrato bisogna consultare la tavola della distribuzione dei suoi valori. Il valore critico è individuato entrando attraverso la colonna corrispondente alla probabilità prescelta (0,05) e alla riga corrispondente ai gradi di libertà (GdL) della tabella, dove: GdL = (n° righe -1) x (n° colonne -1) Essendo questa tabella 2X2, GdL=1.

13 La distribuzione chi-quadrato per alcuni valori dei gradi di libertà (gl=1, 2, 3,…) Densità

14

15 Distribuzione CHI-QUADRATO Chi-quadrato calcolato=17,6 Chi-quadrato critico =3,84 X2X2 g.l. 1 3,8 Il chi-quadrato calcolato è maggiore del chi-quadrato critico quindi si rifiuta l’ipotesi di assenza di relazione.

16 Esempio: Verifica di indipendenza fra le variabili «dove proseguirai gli studi» e «dove ti piacerebbe vivere» CampaniaAltra Regione EsteroTotale Sto bene dove sto Altro quartiere Altra città Altra regione Estero tot

17 Calcolo delle frequenze teoriche CampaniaAltra regione EsteroTotale Sto bene dove sto 3921,828,1869 Altro quartiere 15,268,543,2027 Altra città19,2210,754,0234 Altra regione52,6229, Estero150,984,4531,60267 Totale

18 TEST  2 (CHI-QUADRATO)  2 =42.36 g.d.l.=4x2=8  =0.05  2 =  2 >  2 quindi i due caratteri sono dipendenti

19 Indice di contingenza media quadratica del Pearson L’indice di contingenza quadratica media di Pearson è Φ 2 =  2 /N; in caso di indipendenza assume il suo valore minimo che è zero; il valore massimo è pari a [(il più piccolo valore tra numero di righe e numero di colonne) -1]; per renderlo normalizzato tra 0 e 1 occorre dividere il valore dell'indice per il suo valore massimo.

20 Coefficiente di contingenza di Pearson   =  2 /N (5) Una misura di associazione basata sul chi-quadrato è: il coefficiente di contingenza di Pearson

21 Indice di Yule Data una tabella tetracorica L’indice di Yule si calcola :

22 Q di Yule Q=+1 i casi sono concentrati sulla diagonale ad Q = - 1 i casi sono concentrati sulla diagonale bc Q=0 i casi sono equiripartiti Applicabile se le coppie di marginali sono entrambe equilibrate, oppure entrambe squilibrate e non vi sono una o tre celle semivuote, oppure entrambe squilibrate e una diagonale è semivuota.

23 "We are the Champions" SINOtotale SI "Hai fiducia in te stesso?"NO totale ESEMPIO n °1: Calcolo degli indici in tabelle 2  2 (tetracoriche)

24 ESEMPIO n °2: Calcolo degli indici in tabelle 5  3 CampaniaAltra Regione EsteroTotale Sto bene dove sto Altro quartiere Altra città Altra regione Estero tot

25 ESEMPIO n °2: Calcolo degli indici in tabelle 5  3

26 Conclusioni In entrambi i casi analizzati si è rifiutata l’ipotesi di assenza di relazione; Grazie agli indici si è potuto stimare il grado di associazione tra le variabili considerate

27 Grazie per l’attenzione Liceo Statale “Q. O. Flacco” Portici (Na)


Scaricare ppt "Laboratorio di Statistica ATTIVITÀ PIANO LAUREE SCIENTIFICHE UNIVERSITÀ DEGLI STUDI DI NAPOLI Federico II CLASSI QUARTE."

Presentazioni simili


Annunci Google