ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
Come organizzare i dati per un'analisi statistica al computer?
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
Passo 1: trasformare tutte le percentuali in frequenze (senza sapere la numerosità sulla quale sono state calcolate, non si può fare il confronto tra %)
Il chi quadro indica la misura in cui le
Analisi dei dati per i disegni ad un fattore
Progetto Pilota 2 Lettura e interpretazione dei risultati
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Test Statistici Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
Corso di Calcolo delle Probabilità e Statistica II Parte – STATISTICA
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
Le analisi per singolo item
L’analisi Bivariata Studia la relazione fra coppie di variabili.
Matematica e statistica Versione didascalica: parte 8 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste
Appunti di inferenza per farmacisti
STATISTICA a.a LA STATISTICA INFERENZIALE
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Verifica delle ipotesi su due campioni di osservazioni
Un buon latinista è anche un bravo matematico? I.S. Artemisia Gentileschi - NAPOLI Convegno finale Progetto Lauree Scientifiche – Matematica Università
Il piano fattoriale a due fattori
Le distribuzioni campionarie
Teorie e Tecniche di Psicometria
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Il test del Chi-quadrato
Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. SIGNIFICATIVITÀ.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Accenni di analisi monovariata e bivariata
Strumenti statistici in Excell
Come analizzare una tabella di contingenza quando il valore del chi quadrato è significativo Analisi dei residui con un esempio reale: Studenti universitari.
La statistica F Permette di confrontare due varianze, per stabilire se sono o no uguali. Simile al valore t di Student o al chi quadrato, l’F di Fisher.
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
“Teoria e metodi della ricerca sociale e organizzativa”
Intervalli di confidenza
UNIVERSITA’ DEGLI STUDI DI PERUGIA
L’analisi bivariata L’analisi bivariata serve a studiare la relazione fra coppie di variabili. Le sue funzioni sono: Stabilire se date due variabili (x.
Accenni di analisi monovariata e bivariata
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
ANALISI E INTERPRETAZIONE DATI
Correlazione e regressione lineare
TEST STATISTICI PER SCALE NOMINALI, TASSI E PROPORZIONI Non sempre la variabile aleatoria (risultato sperimentale) è un numero ma è spesso un esito dicotomico.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
DIPENDENZA STATISTICA TRA DUE CARATTERI Per una stessa collettività può essere interessante studiare più caratteri presenti contemporaneamente in ogni.
Accenni di analisi monovariata e bivariata. ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle.
1111 Università di Napoli Federico II, Dipartimento di Scienze Economiche e Statistiche S. BalbiI test non parametrici.
INTRODUZIONE ALL’ANALISI DELLA VARIANZA
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Statistica di Base per le Scienze Pediatriche luigi greco D.C.H, M.D., M.Sc.M.C.H., Ph.D. Dipartimento di Pediatria UniFEDERICOII.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica UNIVERSITÀ DEGLI STUDI DI NAPOLI Federico II CLASSI QUARTE Laboratorio di Statistica

Analisi delle relazioni tra variabili Indagine “Terra promessa” Analisi delle relazioni tra variabili

qualitativa Chi quadrato qualitativa

LA VERIFICA DELLE IPOTESI 1. formulazione delle ipotesi statistiche; 2. scelta delle regola di decisione adeguata; 3. confronto del valore campionario calcolato con la distribuzione campionaria sotto H0; 4. rifiuto dell’ipotesi sotto H0 in base al fatto che il valore campionario calcolato cada in una particolare regione di valori nella distribuzione campionaria specificata nell’ipotesi H0.

Verifica di ipotesi statistica Conclusioni L’ipotesi nulla è conservata (si è verificato un risultato probabile) 2. L’ipotesi nulla è respinta (si è verificato un risultato altamente improbabile)

Funzione test: chi-quadrato H0: I DUE CARATTERI SONO INDIPENDENTI H1: I DUE CARATTERI NON SONO INDIPENDENTI : errore di I tipo = 0,05 Funzione test: chi-quadrato Regola di decisione: 2 ≤ 2 accetto H0 2 > 2 rifiuto H0

NELLA POPOLAZIONE È VERA IN BASE AI DATI CAMPIONARI POSSIBILI DECISIONI NELLA VERIFICA D’IPOTESI NELLA POPOLAZIONE È VERA H0 H1 IN BASE AI DATI CAMPIONARI NON SI RESPINGE H0 DECISIONE CORRETTA (PROBABILITÀ 1- ) ERRORE 2° TIPO (PROBABILITÀ ) SI RESPINGE H0 ERRORE 1° TIPO (PROBABILITÀ ) (PROBABILITÀ 1- )

ESEMPIO: Verifica di indipendenza in tabelle 22 (tetracoriche) "We are the Champions"   SI NO totale 276 90 366 "Hai fiducia in te stesso?" 72 57 129 348 147 495 Esiste una relazione tra la variabile «Hai fiducia in te stesso?» e «We are the Champions»?

CALCOLO DELLE FREQUENZE TEORICHE o ATTESE "We are the Champions"   SI NO totale 257,3 (a) 108,7 (c) 366 "Hai fiducia in te stesso?" 90,7 (b) 38,3 (d) 129 348 147 495 a, b, c, d frequenze attese a=348 x 366 / 495 a = 257,3 b=348 x 129 / 495 b = 90,7 c=147 x 366 / 495 c = 108,7 d=147 x 129 / 495 d = 38,3

Hai fiducia in te stesso? FREQUENZE OSSERVATE E FREQUENZE ATTESE NELL’IPOTESI DI ASSENZA DI ASSOCIAZIONE We are the champions TOTALE Sì No Hai fiducia in te stesso? SI 276 O A 257,3 90 O A 108,7 366 NO 72 O A 90,7 57 O A 38,3 129 348 147 495 Per ciascuna cella si calcola la differenza tra la frequenza osservata e quella attesa (contingenza)

Il valore del chi-quadrato indica presenza o assenza di associazione? TEST 2 (CHI-QUADRATO) Il valore del chi-quadrato indica presenza o assenza di associazione?

GdL = (n° righe -1) x (n° colonne -1) Per interpretare il risultato ottenuto si deve confrontare il valore calcolato del chi-quadrato con il valore critico della distribuzione del chi-quadrato (essendo vera H0) che corrisponde ad una probabilità di errore pari a 0,05. Per trovare il valore critico del chi-quadrato bisogna consultare la tavola della distribuzione dei suoi valori. Il valore critico è individuato entrando attraverso la colonna corrispondente alla probabilità prescelta (0,05) e alla riga corrispondente ai gradi di libertà (GdL) della tabella, dove: GdL = (n° righe -1) x (n° colonne -1) Essendo questa tabella 2X2, GdL=1.

La distribuzione chi-quadrato per alcuni valori dei gradi di libertà (gl=1, 2, 3,…) Densità

Distribuzione CHI-QUADRATO X2 g.l. 1 3,8 Il chi-quadrato calcolato è maggiore del chi-quadrato critico quindi si rifiuta l’ipotesi di assenza di relazione. Chi-quadrato calcolato=17,6 Chi-quadrato critico =3,84

Esempio: Verifica di indipendenza fra le variabili «dove proseguirai gli studi» e «dove ti piacerebbe vivere» Campania Altra Regione Estero Totale Sto bene dove sto 49 16 4 69 Altro quartiere 21 6 27 Altra città 22 11 1 34 Altra regione 45 3 93 140 77 50 267 tot 277 155 58 490

Calcolo delle frequenze teoriche Campania Altra regione Estero Totale Sto bene dove sto 39 21,82 8,18 69 Altro quartiere 15,26 8,54 3,20 27 Altra città 19,22 10,75 4,02 34 52,62 29,44 11 93 150,9 84,45 31,60 267 277 155 58 490

2 > 2 quindi i due caratteri sono dipendenti TEST 2 (CHI-QUADRATO) 2 =42.36 g.d.l.=4x2=8 =0.05 2 = 15.50 2 > 2 quindi i due caratteri sono dipendenti

Indice di contingenza media quadratica del Pearson L’indice di contingenza quadratica media di Pearson è Φ2 = 2 /N; in caso di indipendenza assume il suo valore minimo che è zero; il valore massimo è pari a [(il più piccolo valore tra numero di righe e numero di colonne) -1]; per renderlo normalizzato tra 0 e 1 occorre dividere il valore dell'indice per il suo valore massimo.

Coefficiente di contingenza di Pearson Una misura di associazione basata sul chi-quadrato è: il coefficiente di contingenza di Pearson f2 = c2/N (5)

Indice di Yule Data una tabella tetracorica L’indice di Yule si calcola :

Q di Yule Q=+1 i casi sono concentrati sulla diagonale ad Q = - 1 i casi sono concentrati sulla diagonale bc Q=0 i casi sono equiripartiti Applicabile se le coppie di marginali sono entrambe equilibrate, oppure entrambe squilibrate e non vi sono una o tre celle semivuote, oppure entrambe squilibrate e una diagonale è semivuota.

ESEMPIO n °1: Calcolo degli indici in tabelle 22 (tetracoriche) "We are the Champions"   SI NO totale 276 90 366 "Hai fiducia in te stesso?" 72 57 129 348 147 495

ESEMPIO n °2: Calcolo degli indici in tabelle 53 Campania Altra Regione Estero Totale Sto bene dove sto 49 16 4 69 Altro quartiere 21 6 27 Altra città 22 11 1 34 Altra regione 45 3 93 140 77 50 267 tot 277 155 58 490

ESEMPIO n °2: Calcolo degli indici in tabelle 53

Conclusioni In entrambi i casi analizzati si è rifiutata l’ipotesi di assenza di relazione; Grazie agli indici si è potuto stimare il grado di associazione tra le variabili considerate

Grazie per l’attenzione Liceo Statale “Q. O. Flacco” Portici (Na)