Matematica e statistica Versione didascalica: parte 8 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste

Slides:



Advertisements
Presentazioni simili
Misure ed Errori Prof Valerio CURCIO.
Advertisements

Matematica e statistica Versione didascalica: parte 3
8) GLI INTERVALLI DI CONFIDENZA
Corso di esperimentazione di fisica 1 Il metodo dei minimi quadrati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
La matematica e l’economia
2. Introduzione alla probabilità
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
Intervalli di confidenza

Variabili casuali a più dimensioni
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Lez. 3 - Gli Indici di VARIABILITA’
La regressione lineare trivariata
ANALISI DELLA COVARIANZA
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Valutazione delle Prestazioni di un Classificatore
COSA VUOL DIRE FARE STATISTICA
Matematica e statistica Versione didascalica: parte 1
Matematica e statistica Versione didascalica: parte 2 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di.
Matematica e statistica Versione didascalica: parte 4
Matematica e statistica Versione didascalica: parte 0
Matematica e statistica Versione didascalica: parte 7 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste.
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 6: la funzione c2
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
STATISTICA a.a LA STATISTICA INFERENZIALE
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Lezione 8 La valutazione dello scarto per “fuori tolleranza”
Verifica delle ipotesi su due campioni di osservazioni
Un buon latinista è anche un bravo matematico? I.S. Artemisia Gentileschi - NAPOLI Convegno finale Progetto Lauree Scientifiche – Matematica Università
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
I principali tipi di grafici
Le distribuzioni campionarie
Introduzione alla Regressione Lineare e alla Correlazione.
COVARIANZA e CORRELAZIONE.
Regressione e correlazione
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Corso di biomatematica lezione 7-3: Test di significatività
Lez. 3 - Gli Indici di VARIABILITA’
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Strumenti statistici in Excell
Il residuo nella predizione
La variabile casuale poissoniana nell'ambito degli arrivi dei raggi cosmici Obiettivo: verificare che gli arrivi dei raggi cosmici seguono una distribuzione.
Test basati su due campioni Test Chi - quadro
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Accenni di analisi monovariata e bivariata
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
DIPENDENZA STATISTICA TRA DUE CARATTERI Per una stessa collettività può essere interessante studiare più caratteri presenti contemporaneamente in ogni.
1 VARIABILI CASUALI. 2 definizione Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico). Esempi l’esito.
Analisi delle osservazioni
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
Transcript della presentazione:

Matematica e statistica Versione didascalica: parte 8 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste

Test 2 di indipendenza Esperimento E : si misura una variabile doppia o bivariata (X, Y) con valore osservato: un punto (x, y) Si effettuano N = 200 prove Si riportano i valori osservati come punti del piano

Test 2 (continua) Suddivido la X in r = 5 classi con cutoff = {50, 60, 70, 80} Suddivido la Y in s = 3 classi con cutoff = {40, 60} Ottengo r s classi 2D dette celle Calcolo le frequenze assolute delle celle, assieme alle distribuzioni marginali della X e della Y.

Test 2 (continua) Calcolo le frequenze attese in caso di indipendenza, che hanno le medesime distribuzioni marginali della X e della Y.

Test 2 (continua) Calcolo le differenze cella per cella Calcolo le differenze al quadrato cella per cella

Test 2 (continua) Calcolo le differenze al quadrato normalizzate cella per cella Sommo tutto e trovo il valore 2 osservato

Test 2 (continua) Calcolo i gradi di libertà df = (r – 1)(s – 1) = 4 x 2 = 8 Cerco nella tabella del chi-quadro alla riga df = 8 dove si colloca il valore 2 osservato Uso della tabella: Per ogni valore di df = 1,2,…, i matematici hanno calcolato per ogni u > 0 la probabilità p(u) che due variabili indipendenti producano un valore del 2 osservato > u, e la hanno chiamata. Ad es. se df = 8, u = 15.51, si ha = p(u) = 0.05 = 5% Per u = 21.95, si ha = p(u) = = 0.5% df

Test 2 (continua) Quindi se X,Y fossero indipendenti, un 2 più grande di u = potrebbe essere osservato solo raramente, nel 0.5% dei casi. Avendo osservato 2 = > u, diremo allora che con limite di fiducia 1 = 99.5% le variabili sono dipendenti. La probabilità che tale giudizio sia errato è = 0.5%. Esempio: si tratta di stabilire se un primate (nascosto in una stanza) è un uomo. Come test di umanità si usa il peso. Viene osservato un peso = 140 kg. Nelluomo un peso maggiore di 130 kg viene osservato raramente, solo nel 0.5% dei casi. Diremo allora che con limite di fiducia del 99.5% il primate nascosto non è un uomo. La probabilità che tale giudizio sia errato è = 0.5% (potrebbe essere infatti un uomo molto molto pesante). E un uomo = X,Y indipendenti Peso = 2 Non è un uomo = X,Y dipendenti

Test 2 (continua) Vogliamo ora diminuire a = 0.1% la probabilità di dare un giudizio errato. Gli zoologi hanno calcolato che = 0.1% è la probabilità di osservare un uomo più pesante di 150 kg. Essendo il peso osservato = 140 kg, con limite di fiducia del 99.9% (ossia accettando una probabilità di dare un giudizio errato di = 0.1% ) non possiamo affermare come prima che il primate nascosto non è un uomo. Infatti potrebbe anche esserlo, visto che il 99.9% degli umani pesa fino a 150 kg. Dobbiamo dire che, con limite di fiducia del 99.9%, il peso osservato è compatibile con la ipotesi che si tratti di un umano. Ma attenzione! Sarebbe sbagliato dire è un uomo, potendosi evidentemente trattare di un orango o di un gorilla di 140 kg. E un uomo = X,Y indipendenti Peso = 2 Non è un uomo = X,Y dipendenti

Test 2 (continua) Calcolo i gradi di libertà df = (r – 1)(s – 1) = 4 x 2 = 8 Cerco nella tabella del chi-quadro dove si colloca il valore 2 osservato Con limite di fiducia del 1 – = 99.5% possiamo dire che le variabili sono dipendenti Ad un limite di fiducia maggiore, del 1 – = 99.9% si può dire solo che i dati sono compatibili con lipotesi di indipendenza

Test 2 (continua) Con questo campione:

Test 2 (fine)... si ha un 2 osservato di , che con df = 8 corrisponde nelle tavole (vedi CD) ad un limite di fiducia del 37.5% circa. Un valore molto basso. Alcuni grafici della funzione densità di probabilità del 2 : df = 6 df = 8 (si noti dove stanno i valori e ) df = 18

LinReg ax+b Riprendiamo il campione di n = 200 dati di una variabile bivariata (X,Y) per la quale cè un test 2 positivo di dipendenza.

LinReg ax+b (continua) Supponiamo un dipendenza lineare Y = aX + b. Supponiamo che i valori osservati x k siano esatti (regressione su X) Supponiamo che osservati y k siano affetti da errori di misura k Per cui y k = (a x k + b) + k Se non vi sono errori sistematici: La retta di regressione su X passa per il punto medio della nube di punti

LinReg ax+b (continua) La retta migliore è quella con gli errori meno dispersi (il più possibile concentrati vicino alla loro media 0), per cui usiamo la varianza del campione:

= minimo se a = ascissa vertice della parabola a = –B/2A

LinReg ax+b (continua) La retta di regressione su X (su Y)

LinReg ax+b (continua) La retta di regressione su Y

LinReg ax+b (continua)

LinReg ax+b (fine)