Corso di biomatematica lezione 6: la funzione c2

Slides:



Advertisements
Presentazioni simili
Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Advertisements

Le distribuzioni di probabilità continue
2. Introduzione alla probabilità
Come organizzare i dati per un'analisi statistica al computer?
LA VARIABILITA’ IV lezione di Statistica Medica.
Intervalli di confidenza
Fondamenti della Misurazione
Analisi dei dati per i disegni ad un fattore
ANALISI DELLA COVARIANZA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
LA PROPAGAZIONE DEGLI ERRORI:
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 5: propagazione degli errori
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 4: La funzione di Gauss
Corso di biomatematica Lezione 2: Probabilità e distribuzioni di probabilità Davide Grandi.
Corso di biomatematica lezione 7-2: Test di significatività
Corso di biomatematica Lezione 3: Distribuzioni di probabilità continue Davide Grandi.
Corso di biomatematica lezione 7: Test di significatività
STATISTICA a.a PARAMETRO t DI STUDENT
ISTOGRAMMI E DISTRIBUZIONI : i xixi
Valutazione della stima: gli intervalli di confidenza
Lezione 4 Probabilità.
Linee guida per la Chimica Analitica Statistica chemiometrica
Propagazione degli errori
Corso di biomatematica lezione 3b: applicazioni di probabilità Davide Grandi.
Corso di biomatematica lezione 8: Massima verosimiglianza Davide Grandi.
Verifica delle ipotesi su due campioni di osservazioni
Unità 7 Test parametrici ☐ Test t di Student ☐ Analisi della varianza ad una via ☐ Confronti multipli.
Introduzione alla Regressione Lineare e alla Correlazione.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Corso di biomatematica lezione 7-3: Test di significatività
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
PROPAGAZIONE DEGLI ERRORI:
Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. SIGNIFICATIVITÀ.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Lezione B.10 Regressione e inferenza: il modello lineare
Strumenti statistici in Excell
Il residuo nella predizione
IL CAMPIONE.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Elementi di statistica Le cifre significative
Intervalli di confidenza
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
Elaborazione statistica di dati
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
ANALISI E INTERPRETAZIONE DATI
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Transcript della presentazione:

Corso di biomatematica lezione 6: la funzione c2 Davide Grandi

Sommario Covarianza e correlazione Distribuzione del c2: Definizione Gradi di libertà e c2ridotto Tabelle Distribuzione t di student Distribuzione F di Fisher

Covarianza e correlazione Propagazione degli errori Richiamiamo la formula generale della propagazione degli errori: E ricordiamo che per un insieme di N misure la deviazione standard sarà (con N grande) Davide Grandi - Dottorato in Biologia

Covarianza e correlazione Propagazione degli errori Sia ora q=q(x,y) e supponiamo che tutti gli (x1,y1), (x2,y2), ……. (xN,yN), siano noti con sufficiente accuratezza, per cui potremo scrivere: Da cui ovvero Davide Grandi - Dottorato in Biologia

Covarianza e correlazione Propagazione degli errori Scrivendo la deviazione standard di q abbiamo: Dove abbiamo l’ultimo termine che è: E vale dunque Davide Grandi - Dottorato in Biologia

Covarianza e correlazione Propagazione degli errori Se dunque le misure di x e y sono assolutamente indipendenti, l’equazione della deviazione standard diventa: Per cui è nullo il termine Detto covarianza che misura la correlazione tra le misure di x e y supposte in partenza indipendenti Davide Grandi - Dottorato in Biologia

Covarianza e correlazione Correlazione lineare Data una distribuzione di misure (x1,y1), (x2,y2), ……. (xN,yN), è possibile stabilire se tra le variabili sussiste una relazione del tipo y=a+bx tramite il coefficiente di correlazione lineare dato da: Ovvero Che nel caso di dipendenza lineare vale 1 Davide Grandi - Dottorato in Biologia

La distribuzione del c2 La funzione del c2 Data una distribuzione normale standardizzata, una volta noti m e s ovvero la relazione Z=(x – m)/s, ci permette di stabilire la probabilità di trovare valori esterni o interni ad un determinato intervallo (vedi esempio pesci) . Da questo legame con distribuzione di probabilità normale o gaussiana e distribuzioni di dati posso ricavare altre distribuzioni campionare utili per l’inferenza statistica Davide Grandi - Dottorato in Biologia

La distribuzione del c2 La funzione del c2 Date n variabili casuali indipendenti normalmente distribuite, con media m=0 e s =1 Il c2 è dato dalla somma dei loro quadrati. Si può rappresentare mediante la formula: Dove n sono le osservazioni indipendenti effettuate (il c2 gode della proprietà additiva..) Davide Grandi - Dottorato in Biologia

La distribuzione del c2 La funzione del c2 Il c2 si può anche rappresentare mediante la formula: Dove gli Ok sono i valori osservati di una determinata misura e gli Ek sono i rispettivi valori attesi (supponendo che le misure vadano a distribuirsi secondo una gaussiana…) Davide Grandi - Dottorato in Biologia

La distribuzione del c2 La funzione del c2 Il c2 infine per una distribuzione continua sarà: Davide Grandi - Dottorato in Biologia

La distribuzione del c2 Il c2 ed i gradi di libertà Il c2 in realtà dipenderà dai gradi di libertà (o numero di osservazioni indipendenti) che sto effettuando. Questo c2 chiamato c2 ridotto e che indichiamo con c2 è legato al c2 con un solo grado di libertà secondo la formula c2 =c2/d con d numero di gradi di libertà. Ad esempio avremo dunque Davide Grandi - Dottorato in Biologia

La distribuzione del c2 Il c2 ed la probabilità Assumendo che le mie misure siano governate dalla distribuzione di probabilità attesa, posso utilizzare il il c2 infine per determinare se il risultato atteso è o meno probabile (e il livello di probabilità). Infatti (vedi figura) ad ogni valore di c2 (ad esempio c2 =k) corrisponde una probabilità di ottenere valori di c2 maggiori, se questo è un numero grande (starò quindi in una regione in cui ho molta probabilità che il c2 calcolato vada a finire), la nostra distribuzione segue quella attesa, altrimenti se è molto piccolo è probabile che debba rigettare la distribuzione attesa. Davide Grandi - Dottorato in Biologia

La distribuzione del c2 Il c2 ed i gradi di libertà Davide Grandi - Dottorato in Biologia

La distribuzione del c2 Il c2 ed i gradi di libertà Spieghiamoci meglio: data c2 =k e P (c2 >k) = n% Se ad esempio ho ottenuto con 1 grado di libertà c2 =1.80 e P (c2 >1.80) = 18% Non posso rigettare la distribuzione attesa, mentre se ho c2 =6 e P (c2 >6) = 1% Con l’1% di errore rigetto la mia distribuzione attesa Davide Grandi - Dottorato in Biologia

La distribuzione del c2 Il c2 ed i la significatività statistica Resta da stabilire il livello di significatività in corrispondenza ad esempio di un determinato valore di c2 (test statistici). Si è stabilito per convenzione internazionale che un livello di soglia delle probabilità pari a P<0.05 (5%) è statisticamente significativo P<0.01 (1%) è molto significativo P<0.001 (0.1%) è altamente significativo Davide Grandi - Dottorato in Biologia

La distribuzione del c2 Davide Grandi - Dottorato in Biologia

Altre distribuzioni t di Student Altra distribuzione campionaria utile per l’inferenza statistica, viene applicata a campioni di piccole dimensioni. Se una distribuzione segue la legge normale standardizzata è possibile ricavarne la varianza campionaria t di Student: dato Z=(x – m)/s e c2 inoltre n è il numero di gradi di libertà corrispondente a N–1 (N numero di misure) Davide Grandi - Dottorato in Biologia

Altre distribuzioni F di Fisher Questa distribuzione campionaria corrisponde al rapporto di due variabili casuali c2 –indipendenti (A e B) divise per i rispettivi gradi di libertà (m ed n): È una generalizzazione della t di Student e vale: Ovvero il quadrato della t è una F con gradi di libertà 1 e n Davide Grandi - Dottorato in Biologia