La covarianza.

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
8) GLI INTERVALLI DI CONFIDENZA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
LA VARIABILITA’ IV lezione di Statistica Medica.
Distribuzione Normale o Curva di Gauss
Intervalli di confidenza
LA DISTRIBUZIONE NORMALE
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Analisi dei dati per i disegni ad un fattore
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
DISTRIBUZIONE CAMPIONARIA CONGIUNTA DI DUE VARIABILI (1)
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Processi Aleatori : Introduzione – Parte I
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 6: la funzione c2
Corso di biomatematica lezione 7-2: Test di significatività
STATISTICA a.a PARAMETRO t DI STUDENT
Lezione 8 Numerosità del campione
Lezione 4 Probabilità.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Le distribuzioni campionarie
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
IL CAMPIONE.
Calcolo delle probabilità a cura di Maurizio Brizzi
“Teoria e metodi della ricerca sociale e organizzativa”
La statistica F Permette di confrontare due varianze, per stabilire se sono o no uguali. Simile al valore t di Student o al chi quadrato, l’F di Fisher.
Test basati su due campioni Test Chi - quadro
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
“Teoria e metodi della ricerca sociale e organizzativa”
Modelli di variabili casuali
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
La distribuzione campionaria della media
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Elaborazione statistica di dati
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
1 Statistica Scienza dell’incertezza PROBABILITÀ ALLA BASE DELL’INFERENZA Ipotesi VERA o FALSA? Campionamento Analisi statistica Scelta di una delle due.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
L’ecologia è oggi sempre più una disciplina che enfatizza lo studio olistico del sistema. Anche se il concetto che l’intero possa essere più della somma.
1 VARIABILI CASUALI. 2 definizione Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico). Esempi l’esito.
INTRODUZIONE ALL’ANALISI DELLA VARIANZA
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Introduzione all’inferenza
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
Gli Indici di VARIABILITA’
Teoria dei Sistemi di Trasporto Tematica 4: Elementi minimi di teoria della probabilità.
Transcript della presentazione:

La covarianza

Il coefficiente di correlazione lineare

Il coefficiente di correlazione lineare

Rappresentazione grafica della relazione tra due variabili numeriche

Variabili aleatorie variabile aleatoria Una variabile casuale o aleatoria è una variabile che può assumere determinati valori in corrispondenza al verificarsi di eventi aleatori variabile aleatoria normale, o “gaussiana” il suo grafico è a forma di campana, simmetrica rispetto al suo valore medio; la simmetria della distribuzione normale da vita ad un’importante proprietà che lega tra loro la probabilità degli eventi e la deviazione standard: l’area (la probabilità) compresa nell’intervallo [m - s ,m + s ] rappresenta il 68,3% della popolazione

Variabili aleatorie gaussiane

Variabili aleatorie i due punti di ascissa m - s e m + s individuano i cosiddetti punti di flesso della gaussiana, laddove essa muta il suo andamento convesso in concavo

La distribuzione gaussiana per calcolare le probabilità a partire da una media e una varianza in un campione

Variabili aleatorie Esistono anche altre importanti variabili aleatorie In effetti, una qualunque funzione matematica f( x) che sia non negativa e che permetta di individuare una regione di area uguale a uno si può considerare come la funzione di densità di una variabile aleatoria

variabile aleatoria t di Student il grafico della t di Student è dotato di naturale simmetria rispetto al valor medio zero, ed anche in esso la media, la mediana e la moda coincidono. Tuttavia sussiste una importante differenza con la gaussiana: il grafico della t di Student cambia di forma in relazione alla numerosità n degli esperimenti che si prendono in considerazione; esso però tende ad avvicinarsi alla distribuzione normale standard, di media zero e varianza uno, al crescere di n. Praticamente, per n maggiore di 30 (ma alcuni autori dicono 50, od anche più) le due variabili aleatorie più o meno si equivalgono. Comunemente gli statistici indicano tale parametro n con il nome di grado di libertà

variabile aleatoria t di Student n = 1 grado di liberta n = 5 gradi di liberta n = 25 gradi di liberta Verde: gaussiana Nera: t Student

variabile aleatoria c2 Un’altra variabile aleatoria molto importante e stata studiata dal letterato e matematico inglese Karl Pearson: si tratta della distribuzione c2 , del chi-quadro (si indica usando la lettera greca chi, c ) è legata alla distribuzione gaussiana in una maniera abbastanza esplicita: se infatti si parte dalla distribuzione normale e la si eleva al quadrato si ottiene la distribuzione del chi quadro ad un grado di liberta. Se invece si sommano due, tre, n distribuzioni normali elevate al quadrato, si ottengono le distribuzioni del chi-quadro a due, tre, n gradi di liberta. Queste, essendo delle quantità elevate al quadrato, devono giocoforza essere definite solo per valori positivi, diversamente da quanto accade per le distribuzioni normale e di Student.

variabile aleatoria c2

Distribuzioni teoriche discrete di probabilità

Distribuzioni teoriche discrete di probabilità

Distribuzioni teoriche discrete di probabilità

Ipotesi statistiche Un’ipotesi statistica è una congettura sul valore di un parametro (nella popolazione di interesse per una certa indagine). Per esempio è un’ipotesi statistica la congettura che l’altezza media degli italiani nati nel 1980 sia pari a 175 cm: m = 175 Un’ipotesi statistica è dunque individuata da un vincolo su un parametro: i valori che soddisfano il vincolo (qui uno solo) sono quelli per i quali la congettura è vera.

Ipotesi statistiche Per fare un altro esempio è un’ipotesi statistica l’affermazione di un’azienda produttrice di batterie per autovetture secondo la quale la durata media di un certo modello di batteria è almeno pari a 3400 ore: m ≥3400 Qui il vincolo è un vincolo di disuguaglianza (invece che di uguaglianza) soddisfatto dagli infiniti valori della durata media es. 3400, 3500, 4000, . . . per i quali l’affermazione dell’azienda produttrice è vera.

Ipotesi statistiche Un terzo esempio di ipotesi statistica è la congettura che la pressione sanguigna media dei soggetti che assumono un certo farmaco sia la stessa di quella dei soggetti che non lo assumono: mF = mN Qui il parametro è un vettore con due componenti: m = (mF , mN) L’ipotesi statistica è individuata, nel piano cartesiano, dalla bisettrice del primo e terzo quadrante. . .

Ipotesi statistiche l’ipotesi sottoposta a verifica si dice ipotesi nulla H0

Ipotesi statistiche La verifica di un’ipotesi statistica consiste nello stabilire se un dato campione casuale (semplice) contiene “abbastanza” evidenza per rifiutare l’ipotesi in questione; per esempio - si prendono a caso 40 italiani nati nel 1980 e se ne misurano le altezze: la loro media è “molto” diversa da 175? - si prendono a caso 30 batterie e se ne osservano le durate: la loro media è “molto” minore di 3400? - si somministra a 20 soggetti, presi a caso, il farmaco e ad altri 20 soggetti, sempre presi a caso, un placebo: le pressioni medie nei due gruppi sono “molto” diverse? Se si, i dati forniscono una “chiara” indicazione contro l’ipotesi sottoposta a verifica e questa sarà rifiutata; altrimenti. . .

Ipotesi statistiche La negazione dell’ipotesi nulla si dice ipotesi alternativa: - nell’esempio dell’altezza degli italiani l’ipotesi alternativa è che la media dei nati nel 1980 sia diversa 175. . . m ≠ 175 - nell’esempio delle batterie l’ipotesi alternativa è che la durata media sia minore di 3400 ore. . . m < 3400 - nell’esempio della pressione sanguigna l’ipotesi alternativa è che la pressione media dei soggetti che assumono il farmaco sia diversa da quella dei soggetti che non lo assumono. . mF ≠ mN

Ipotesi statistiche

Ipotesi statistiche

Ipotesi statistiche

Ipotesi statistiche

Test statistici

Test statistici

Test statistici

Test statistici

Test statistici

Test statistici

Test statistici La distribuzione della media campionaria Ha minore ampiezza al crescere di n È centrata sulla media della variabile nella popolazione È normale anche se la variabile non ènormale, ma n è grande

Test statistici

Test statistici

Test statistici

Test statistici

Test statistici

Esempio

Test statistici

La distribuzione t-Student

La distribuzione t-Student

I gradi di libertà

Test t di Student

Formalizzazione del test di ipotesi: Esempio

L’approccio del p-value nella verifica dell’ipotesi

Il test del c2 test di verifica d'ipotesi che utilizza la distribuzione della variabile casuale c2 per decidere se rifiutare o non rifiutare l'ipotesi nulla:

Il test del c2

Il test del c2

La distribuzione del c2

Estratto tabella del c2