Analisi della varianza

Slides:



Advertisements
Presentazioni simili
Analisi della varianza (a una via)
Advertisements

Test della differenza tra le medie di due popolazioni
Analisi della varianza
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
1 Principali analisi statistiche 1. Confronto fra medie (2 o piú campioni) 2. Correlazione e regressione 3. Analisi di tabelle di contigenza Variabile.
2a + 10b abx2 3a + 1 y 2 a + 1 x + 2y a − Espressioni algebriche
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
Disequazioni in una variabile. LaRegola dei segni La disequazione A(x) · B(x) > 0 è soddisfatta dai valori di per i quali i due fattori A(x) e B(x) hanno.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Consentono di descrivere la variabilità all’interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche.
Corso di Analisi Statistica per le imprese
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Precorso di Statistica per le Lauree Magistrali
Precorso di Statistica
Introduzione a Statistica e Probabilità
Precorso di Statistica per le Lauree Magistrali
Le operazioni con le frazioni
Qualità dei dati Fabio Murena.
RICHIAMI DI INFERENZA:
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
L’analisi monovariata
Misure Meccaniche e Termiche - Università di Cassino
Confronto fra 2 popolazioni
L’analisi della varianza:
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Quantitative Market Research Set-up Protocol
PIANIFICAZIONE DEI TRASPORTI Regressione lineare
Indici di variabilità Gli indici di variabilità misurano
Precorso di Statistica per le Lauree Magistrali
APPUNTI DI STATISTICA INFERENZIALE
Intervalli di Fiducia Introduzione Intervalli di fiducia per la media – Caso varianza nota Intervalli di fiducia per la media – Caso varianza non nota.
Precorso di Statistica
Introduzione a Statistica e Probabilità
Precorso di Statistica per le Lauree Magistrali
La Statistica Istituto Comprensivo “ M. G. Cutuli”
I MONOMI.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
L’analisi monovariata
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Elaborazione statistica di dati
Un esempio Una casa farmaceutica dichiara che un nuovo antidolorifico che sta per immettere sul mercato fa effetto mediamente in un tempo pari a 12,75.
I numeri relativi DEFINIZIONE. Si dicono numeri relativi tutti i numeri interi, razionali e irrazionali dotati di segno (positivo o negativo). ESEMPI Numeri.
VARIABILITA’ GENETICA
Quantitative Market Research Set-up Protocol
La distribuzione campionaria: principi generali
Intervalli di confidenza
“Una delle più grandi scoperte che un uomo può fare, una delle sue più grandi sorprese, è scoprire che può fare ciò che aveva paura di non poter fare”.
Le operazioni con le frazioni
Statistica inferenziale
Test per campioni appaiati
Esercizio La popolazione di adulti presenta una media di ansia pari a 4. Ad un campione di 35 soggetti con disturbo ossessivo compulsivo è stato somministrato.
Confronto tra medie di due popolazioni
Esercizio 2 Un gruppo di persone con DCA ha partecipato per tre mesi ad una psicoterapia di gruppo per aumentare la propria autostima. Verificare che la.
Precorso di Statistica per le Lauree Magistrali
Corso di Analisi Statistica per le imprese
Precorso di Statistica
RICHIAMI DI INFERENZA:
Esercizio 1 Il voto medio della popolazione degli studenti della Lumsa al primo esonero di psicometria è pari a 26 (σ=3). Gli studenti hanno sempre svolto.
RICHIAMI DI INFERENZA:
Associazione tra due variabili
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Corso di Analisi Statistica per le Imprese
Precorso di Statistica per le Lauree Magistrali
Test per campioni indipendenti
Associazione tra variabili qualitative
Corso di Analisi Statistica per le Imprese
Statistica e probabilità Università degli Studi di Sassari Facoltà di Medicina veterinaria Corso di Laurea in Medicina veterinaria Anno Accademico 2017/2018.
Esempio: somma se , allora [ per n addendi ] se ( se ) se ( se )
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
Transcript della presentazione:

Analisi della varianza ANOVA Analisi della varianza

ANOVA ad una via Analisi della varianza testa differenze fra le medie di due o più gruppi H0: le medie sono uguali Ha: almeno due medie sono diverse Assunzioni: 1. Indipendenza dei casi 2. Normalità dei dati all’interno di ogni gruppo 3. Omogeneità della varianza

1. Indipendenza Le singole osservazioni nei gruppi DEVONO essere delle vere repliche Non deve esserci dipendenza: 1. Spaziale 2. Temporale 3. Biologica Il campionamento può essere sbilanciato

2-3. Normalità e variabilità delle popolazioni a confronto I campioni devono provenire da popolazioni normali! Con varianza simile!

I passi da seguire STOP STOP (1. Verificare le assunzioni) 2. Eseguire l’ANOVA 3. Ottenere una probabilità per decidere se rifiutare o accettare H0 4a. Rifiuto H0 4b. Accetto H0 Almeno una media è diversa Le medie sono uguali STOP 5. Testo le differenze fra le singole coppie di medie (post-hoc test) A ≠ B? B ≠ C? C ≠ A?… STOP

ANOVA a una via y yi = a + bx2 + cx3 + dx4 Modello ANOVA Varietà A Varietà B Varietà C Varietà D Risposta: Produttività Fattore: Varietà (4 livelli: A, B, C, D) C H0: µ1= µ2= µ3= µ4 Ha: almeno due sono diverse y D B Modello ANOVA A yi = a + bx2 + cx3 + dx4

ANOVA a una via Ha senso testare le assunzioni? Media generale= 7.80 Var A Var B Var C Var D 6.0 6.9 10.3 8.8 5.7 6.8 10.2 8.4 6.5 7.4 10.0 8.3 5.9 6.6 9.6 8.6 6.2 7.0 9.0 ni 5 4 µi 6.06 6.93 10.03 8.62 Ha senso testare le assunzioni? X Media generale= 7.80 Numero di repliche (n)= 19 Numero di livelli (k)= 4

ANOVA a una via Somma dei quadrati (SS)-Devianza SS TOTALE SS ENTRO Media generale SS FRA C Somma dei quadrati (SS)-Devianza SSTOT= Σ(yi – media generale)2 SSFRA= Σnj(media gruppoi – media generale)2 SSENTRO= Σ(yi – media gruppoi)2 D B A

ANOVA: devianza (somma dei quadrati) Somma dei quadrati (SS)-Devianza SSTOTALE= Σ(yi – media generale)2 SSFRA= Σnj(media gruppoi – media generale)2 SSENTRO= Σ(yi – media gruppoi)2 La SS dipende dal numero di osservazioni nei gruppi Gradi di libertà (g.d.l.) SSTOTALE: n – 1 SSFRA: k – 1 SSENTRO: n – k

ANOVA: dalla devianza alla varianza Devianza (SS) deve essere STANDARDIZZATA Devianza (SS) Varianza = Gradi di libertà SSFRA SSENTRO VarianzaFRA = VarianzaENTRO = k-1 n-k SSFRA C SSENTRO D B A

ANOVA: dalla devianza alla varianza SS deve essere STANDARDIZZATA Devianza (SS) Varianza = Gradi di libertà SSFRA SSENTRO VarianzaFRA = VarianzaENTRO = k-1 n-k Mi serve un test per vedere se la varianza fra gruppi è maggiore della varianza entro in gruppi VARIANZA TOTALE FRA ENTRO

ANOVA: il test F VarianzaFRA Varianza FRA sempre al numeratore FCALCOLATO= VarianzaENTRO FCRITICO si distribuisce secondo i seguenti gradi di libertà: Numeratore: k-1 Denominatore: n-k Il test F dell’ANOVA è a una coda: VarianzaFRA >VarianzaENTRO

ANOVA: il test F Tabella ANOVA Fonte variabilità SS df Varianza F FRA ENTRO TOTALE

ANOVA: il test F VarianzaFRA FCALCOLATO= VarianzaENTRO VarianzaFRA>VarianzaENTRO VarianzaFRA<VarianzaENTRO Confronto con FCRITICO (alpha, k-1, n-k) STOP: Accetto H0 SE FCALCOLATO< FCRITICO SE FCALCOLATO > FCRITICO STOP: Accetto H0 Rifiuto H0! Almeno due medie sono diverse: quali?

ANOVA: post-hoc test Mi permettono di dire quali medie sono diverse dopo aver rifutato H0 In tali test, detti test post-hoc, per ogni coppia di medie l’ipotesi nulla è che la differenza tra queste sia pari a zero, mentre l’alternativa è che le due medie differiscano significativamente tra loro Correggono per il numero di test: devo modificare alpha! Esistono test più o meno conservativi Esistono molti tipi di test

ANOVA: Tukey (test ad intervallo fisso) Mi permette di dire quali medie sono diverse dopo aver rifutato H0 TABELLA DELLE DIFFERENZE Varietà A Varietà B Varietà C Varietà D Varietà A - A-B A-C B-C A-D B-D C-D Varietà B Varietà C Varietà D A-B: differenza fra la media della varietà A e B A-C: differenza fra la media della varietà A e C …

g.d.l. VarianzaENTRO (n-k) ANOVA: Tukey (test ad intervallo fisso) n1 e n2 numerosità gruppo 1 e 2 “Q” deriva dalla tabella di Tukey (alpha, g.d.l.=n-k) Numero di livelli (k) g.d.l. VarianzaENTRO (n-k)

ANOVA: Tukey (test ad intervallo fisso) Q aumenta se riduciamo alpha Q aumenta all’aumentare del numero di livelli Q diminuisce all’aumentare del numero di repliche Se il campionamento è bilanciato il range critico è unico per tutte le coppie! Se il campionamento è sbilanciato devo calcolare diversi range

ANOVA: Tukey (test ad intervallo fisso) Per ogni coppia (alpha): Se |media1-media2|> range critico H0: media1=media2 Ha: media1≠media2 Se |media1-media2|< range critico Medie diverse! Medie uguali!

Rappresentazione grafica dei risultati Istogramma delle medie con errore standard Boxplot con media Risposta media Risposta media A B C D A B C D Varietà Varietà

Rappresentazione grafica dei risultati b ab a a A volte dopo un post-hoc test si aggiungono delle lettere per dire quali medie sono differenti Risposta media A B C D Varietà

Analisi dei residui: Assunzioni I residui devono avere la stessa variabilità A B C D

Analisi dei residui: Assunzioni Q-Q plot Come costruirlo?

Analisi dei residui: Assunzioni P cumulata=1/(n+1) Posizione P Quantili teorici Residui ordinati 1 0.1 -1.28 Più piccolo 2 0.2 -0.84 ... 3 0.3 -0.52 4 0.4 -0.25 5 0.5 0 6 0.6 0.25 7 0.7 0.52 8 0.8 0.84 ... 9 0.9 1.28 Più grande Tabella Z

Analisi dei residui: Assunzioni