Statistica Descrittiva Alcune precisazioni Come si calcola «a mano» la moda? si ordina il dataset in maniera crescente e si assegna a ciascun valore la sua posizione si conta il numero di valori che stanno in ciascuna posizione si determina la posizione «più affollata» il valore relativo a questa posizione è la moda N.B. Nel caso in cui si trovi più di un valore, si sceglie il più piccolo 15 5 7 16 12 3 8 3 5 7 8 12 15 16 1 2 4 6 Moda= 5
Mediana= (8+7)/2=7,5 Come si calcola «a mano» la mediana? si ordina il dataset in maniera crescente e si assegna a ciascun valore la sua posizione se il dataset è composto da un numero dispari di valori, la mediana è il valore che sta nella posizione (n+1)/2 se il dataset è composto da un numero pari di valori, la mediana è dato dalla media dei due valori che stanno nelle posizioni n/2 e (n/2)+1 15 5 7 16 12 3 8 3 5 7 8 12 15 16 1 2 4 6 9 10 Mediana= (8+7)/2=7,5
Come si calcola «a mano» il percentile di ordine m ? si ordina il dataset in maniera crescente e si assegna a ciascun valore la sua posizione si arrotonda il risultato della formula il risultato che si ottiene è la posizione nella serie ordinata del percentile desiderato N.B. Questo è solo uno dei tanti modi disponibili 15 5 7 16 12 3 8 3 5 7 8 12 15 16 1 2 4 6 9 10 63-esimo percentile = 12
Analisi della varianza La situazione in teoria Campione di n*m elementi: n: numero di repliche m: numero di trattamenti
Le formule Media del trattamento: Media totale: Devianza dovuta ai trattamenti (TRA): Devianza totale: Devianza interna ai trattamenti (IN):
In generale In particolare Ipotesi Nulla: Statistica del test: L’analisi della varianza è una metodologia per verificare se due o più popolazioni sono caratterizzate dalla stessa media (o più medie sono estratte dalla stessa popolazione) In particolare Nell’analisi della varianza a una via si considera una sola causa di variazione (detta Fattore, Trattamento, Livello, etc…) nell’esito di ciascun esperimento Ipotesi Nulla: Le popolazioni da cui sono stati estratti i campioni hanno tutte la stessa media μ1= μ2 = … = μm Statistica del test: Se i campioni possono venir considerati estratti dalla stessa popolazione (o da popolazioni con media uguale, il Rapporto F dev’essere circa uguale a 1 e si comporta come una distribuzione di Fisher con m-1 e n-m gdl
Osservazioni indipendenti Distribuzione Normale della popolazione Se il valore calcolato Rapporto F è più grande del valore tabulato Fα(m-1, m-k), allora si può rifiutare l’ipotesi nulla all’ α % di significatività N.B. Quando questo si verifica, significa soltanto che almeno uno dei campioni si comporta in maniera diversa dagli altri. L’analisi della varianza si può usare quanto sono soddisfatte le seguenti 3 condizioni: Osservazioni indipendenti Distribuzione Normale della popolazione Varianza omogenea per ciascuno dei campioni