La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Calcolo della Numerosità T-Test test sulla media di un gruppo 1. H0: = o ² nota viene utilizzata la distribuzione normale N( o, ²/n) ² ignota si utilizza.

Presentazioni simili


Presentazione sul tema: "Calcolo della Numerosità T-Test test sulla media di un gruppo 1. H0: = o ² nota viene utilizzata la distribuzione normale N( o, ²/n) ² ignota si utilizza."— Transcript della presentazione:

1

2 Calcolo della Numerosità

3

4 T-Test test sulla media di un gruppo 1. H0: = o ² nota viene utilizzata la distribuzione normale N( o, ²/n) ² ignota si utilizza

5

6 2. H0: 1 = 2 1 ² = 2 ² ignote si utilizza

7 3. H0: d = 0 Si calcolano per ogni soggetto le differenze d

8 Analisi della Varianza Quando i gruppi sono più di due non è più possibile applicare il t test per il confronto fra due medie Bisogna allora ricorrere all'analisi della varianza. Il suo presupposto fondamentale è che, se è vera l'ipotesi nulla che non vi sia differenza fra i gruppi, la variabilità all'interno dei gruppi è uguale alla variabilità fra i gruppi

9 Si tratta quindi di un confronto di varianze che può essere saggiato con la distribuzione F Per ciascun soggetto i del gruppo j lo scarto dalla media generale può essere scomposto in uno scarto dalla media di gruppo più uno scarto della media di gruppo dalla media generale

10 Vale cioè la relazione: x ij - x.. = (x ij - x. j ) + (x. j - x..) La stessa scomposizione può essere fatta anche sulle somme degli scarti al quadrato (SSQ) SSQ tot = SSQ intgr + SSQ tragr

11 La somma dei quadrati degli scarti totali è calcolata sui valori di tutti i soggetti del campione rispetto la media generale La somma dei quadrati degli scarti tra i gruppi si ottiene attribuendo a ciascun soggetto il valore medio del suo gruppo e calcolando gli scarti dei valori così modificati dalla media generale La somma dei quadrati degli scarti all'interno dei gruppi si ottiene per differenza

12 Le relative varianze si ottengono dividendo le somme dei quadrati degli scarti per i rispettivi gradi di libertà. La varianza all'interno dei gruppi è nota anche come varianza residua La variabile statistica su cui viene effettuato il test è data dal rapporto:

13 Gruppo 1Gruppo NMeanStd. Deviation Std. Error Mean Gruppo Gruppo

14 Punteggitdf Sig (2- tailed) Mean Difference 95% Confidence Interval of the Difference Equal variances assumed Equal variances not assumed t-test Sum of Squares df Mean Square FSig Beteewn Groups Within Groups ANOVA

15 L'interazione rappresenta l'effetto di particolari combinazioni degli effetti principali non imputabili semplicemente alla somma degli effetti componenti. Essa può anche essere vista come una mancanza di parallelismo tra un fattore e l 'altro.

16 EFFETTI PRINCIPALI E INTERAZIONE Trattati MControlli M Trattati FControlli F TrattatiControlli D ISEGNO S PERIMENTALE Definisce il modo di dividere in gruppi il campione sperimentale

17 C RITERI DI C LASSIFICAZIONE Definiscono i modi di raggruppamento e quindi gli effetti studiati TrattatiControlli M F

18 Parametri descrittivi Mean Std. deviation n Trattati M F Controlli M F Totale

19 SourceSSdfMSFSig constant trattamento sesso Tratt x Sesso Within factor Analisi della Varianza

20 Calcolo dellinterazione Valori Sperimentali trattaticontrollimedia Maschi Femmine media

21 Interazione

22 Analisi della Regressione Lineare Permette di analizzare la relazione fra due o più variabili quantitative gaussiane utilizzando un modello di riferimento costruito a partire dai dati sperimentali. Può essere Lineare semplice o Lineare Multipla

23 Nel caso in cui la variabile indipendente sia una sola il modello utilizzato è di tipo lineare semplice e lequazione che lo determina e lequazione della retta: y=a+bx La determinazione dei parametri a e b è fatta con il metodo dei minimi quadrati

24 Dove:

25

26 Coefficiente di Determinazione R 2 SSQ modello R 2 = SSQ totale Coefficiente di Correlazione Parametro F varianza modello F = varianza residua

27 SV SH DE

28 Modello Lineare Generale (GLM) dove y ijk rappresenta la variabile dipendente misurata e e e rappresentano i parametri relativi agli effetti e allinterazione che influenzano la variabile dipendente. Il coefficiente b rappresenta la relazione fra x e y. Il parametro e rappresenta il termine errore dovuto alla variazione casuale dei dati. y ijk = + i + j + ij + b·x + e ijk

29 Di ogni parametro viene data la significatività I parametri vengono calcolati eliminando gli effetti di tutti gli altri parametri Si possono calcolare contrasti multipli ortogonali

30 Permette: luso di fattori qualitativi e quantitativi il confronto fra prove ripetute, di dati correlati luso di più variabili dipendenti (analisi multivariata)

31 Modelli Non Parametrici Accuracy and certainty are competitors: The surer we want to be, the less we must demand. Basic Ideas of Scientific Sampling di Alan Stuart, Griffin, London, 1968

32 Una serie di dati -binomiale -chi quadrato -runs (numero di valori consecutivi superiori o inferiori a un valore soglia) Due serie di dati correlati -McNemar (proporzioni) -Sign (distribuzione dei valori) -Wilcoxon Più serie di dati correlati -Friedman Due serie di dati indipendenti -Mann-Whitney -Kolmogorov-Smirnov Più serie di dati indipendenti -Kruskall-Wallis

33 Misure di associazione Tavole di contingenza: associazione fra due variabili qualitative Modelli Log-Lineari: associazione fra più variabili qualitative Modelli Log-Lineari Gerarchici: associazione fra più variabili qualitative Modelli Regressivi Regressione Logistica: modello generale in cui è possibile esprimere una variabile qualitativa (dicotomica) come funzione di una o più variabili sia qualitative che quantitative.

34 Tavole di Contingenza Permettono di analizzare la relazione fra due variabili di tipo qualitativo. Lipotesi nulla (assenza di relazioni) corrisponderà alla proporzionalità fra le diverse condizioni delle variabili.

35 Un esempio…

36 Per confrontare le frequenze sperimentali con lipotesi nulla si crea una corrispondente tabella per lH 0 costituita dalle frequenze teoriche che rappresentano la condizione di proporzionalità. In formule…

37 Calcolo dei valori teorici T i nellipotesi di proporzionalità (Ho) Valutazione della differenza fra i valori teorici e i valori sperimentali applicando la formula del 2

38 Calcolo i valori teorici T nellipotesi di proporzionalità (Ho vera)

39 Valuto lentità della differenza fra i valori teorici e i valori sperimentali applicando la formula del 2. 2 = ( ) 2 / ( ) 2 / ( ) 2 / ( ) 2 /192.9 = 7.978

40 Valuto la significatività: se p<0.05 posso concludere che cè differenza nei due gruppi rispetto ai risultati positivi/negativi. Confronto il valore di 2 ottenuto con il limite di falsificazione per (r 1) (c 1) gradi di libertà che in questo caso corrisponde a 2.05,1 =3.84 < Posso Respingere H0

41 Test del Segno Utilizzato per confrontare due serie di dati correlati, ad esempio fra due prove misurate con punteggi che vanno da 1 a 10. Il confronto si effettua sulle differenze fra seconda e prima prova, applicando la Distribuzione Binomiale per valutare la diversità fra miglioramenti e peggioramenti.

42 Un esempio... Escludendo le situazioni di assenza di differenze, confronto i 7 miglioramenti sui 12 casi. Attraverso il Test del Segno la differenza non è significativa in quanto p=0.344.

43 Se avessimo applicato il t-test per prove ripetute... t= che, con 11 gradi di libertà, fornisce una significatività di Il valore del parametro t viene calcolato dalla media delle differenze e dalla loro deviazione standard.

44 Una soluzione alternativa: il Test dei Ranghi di Wilcoxon Si basa sulla classificazione dei soggetti in base alla differenza ottenuta nelle due prove e utilizza il numero dordine (rango) dei soggetti come nuova variabile da sottoporre a verifica statistica. Attraverso unopportuna elaborazione di tale variabile si ottiene un parametro con una distribuzione prossima ad una distribuzione normale standard che viene utilizzata per eseguire il test.

45 Test dei Ranghi di Wilcoxon Per effettuare il test si parte mettendo i dati sia del primo che del secondo gruppo in ordine crescente in un unico elenco. Si associa a ogni dato il suo numero d'ordine nella scala così ottenuta. L'ipotesi nulla, come al solito, è che non vi sia differenza fra i due gruppi. Se questo è verificato i dati del primo gruppo saranno dispersi in modo uniforme nella scala costruita. Se l'ipotesi nulla è falsa essi saranno concentrati nella parte alta o bassa della scala. Nel caso precedente p=0.039.

46 Test di McNemar Misura la concordanza fra due variabili.

47 Questo test considera solo le risposte discordanti dei due metodi e formula lipotesi nulla che non vi sia differenza fra i due metodi, nel senso che si possono avere indifferentemente soggetti classificati ottimisti dal primo metodo ma non dal secondo o lopposto di questo. Il test non considera cioè quanto i due metodi sono concordi ma solo se le discordanze hanno una direzione preferenziale.

48 Nellesempio in corso abbiamo 10 soggetti con risposta discorde. Lipotesi nulla è che di questi 5 siano ottimisti col primo metodo ma non con il secondo e che 5 siano nella situazione opposta. In realtà per questi due gruppi abbiamo ottenuto 8 e 2.

49 Utilizzando la distribuzione binomiale, valutiamo se i valori ottenuti sono significativamente diversi dai valori attesi. La distribuzione binomiale ci permette di ottenere un test esatto e, data la bassa numerosità del campione, rappresenta il metodo idoneo. Per numerosità maggiori viene spesso utilizzata la distribuzione 2 che, pur essendo un test approssimato, necessita di calcoli più semplici. La significatività che si ottiene da questi dati è di che non ci permette di falsificare lipotesi nulla e di sostenere una reale differenza fra i due metodi.

50 Regressione Logistica Trasforma la variabile qualitativa dicotomica (evento, non evento) in una variabile quantitativa utilizzando il parametro odds 1.Variabile0,1 2.Probabilità Odds 0

51 ODDS

52 Per poter utilizzare una equazione nel campo dei numeri reali si esegue una ulteriore trasformazione logarimica che prende il nome di logit Oddslogit (valore )

53 La variabile può essere vista come funzione dei fattori in un modello regressivo: logit (variabile)= b 0 + b 1 x 1 + b 2 x 2 + b 3 x 3 ….

54 Stima dei Parametri (b) viene fatta con metodo a successive approssimazioni. Il loro significato si può dedurre dallodds ratio:

55 Odds Ratio e Rischio relativo DiseaseNon Disease Exposed Non Exposed OR= a/b c/d RR= a/(a+b) c/(c+d)

56 La regressione logistica fornisce le significatività per: il modello globale i singoli parametri, togliendo gli effetti dei parametri già considerati

57 Analisi fattoriale ridurre il numero delle variabili in esame; trasformare le variabili in studio in variabili mutuamente indipendenti; individuare le fonti delle variabili sperimentali; assegnare ad esse un significato reale.

58 Analisi fattoriale Il punto di partenza dellanalisi fattoriale è la matrice di correlazione delle variabili esaminate, attraverso la quale vengono calcolate nuove variabili, dette fattori, fra loro indipendenti. Vi sono diversi metodi matematici per ottenere queste nuove variabili. Un metodo, noto come metodo delle componenti principali, si avvale del calcolo degli autovalori e autovettori della matrice di correlazione.

59 Analisi fattoriale capacità argomentativa desiderabilità sociale coinvolgimento emotivo ricerca della certezza atteggiamento di intransigenza

60 Analisi fattoriale

61 NDD D D TP/(TP+FN) TN/(TN+FP) TP/(TP+FP) TN/(TN+FN) (TN+TP)/ALL

62


Scaricare ppt "Calcolo della Numerosità T-Test test sulla media di un gruppo 1. H0: = o ² nota viene utilizzata la distribuzione normale N( o, ²/n) ² ignota si utilizza."

Presentazioni simili


Annunci Google