Simulazione esame Analisi Multivariata dei Dati 14-12-2015 Giulio Costantini giulio.costantini@unimib.it
Istruzioni Avete 1h per completare la prova. Cercate il più possibile di risolvere da soli i problemi che incontrate. Evitate di parlare tra voi. Se avete bisogno di una mano o siete bloccati, chiedete pure a me. Alla fine dell’ora faremo gli esercizi insieme.
Interpretazione del testo (1) «Ogni soggetto svolge un solo compito, in una delle combinazioni di difficoltà e condizione.» Da questo capiamo che si tratta di un disegno between subjects. «Le variazioni sperimentali sono di due tipi: il compito può essere facile o difficile (fattore sperimentale difficoltà), e la condizione in cui viene svolto può essere individuale o in presenza di altre persone (fattore sperimentale condizione).» Da questo capiamo che si tratta di un disengno 2x2
Interpretazione del testo (2) «L'ipotesi del ricercatore è che i compiti facili siano facilitati dalla presenze di altre persone che osservano l'agente, mentre i compiti difficili siano penalizzati in termini di performance dalla presenza di altre persone.» Da questo capiamo che l’ipotesi del ricercatore è una interazione non ordinale. Il ricercatore si aspetta che il fattore condizione abbia un effetto opposto ai due livelli del fattore difficoltà.
Domanda 1 Determinare se l'ipotesi del ricercatore sia verificata dai dati, spiegando i dettagli dei risultati. Analizza > Modello lineare generalizzato > Univariata
Effetto principale di difficoltà, F(1, 56) = 107.5, p < .001, ηp2 = .658 Effetto di interazione condizione x difficoltà, F(1, 56) = 40.1, p < .001 , ηp2 = .417 Questo è l’effetto cruciale oggetto dell’ipotesi
Interpretare l’interazione L’interazione è esattamente quella ipotizzata dal ricercatore. In compiti facili la performance migliora in condizione sociale (vs. individuale), in compiti difficili, accade l’opposto.
Domanda 2 2) Condurre dei confronti post-hoc per i 4 gruppi definiti dalla combinazione di condizione e difficoltà, al fine di confrontare le medie di performance per i gruppi a due a due. Come NON andava fatto: Chiedendo i post-hoc per difficoltà e per condizione nella finestra post-hoc. A chi ha fatto così, SPSS ha restituito questo output. Perché?
Perché è sbagliato? Cosa vogliamo fare? Confrontare le medie di 4 gruppi: Difficoltà = facile & Condizione = individuale Difficoltà = facile & Condizione = sociale Difficoltà = difficile & Condizione = individuale Difficoltà = difficile & Condizione = sociale Cosa fa il metodo sbagliato illustrato prima? Cerca di confrontare i gruppi Difficoltà facile vs. difficile (al netto di condizione) e Condizione sociale vs. individuale (al netto di difficoltà). Ovviamente i post-hoc su variabili con due livelli non hanno senso, quindi SPSS vi restituisce quel messaggio.
Come andava fatto? Ci serve una variabile con 4 livelli, uno per ciascun gruppo definito dai 4 fattori. Ce la creiamo usando il menu Trasforma > Calcola Variabile Io l’ho chiamata «GruppiPostHoc»
Attribuiamo a ciascun gruppo un valore che lo identifichi univocamente usando la funzione «Se». Nel caso mostrato qui, Se difficoltà = 0 e condizione = 1, la variabile GruppoPostHoc assume valore 1.
Se difficoltà = 0 e condizione = 2, la variabile GruppoPostHoc assume valore 2.
Se difficoltà = 1 e condizione = 1, la variabile GruppoPostHoc assume valore 3.
Se difficoltà = 1 e condizione = 2, la variabile GruppoPostHoc assume valore 4.
Domanda 2 Adesso possiamo fare un’anova univariata, usando la nuova variabile GruppiPostHoc come indipendente e performance come dipendente. Chiedendo i post-hoc avremo la risposta alla domanda 2
Il test HSD di Tukey indica che tutti i gruppi sono significativamente differenti tra loro (tutti i p < .038)
Domanda 3 3) Determinare gli effetti di condizione e difficoltà al netto dell'autostima, evidenziando se e come l'autostima cambia gli effetti di condizione e difficoltà. Dobbiamo inserire autostima come covariata ed esaminare gli effetti dei due fattori.
L’autostima ha un effetto significativo sulla performance F(1, 55) = 23.52, p < .001, ηp2 = .300 Controllando l’effetto di autostima, l’effetto di difficoltà su performance continua ad essere significativo F(1, 55) = 145.7, p < .001, ηp2 = .726 così come l’effetto di interazione tra difficoltà e condizione F(1, 55) = 70.9, p < .001, ηp2 = .563 L’effetto principale di condizione, una volta inserita autostima come covariata, diviene significativo, F(1, 55) = 12.3, p < .001, ηp2 = .182
Domanda 4 Ripetiamo l’analisi appena svolta, salvando i residui e i punteggi predetti
Normalità dei residui - grafico Analizza > Statitiche descrittive > Frequenze
Normalità dei residui Analizza > Test non parametrici > Finestre Legacy > K-S per un campione Il test di Kolmogorov – Smirnov non indica deviazioni significative dalla distribuzione normale: l’assunzione di normalità non è violata
Assunzioni 2/3: omoschedasticità e outlier Il grafico predetti-residui non evidenzia violazioni palesi dell’omoschedasticità. Il caso 59 si trova sostanzialmente al di fuori della «nuvola» dei dati e sembra quindi essere un outlier.
L’osservazione 59 è proprio un outlier per la variabile «residui»? Analizza > Statistiche descrittive > Esplora
Secondo il boxplot il caso 59 è un outlier