La matrice dei dati E’ possibile organizzare i dati in forma di matrice se: l’unità di analisi è unica (ad esempio non si possono includere individui e comuni nella stessa matrice) su tutti i casi sono state rilevate le stesse informazioni. La matrice dei dati relativi a N casi su cui sono state rilevate n informazioni (variabili) è l’intersezione di vettori paralleli: N vettori orizzontali (righe), quanti sono i casi n vettori verticali (colonne), quante sono le variabili In modo tale che il generico elemento Xab della matrice X sia tale da indicare lo stato del caso a sulla variabile b. Infatti perché una proprietà possa diventare una variabile deve: potere assumere (almeno) due stati diversi su (almeno) due casi diversi oltre che potere essere sottoposta ad una definizione operativa. Teoria e pratica della valutazione Laboratorio – Lezione II La matrice dei dati
X1 X2 X3 … Xn 1 X11 X12 X13 X1n 2 X21 X22 X23 X2n 3 X31 X32 X33 X3n N Teoria e pratica della valutazione Laboratorio – Lezione II La matrice dei dati
La matrice dei dati in Spss 1 Spss (Statistical Package for Social Science) è un software di elaborazione dati che lavora con tre tipi di files: Editor dei dati (.sav), che include due componenti: La visualizzazione dei dati, che permette di visualizzare la matrice dei dati vera e propria e l’inserimento dei dati (i dati possono essere anche importati direttamente da altri tipi di files, come ad esempio files excell o access); La visualizzazione delle variabili, che permette di creare, visualizzare e caratterizzare le variabili in matrice, etichettarle ed assegnare codici ed etichette alle singole modalità delle singole variabili; Viewer (.spo) che permette principalmente di visualizzare gli output delle analisi richieste ed esportarli in differenti formati; Editor della sintassi (.sps) che permette di salvare o direttamente assegnare comandi al programma in un linguaggio specifico, dunque di lasciare memoria delle operazioni effettuate ed automatizzare le procedure. Teoria e pratica della valutazione Laboratorio – Lezione II La matrice dei dati
La matrice dei dati in Spss 2 Prima di potere inserire le informazioni nel foglio di visualizzazione dati è necessario: stabilire la relazione tra le informazioni rilevate (nel nostro caso sul questionario) e le variabili: L’ordine delle variabili deve seguire l’ordine delle domande nel questionario Si deve tenere presente che alcune domande producono più di una variabile definire le variabili ed i loro attributi nel foglio di visualizzazione variabili: nominare le variabili (ed assegnargli una etichetta) determinare il tipo di codifica (numerica, alfanumerica, data) determinare la scala (nominale, ordinale, scala, dunque conteggi e cardinali) Impostare i valori di missing (dovuti e non dovuti) ed eventualmente assegnare dei codici alle modalità delle variabili assegnare delle etichette ai codici delle singole modalità. Teoria e pratica della valutazione Laboratorio – Lezione II La matrice dei dati
Inserimento dati Nell’inserire manualmente i dati in matrice bisogna porre attenzione a diverse questioni: le corrispondenze tra item e variabile e tra risposta e codice (ancor più nei casi in cui i codici non sono riportati sul questionario o gli items non sono numerati) l’eventuale presenza di variabili filtro il rispetto delle regole predefinite in riferimento ai valori mancanti (non dimenticare di inserire i codici, non fare confusione tra missing dovuti e non dovuti) l’eventuale presenza di variabili stringa, in particolare se poste tra due batterie di variabili con la stessa codifica (i classici “Altro, specificare”) Teoria e pratica della valutazione Laboratorio – Lezione II La matrice dei dati
Alcuni esempi particolari di passaggi dalla domanda sul questionario alle variabili nella matrice: Teoria e pratica della valutazione Laboratorio – Lezione II La matrice dei dati
Teoria e pratica della valutazione Laboratorio – Lezione II La matrice dei dati
I controlli interni alla matrice Controlli di plausibilità: mirati all’individuazione di codici selvaggi (wilde codes) effettuabili a seguito della produzione della distribuzione di frequenza delle variabili da controllare. Controlli di congruenza: mirati all’individuazione di informazioni non coerenti all’interno dei singoli records, ad esempio nel caso di filtri non rispettati o di incoerenze logico/semantiche (diplomati che fanno i medici). In caso di incoerenze è spesso opportuno tornare al questionario cartaceo e ricontrollare la correttezza dell’immissione dei dati prima di procedere ad una correzione . Nel caso l’incoerenza dovesse sussistere anche sul cartaceo il ricercatore deve risolverla scegliendo di tenere l’informazione che ritiene più importante o affidabile e mandando in missing l’altra. Controlli sui valori mancanti: mirati al controllo dei codici assegnati ai valori mancanti dovuti e non dovuti, ancora una volta questi controlli sono necessari in relazione a domande filtro. Teoria e pratica della valutazione Laboratorio – Lezione III Operazioni preliminari all’analisi dei dati
Procedure di accoppiamento dei questionari A - Accoppiamento per codici: nel caso in cui siano disponibili codici univocamente corrispondenti ai singoli soggetti i due questionari possono essere accoppiati semplicemente sulla base di questo codice. Assegnare codici ai soggetti non è semplice dal punto di vista pratico e rappresenta un rischio dal punto di vista metodologico dato che un soggetto consapevole di venire identificato (seppure in modo anonimo attraverso un codice numerico) potrebbe rifiutare la sua collaborazione o modificare consciamente o inconsciamente le proprie risposte. Nella ricerca-intervento sulle conoscenze giovanili sulle radiazioni ionizzanti era stato studiato un metodo di assegnazione codici che restava invisibile agli studenti ma che permetteva di accoppiare univocamente le osservazioni di pre e post test, più l’eventuale presenza all’intervento degli esperti, riferibili allo stesso soggetto. Teoria e pratica della valutazione Laboratorio – Lezione III Operazioni preliminari all’analisi dei dati
Procedure di accoppiamento dei questionari B - Accoppiamento per variabili: nel caso in cui non siano disponibili codici per i soggetti è possibile procedere accoppiando il questionario di pre-test e quello di post-test sulla base di una serie di variabili, dunque di caratteristiche del soggetto. Naturalmente a questo fine si utilizzano: variabili di contesto (ad esempio istituto e classe) rilevate dagli intervistatori variabili di base (sesso, data di nascita, titolo di studio e professione dei genitori, comune di residenza). Cioè variabili che: non variano tra un’osservazione e l’altra; su cui il soggetto ha una minore probabilità di fornire risposte differenti tra una rilevazione e l’altra (perché lo sforzo cognitivo richiesto dal fornire risposte differenti è più alto di quello richiesto dalle risposte sincere); su cui sussiste, o meglio dovrebbe sussistere, un minor rischio di missing value. Teoria e pratica della valutazione Laboratorio – Lezione III Operazioni preliminari all’analisi dei dati
Procedure di accoppiamento dei questionari Spss permette di unire diverse matrici attraverso due procedure: Aggiungi casi: in cui il programma aggiunge nuovi casi in una delle due matrici individuando la corrispondenza delle variabili in base ai nomi delle variabili e alle istruzioni del ricercatore; Aggiungi variabili: individuata la corrispondenza dei casi su una serie di variabili selezionate dal ricercatore e comuni a entrambe le matrici il programma aggiunge alla matrice X tutte le variabili della matrice Y che non sono ancora in comune oppure che sono state selezionate dal ricercatore. Teoria e pratica della valutazione Laboratorio – Lezione III Operazioni preliminari all’analisi dei dati