EPG di Metodologia della ricerca e Tecniche Multivariate dei dati

Slides:



Advertisements
Presentazioni simili
Analisi dati con Excel Parte I.
Advertisements

MICROSOFT EXCEL 97.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
Modulo 4 – Seconda Parte Foglio Elettronico
MODULO 3 – ELABORAZIONE TESTI
Distribuzione Normale o Curva di Gauss
Lez. 3 - Gli Indici di VARIABILITA’
Analisi preliminari dei dati
Descrizione dei dati Metodi di descrizione dei dati
Gli errori nell’analisi statistica
C – Indici di Asimmetria e Curtosi
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Operazioni elementari
La matrice dei dati E’ possibile organizzare i dati in forma di matrice se: l’unità di analisi è unica (ad esempio non si possono includere individui e.
Metodi di ricerca in Psicologia
Metodi della ricerca in Psicologia
Access: Query semplici
Microsoft Excel Nozioni avanzate
I fogli elettronici Microsoft Excel. I Fogli Elettronici Sono strumenti per organizzare gestire, analizzare e presentare insiemi di dati. Le funzionalità
Analisi delle corrispondenze
Corso di Laurea in Ingegneria per lAmbiente e il Territorio Informatica per lAmbiente e il Territorio Docente: Giandomenico Spezzano Tutor: Alfredo Cuzzocrea.
Misurazione Le osservazioni si esprimono in forma di misurazioni
DBMS ( Database Management System)
Lezione 12 Riccardo Sama' Copyright Riccardo Sama' Excel.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Le distribuzioni campionarie
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
Excel Il software Excel è un programma applicativo che consente di creare tabelle, gestire dati, elaborarli e rappresentarli sotto forma di grafici. Il.
Elenchi in Excel E’ possibile inserire le voci del nuovo elenco oppure
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
13 Excel prima lezione.
Excel prima lezione.
Costruire una tabella pivot che riepiloghi il totale del fatturato di ogni agente per categorie di vendita, mese per mese. Per inserire una tabella pivot.
Microsoft Access (parte 5) Introduzione alle basi di dati Scienze e tecniche psicologiche dello sviluppo e dell'educazione, laurea magistrale Anno accademico:
Statistica La statistica è
Microsoft Word Interfaccia grafica
Esame di Analisi Multivariata dei Dati
La statistica.
Prof. Giuseppe Boncoddo
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Lezione 11 Riccardo Sama' Copyright  Riccardo Sama' Excel.
ATTIVITA’ FISICA, SALUTE E ANZIANI Paola Ciddio CeBiSM Centro Interuniversitario di Bioingegneria e Scienze Motorie Psicologia del Lavoro e delle Organizzazioni.
Lezione 19 Riccardo Sama' Copyright  Riccardo Sama' Access.
L’analisi del contenuto Doppia funzione dell’analisi del contenuto: -Può essere un tipo di ricerca specifico -Può essere una tecnica di ricerca Come TECNICA.
Accenni di analisi monovariata e bivariata
Microsoft Access Chiavi, struttura delle tabelle.
Data Base ACCESS EM 09.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Excel.
Corso integrato di Matematica, Informatica e Statistica Informatica di base Linea 1 Daniela Besozzi Dipartimento di Informatica e Comunicazione Università.
Microsoft Access (parte 3) Introduzione alle basi di dati Scienze e tecniche psicologiche dello sviluppo e dell'educazione, laurea magistrale Anno accademico:
Corso di Laurea in Scienze e tecniche psicologiche
Accenni di analisi monovariata e bivariata
Manuale Utente – i-Sisen Questionario dei Consumi
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
EPG di Metodologia della ricerca e Tecniche Multivariate dei dati A.A
Università degli Studi di Bari - Dipartimento di Psicologia - INTRODUZIONE ALLA METODOLOGIA PER RICERCA IN PSICOLOGIA DEL TURISMO A cura della Dott.ssa.
Access Breve introduzione. Componenti E’ possibile utilizzare Access per gestire tutte le informazioni in un unico file. In un file di database di Access.
Accenni di analisi monovariata e bivariata. ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle.
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
03/06/20161 SPSS Statistics Statistical Package for Social Science.
Introduzione all’uso di SPSS
L’analisidei dati L’analisi dei dati Analisi mutlidimensionali: Analisi delle corrispondenze multiple Cluster Analysis.
Gli Indici di VARIABILITA’
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

EPG di Metodologia della ricerca e Tecniche Multivariate dei dati Dott.ssa Paola Grassi E-mail: p.grassi@unich.it

LED edizioni universitarie 2006 Programma del corso Introduzione al software SPSS Trattamento preliminare dei dati La regressione lineare L’analisi fattoriale L’analisi della varianza. Testo consigliato Barbaranelli C., “Analisi dei dati con SPSS II. Le analisi multivariate.” LED edizioni universitarie 2006

Date lezioni Aula informatica Sabato 21 gennaio ore 9,00 – 13,00 Venerdì 27 gennaio ore 15,00 – 19,00 Sabato 28 gennaio ore 9,00 – 13,00 Sabato 04 febbraio ore 9,00 – 13,00 Aula informatica

SPSS è un software statistico che permette di: Cosa è SPSS (Statistical Package for Social Science) SPSS è un software statistico che permette di: Inserire ed importare i dati; Di eseguire analisi statistiche, di illustrare i risultati anche tramite rappresentazione grafica. SPSS è composto da finestre, aventi ciascuna differenti funzioni: Editor dei Dati; Output – Viewer; Syntax.

SPSS è un programma statistico studiato per soddisfare le esigenze di elaborazione dati nei seguenti settori applicativi: Psicologia Sociologia e scienza politica Medicina/biologia Analisi/ricerche di mercato Può eseguire le elaborazioni dati riguardanti le seguenti tecniche di analisi: analisi monovariata analisi bivariata analisi multivariata test statistici parametrici e non parametrici analisi di serie temporali funzioni di sopravvivenza modelli lineari

Per inserire i dati si deve avviare la schermata iniziale e selezionare dal menù la voce “inserimento dati”.

Per passare dalla modalità visualizzazione dati a quella di visualizzazione delle variabili oppure passare alla barra di stato o degli strumento o modificare il carattere Per aprire, salvare, stampare e chiudere il file. Contiene tutti i comandi per definire le variabili, per selezionare e richiamare i dati o le variabili in esame, per ordinare le variabili in senso crescente o decrescente, ecc. Per selezionare, copiare e tagliare parte dei dati

Per di creare nuove variabili, effettuare una serie di calcoli sulle variabili o di modificare le variabili (come nel caso del trattamento dei dati mancanti). per eseguire una serie di analisi dei dati. Permette di definire alcune funzioni per l’esecuzione di alcune procedure statistiche. Per scegliere e costruire i grafici.

Barra degli strumenti Barra dei menù Barra di stato Spostarsi sul post-it “visualizzazione variabili” per la generazione delle stesse imputando, in sequenza, il nome assegnato e modificando, eventualmente, le caratteristiche impostate automaticamente. Permette di visualizzare i dati già imputati relativi ad una variabile.

La schermata ottenuta con “visualizzazione variabili” permette di inserire: Nome della variabile composto da max 8 caratteri. Numero di caratteri usati per visualizzare la variabile Per descrivere meglio le categorie numeriche di variabili che invece non sono numeriche

La schermata ottenuta con “visualizzazione variabili” permette di inserire: Per specificare meglio il significato della variabile (max 256 caratteri) Indica quante cifre decimali sono visualizzate Per specificare i valori delle variabili che sono considerati indicatori di “valori mancanti” Si possono utilizzare: la stessa grandezza dei valori validi della variabile (media) oppure numeri fuori dalla scala della variabile (si usa preferibilmente il numero 9 0 il 99 o 999)

Creazione delle variabili relative al questionario

È possibile attribuire ai valori stringa o numerici delle variabili delle etichette, per esteso, che compariranno nell’output anziché i valori assegnati. Ad esempio maschio anziché M

La struttura dati è pronta per l’inserimento manuale

Spostarsi, quindi sul post-it “visualizzazione dati” per inserire i valori di ciascuna variabile e per visualizzarli.

Cosa si può fare con SPSS E’ NECESSARIO: Specificare il modello teorico alla base della ricerca, lo strumento usato e le scale di misura; Corretta codifica dei dati Scelta del programma per l’inserimento dati (SPSS, Excel,…) INSERIMENTO DEI DATI E CREAZIONE DI FILE DATI. Permette di controllare errori di inserimento dei dati, la presenza di dati mancanti, di outlier mediante l’analisi delle frequenze. PULIZIA DEI DATI:

TRASFORMAZIONE DEI DATI: CALCOLO DELLE STATISTICHE DESCRITTIVE: Permette di ottenere delle nuove variabili effettuando delle operazioni o trasformazioni sulle variabili pre-esistenti. TRASFORMAZIONE DEI DATI: Per ciascuna variabile si possono calcolare le statistiche descrittive quali: media, varianza, deviazione standard. Permette di verificare se i dati si distribuiscono normalmente CALCOLO DELLE STATISTICHE DESCRITTIVE:

ANALISI STATISTICHE: CORRELAZIONE; ATTENDIBILITA’; DESCRITTIVE; ANALISI DELLA VARIANZA; ANALISI FATTORIALE; REGRESSIONE ANALISI STATISTICHE:

Inserimento dati e creazioni di un file con SPSS Di norma in un file di dati vengono inseriti i valori relativi alle codifiche socio-anagrafiche dei partecipanti alla ricerca. Ad esempio: genere, età, provenienza, stato civile, livello socio-economico, n° figli a carico etc. Questo genere di variabili permettono, in genere, di rilevare differenze o uguaglianze sulle variabili metriche in dipendenza dell’appartenenza a gruppi differenti determinati a priori. Tali variabili necessitano di una codifica preliminare di tipo stringa o numerica definita dallo sperimentatore. Si tenga presente che alcune procedure di analisi ammettono soltanto codifiche numeriche e non di tipo stringa (ad esempio l’analisi di varianza).

Le Scala di misura possono essere: Successivamente vanno generate le variabili numeriche, o scale, relative allo strumento impiegato. Le Scala di misura possono essere: Nominale: i valori rappresentano categorie senza alcun ordine intrinseco (Sesso, Professione,….); Ordinale i valori rappresentano categorie con qualche ordine intrinseco (basso/medio/alto); Ad Intervalli i valori permettono di stabilire una relazione di distanza tra più oggetti misurati, a partire da uno 0 arbitrario e stabilendo un’unità di misura costante; A Rapporti i valori permettono di effettuare operazioni aritmetiche, avendo come origine uno 0 assoluto;

Tali scale vanno codificate esclusivamente con valori numerici e possono essere: binarie (vero/falso, accordo/disaccordo, scale di Rasch) che è corretto trattare come ordinali (con valori diversi dalla coppia da 0-1 la quale, invece, possiede caratteristiche metriche delle scale ad intervallo); politomiche (scale di Gutmann, Likert) che vengono codificate da SPSS come scale di tipo ordinale; continue (che ammettono valori decimali quali altezza, peso, indice di massa corporea).

Organizzazione generale del file-dati: Righe: ciascuna riga del file di dati raccoglie le informazioni inerenti ogni singolo soggetto lungo l’intera collezione di variabili indagate che assume il nome di “data record”. Il numero di campi interni al record deve corrispondere al numero di variabili imputabili. I dati mancanti possono essere codificati a scelta dello sperimentatore, tra queste codifiche sono comuni le assegnazioni di valori “fuori scala” ne sono esempi codifiche del tipo 999. In caso di scale definite solo positivamente, si può utilizzare per la codifica del dato mancante il primo valore utile ( in questo caso -1). In SPSS la codifica del dato mancante è stabilita automaticamente dal sistema assumendo come valore il carattere “.” in corrispondenza di una cella di imputazione lasciata vuota dall’operatore.

Colonne: contengono tutte le rilevazione, trasversalmente raccolte su tutti i soggetti relativamente ad una data variabile o unità d’informazione. Si utilizzano le colonne anche qualora il disegno della ricerca dovesse contenere informazioni replicate di uno stesso soggetto, in condizioni sperimentali diversificate (Test re-test o multilivello). In generale non esiste un’unica formulazione per definire la nomenclatura del file di dati, ma questa dipende dallo specifico modello di analisi da impiegare o dalle peculiarità strutturali del disegno sperimentale impiegato.

Per la codifica è necessario che: Le variabili siano in formato numerico I casi (soggetti) devono avere un numero identificativo progressivo codici devono essere mutualmente escludentesi (ogni risposta cade solo e soltanto in una categoria)

La descrizione e lo screening dei dati sono delle fasi DESCRIZIONE DEI DATI La descrizione e lo screening dei dati sono delle fasi molto importanti in quanto permettono di: Individuare i valori mancanti; Individuare variabili che assumono valori fuori scala; Verificare se la distribuzione è normale Individuare gli outlier

Simmetrica rispetto alla media Presenta due punti di flesso x = μ – σ La normalità della distribuzione è fondamento di molte analisi. La distribuzione normale univariata assume la classica forma a campana: CARATTERISTICHE Unimodale Simmetrica rispetto alla media Presenta due punti di flesso x = μ – σ x = μ + σ

Creazione completa delle variabili

Struttura dei dati dopo l’inserimento delle variabili

A seconda dello strumento utilizzato, come in questo caso, le variabili necessitano di essere ri-codificate per ancorare tutti i valori numerici con la stessa valenza semantica: tutte in positivo o in negativo. Per fare questo è necessario verificare prima quali variabili siano da invertire ed eseguire l’operazione attraverso il menù trasforma (ri-codifica nelle stesse variabili).

Avendo individuato le variabili che necessitano di trasformazione, man mano si selezionano e tramite la freccia si posizionano nel campo variabili

Per completare la trasformazione è necessario sostituire ai valori precedentemente assegnati, i nuovi digitando sul pulsante “valori vecchi e nuovi”.

Si invertono i valori di scala per l’intera gamma comune delle variabili lasciando invariato il dato mancante di sistema.

È sempre opportuno verificare che la procedura sia stata eseguita correttamente. La formula per verificare il risultato è la seguente: (Valore massimo – valore attuale) + valore minimo Es: (4-3)+0= 1

Adesso è possibile calcolare il punteggio totale del questionario ed il punteggio medio per ciascun soggetto impiegando il menù “trasforma” sotto la voce “calcola variabile. Per calcolare il punteggio totale al test, porre nel campo “variabile di destinazione” il nome da assegnare e operare la scelta della funzione “sum”.

I nomi delle variabili vengono riportate come argomenti della funzione multi-argomento che opera sulle variabili.

Nell’ultima colonna possiamo osservare la somma dei punteggi di ciascun soggetto attraverso le variabili prese in considerazione.

A questo punto, con lo stesso procedimento, possiamo calcolare la media

Il programma ha generato una nuova colonna nella quale viene espressa la media delle risposte fornite da ciascun soggetto.

Per calcolare i principali indici statistici campionari di ciascuna variabile, si opera attraverso il menù analizza tramite il comando “frequenze”.

Si selezionano le variabili per le quali interessa calcolare gli indici statistici principali congiuntamente alla distribuzione di frequenze.

Si marcano le statistiche desiderate

OUTPUT

OUTPUT Vengono riportate le statistiche per ciascun item

Distribuzione delle frequenze Si considerano solo i casi che non presentano valori mancanti Si considerano anche i casi che presentano valori mancanti Non essendoci valori mancanti, in questo caso, coincidono

Volendo effettuare la descrizione dei dati raccolti:

Ancora una volta, dopo aver selezionato le variabili oggetto d’indagine

Si selezionano le statistiche descrittive che interessano

Con valori degli indici di Asimmetria e Curtosi compresi tra -1 e 1 la distribuzione è normale

Valore di Curtosi negativo Valore di Curtosi positivo Curva Normale Valori compresi tra -1 e 1 Valore di Curtosi negativo La distribuzione è schiacciata verso il basso rispetto a quella normale. La distribuzione è detta PLATICURTICA. Valore di Curtosi positivo La distribuzione è più appuntita rispetto a quella normale. La distribuzione è detta LEPTOCURTICA.

Per una più accurata descrizione del campione si possono eseguire:

Ad esempio, si possono mettere in relazione variabili socio-demografiche quali genere ed età con le prime due domante al test.

Dopo aver selezionato le variabili che interessa mettere in relazione si clicca su “continua”

Dei ricercatori hanno ipotizzato vi sia relazione tra le abilità matematiche (X1), le abilità scientifiche (X2) e la percezione di autoefficacia (Y). Al fine di analizzare ciò, hanno somministrato 3 test ad un gruppo di 8 studenti. Verificare, per un livello di significatività pari ad α = 0,05, se l’ipotesi dei ricercatori è fondata. Nella tabella che segue sono espressi i punteggi ottenuti nei 3 test: Y X1 X2 4 5 3 2 6 8 7 9 10 12 11 13