Analisi preliminari dei dati

Slides:



Advertisements
Presentazioni simili
LA VARIABILITA’ IV lezione di Statistica Medica.
Advertisements

QUANTILI.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Presupposti alla lezione
Scale di misura delle variabili
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Variabilità Variabilità: inevitabile fluttuazione dei fenomeni naturali, fisici, sociali ecc le indicazioni fornite dalle misure di tendenza centrale (media.
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
Lez. 3 - Gli Indici di VARIABILITA’
Analisi dei dati per i disegni ad un fattore
Descrizione dei dati Metodi di descrizione dei dati
C – Indici di Asimmetria e Curtosi
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.
Corso di Calcolo delle Probabilità e Statistica II Parte – STATISTICA
Statistica descrittiva
Distribuzione degli Errori di Misura
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
COSA VUOL DIRE FARE STATISTICA
Valutazione della stima: gli intervalli di confidenza
Misurazione Le osservazioni si esprimono in forma di misurazioni
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Pedagogia sperimentale
Analisi della varianza
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Fondamenti di informatica
Le distribuzioni campionarie
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Simone Mosca & Daniele Zucchini 4Bi.
Distribuzioni di frequenza
Completiamo i grafici Diagramma logaritmico: variante del diagramma cartesiano; si usa se ci sono valori delle y molto piccoli e molto grandi (nessuna.
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
La regressione II Cristina Zogmaister.
Statistica Descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
COSA VUOL DIRE FARE STATISTICA
La verifica d’ipotesi Docente Dott. Nappo Daniela
Accenni di analisi monovariata e bivariata
Strumenti statistici in Excell
Corso di Analisi Statistica per le Imprese Indici di variabilita’ ed eterogeneita’ Prof. L. Neri a.a
Martina Serafini Martina Prandi
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi Univariata.
Esercizio 1: 1) La seguente distribuzione riporta i punteggi di ansia misurata su studenti di psicometria:
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Intervalli di confidenza
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
La distribuzione campionaria della media
Accenni di analisi monovariata e bivariata
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
ANALISI E INTERPRETAZIONE DATI
Esercizio 1 La seguente distribuzione riporta i punteggi di ansia misurata prima dell’esame di psicometria: a) Costruire una tabella di frequenza, indicando:
TRATTAMENTO STATISTICO DEI DATI ANALITICI
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
1 Cosa vuol dire fare statistica ? La statistica è la scienza che ha come fine lo studio quantitativo e qualitativo di fenomeni collettivi. “il profitto.
Accenni di analisi monovariata e bivariata. ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle.
STATISTICA ASSISTITA Esercitazione dott.ssa Clelia Cascella.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Compito 1: 1)La seguente distribuzione riporta i punteggi di ansia su un campione non clinico: a)Costruire una tabella di frequenza, indicando: f, fc,
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.
Transcript della presentazione:

Analisi preliminari dei dati

1. Errori di immissione dei dati Gli errori di immissione pregiudicano irrimediabilmente i risultati delle ricerche e sono purtroppo molto frequenti. Verificare sempre che i dati siano stati correttamente immessi (Min.-Max, Range, Distribuzione di frequenza, Media e DS).

2. Dati mancanti I dati mancanti in genere non vanno eliminati dato che esistono semplici o sofisticate procedure di sostituzione

3. Outliers Gli outliers univariati (valori estremi presenti nella distribuzione) e multivariati (anomali combinazioni dei punteggi delle singole variabili) possono distorcere i risultati. Nel caso di outliers univariati è possibile ricorrere ad alcune statistiche più robuste di quelle utilizzate normalmente (ad esempio la più semplice è la media trimmed che si calcola eliminando il 5% dei casi dei casi più elevati e più bassi)

4. Livello di misura delle variabili Il livello di misura delle variabili deve essere almeno degli intervalli equivalenti e deve essere presente un numero appropriato di categorie ordinabili (ad es. Likert con 5 o più categorie).

5. Valutazione della normalità della distribuzione univariata e multivariata Quando si hanno dei dati a disposizione per prima cosa è opportuno verificare se la distribuzione è normale perché se non lo è si hanno delle distorsioni delle stime più o meno gravi a seconda del grado di non normalità. In modo elementare una distribuzione è normale quando: -Media = Mediana = Moda -Forma della distribuzione a campana

a. Per verificare se la distribuzione è normale univariata -Istogramma (forma a campana) -Indici di Asimmetria (Skewness) e Curtosi (Kurtosis). Asimmetria Negativa i dati si concentrano nella parte destra della distribuzione (“guardano verso i valori negativi”), Asimmetria Positiva i dati si concentrano nella parte sinistra della distribuzione (“guardano verso i valori positivi”) Ottenuti i valori di Asimmetria e Curtosi è necessario effettuare il Test di Verifica delle Ipotesi che consiste nel dividere tali valori per il proprio Errore Standard. La distribuzione si considera distribuita normalmente se i risultati ottenuti hanno un valore compreso tra –1 e 1 (devono comunque avvicinarsi il più possibile allo 0) in funzione del livello di significatività scelto (almeno .01).

a1. Rappresentazione grafica dei Quantili o Q-QPlot o Cumulative Normal Plot La distribuzione è normale se i punti si addensano lungo la diagonale positiva degli assi. a2. Box Plot Si tratta di una rappresentazione grafica di 5 indici (Minimo, Massimo, Mediana e i due Quartili intermedi). Il rettangolo (box) di solito colorato indica la Differenza Interquartilica e fornisce indicazioni sulla simmetria della distribuzione. a3. Test statistici per la verifica della normalità (Kolmogorov-Smirnov o Shapiro-Wilk) Si tratta di test molto potenti che confrontano la differenza tra la distribuzione cumulata attesa e quella osservata. Risentono dell’ampiezza campionaria Se i valori sono significativi (p<.01) esiste una differenza significativa rispetto alla normale. a4. Trasformazioni E’ possibile normalizzare la distribuzione ma occorre procedere con molta cautela specialmente nei casi di forti violazioni della normalità della distribuzione

b. Per verificare se la distribuzione è normale multivariata La distribuzione normale multivariata rappresenta una generalizzazione della normale univariata. Nel caso in cui tutte le distribuzioni univariate siano normali è probabile che anche quella multivariata lo sia. E’ possibile utilizzare un test grafico, il Q-Q Chi-quadrato della Distanza di Mahalanobis basato sull’utilizzo dei quantili della distribuzione del Chi quadrato. La Distanza di Mahalanobis può essere utilizzata anche per rilevare la presenza di outliers multivariati

6. Linearità della relazione tra le variabili verificabile con un diagramma di dispersione La linearità della relazione tra le variabili è verificabile con un diagramma di dispersione

7. Fattorializzabilità della matrice dei dati E’ possibile verificare la grandezza delle correlazioni tra le variabili (che deve essere elevata) mediante due test implementati in molti package statistici: a. Test di Sfericità di Bartlett (Bartlett, 1954) indica se la matrice di correlazione è una matrice identità (1 sulla diagonale e 0 fuori). Se il test è significativo e il campione è sufficientemente ampio è possibile effettuate l’AFE b. Test di Adeguatezza Campionaria o Kaiser-Meyer-Olkin (KMO) (Kaiser, 1970, 1974) indice che permette di confrontare la grandezza delle correlazioni osservate rispetto alle correlazioni parziali. I valori devono essere >.70