Accenni di analisi monovariata e bivariata

Slides:



Advertisements
Presentazioni simili
LA MEDIA STATISTICA di Zappa Giacomo.
Advertisements

- le Medie la Moda la Mediana
SCALA INTERVALLO / A RAPPORTO
LA VARIABILITA’ IV lezione di Statistica Medica.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
STATISTICA DESCRITTIVA
“Teoria e metodi della ricerca sociale e organizzativa”
Descrizione dei dati Metodi di descrizione dei dati
Gli errori nell’analisi statistica
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Esercizio 1 In una indagine statistica si vuole rilevare il numero di cellulari posseduti dagli studenti iscritti alla facoltà di economia. Si dica: -
STATISTICA DESCRITTIVA
Analisi della varianza (a una via)
COSA VUOL DIRE FARE STATISTICA
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Misurazione Le osservazioni si esprimono in forma di misurazioni
Nicola Paparella, Università degli Studi, Lecce, aprile 2006 Pedagogia sperimentale Note ed appunti Corso di base / 5
Pedagogia sperimentale
Popolazione campione Y - variabile casuale y - valori argomentali Frequenza relativa: Estrazione Densità della classe i-esima: Lezione 1.
METODI E CONTROLLI STATISTICI DI PROCESSO
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Di Capuano,Colucci e Panunzi Valori medi I valori medi.
MEDIE STATISTICHE.
Le distribuzioni campionarie
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Simone Mosca & Daniele Zucchini 4Bi.
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
La Variabilità e La Concentrazione
Sintesi della lezione Il concetto di variabilità Campo di variazione Differenza interquartile La varianza La deviazione standard Scostamenti medi VARIABILITA’
L’analisi monovariata
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Statistica La statistica è
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Gli indici di dispersione
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
COSA VUOL DIRE FARE STATISTICA
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Strumenti statistici in Excell
Corso di Analisi Statistica per le Imprese Indici di variabilita’ ed eterogeneita’ Prof. L. Neri a.a
Martina Serafini Martina Prandi
Come analizzare una tabella di contingenza quando il valore del chi quadrato è significativo Analisi dei residui con un esempio reale: Studenti universitari.
Marta Pinto Stefania Serra Valentina Paravidino
3 June Biostatistica Biostatitistica= Statistica per scienze Biostatitistica= Statistica per scienze biologiche e sanitarie. biologiche e sanitarie.
Test basati su due campioni Test Chi - quadro
STATISTICHE DESCRITTIVE
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi.
Accenni di analisi monovariata e bivariata
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
ANALISI E INTERPRETAZIONE DATI
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
DIPENDENZA STATISTICA TRA DUE CARATTERI Per una stessa collettività può essere interessante studiare più caratteri presenti contemporaneamente in ogni.
Accenni di analisi monovariata e bivariata. ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
ARGOMENTI DELLA LEZIONE  Le distribuzioni di frequenza in classi  Le distribuzioni di frequenza in classi  Le tabelle di frequenza  La rappresentazione.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Analisi delle osservazioni
Gli Indici di VARIABILITA’
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Accenni di analisi monovariata e bivariata
Transcript della presentazione:

Accenni di analisi monovariata e bivariata

ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle relazioni con le altre variabili DISTRIBUZIONE DI FREQUENZA: è l’ordinamento tabulare dei dati raccolti e le frequenze corrispondenti

Verifiche da fare in sede di analisi monovariata: Verifica di PLAUSIBILITÀ: controllo nella matrice dei “valori selvaggi” AGGREGAZIONE DELLE MODALITÀ, secondo due criteri: - equilibrio della distribuzione - affinità semantica

CONTROLLI SUI DATI: controlli di plausibilità; controllo in matrice dei valori selvaggi; controlli di congruenza; valori mancanti; ponderazione EQUILIBRIO DELLA DISTRIBUZIONE Le modalità si possono raggruppare secondo: I valori che assume la distribuzione L’affinità semantica (non si possono assommare variabili con significato divergente)

Valori mancanti Distinguiamo 4 situazioni di valori mancanti: Non sa: il soggetto non sa rispondere Non applicabile: il soggetto non è tenuto a rispondere Non risponde: il soggetto rifiuta di rispondere Valore implausibile: si registra un valore non compreso nel codice Soltanto le ultime due costituiscono realmente dei valori mancanti

Valori selvaggi

Ponderazione Licenza elementare 29,5 25,3 29,5/25,3=1,17 Licenza media % nella popolazione % nel campione Pesi Licenza elementare 29,5 25,3 29,5/25,3=1,17 Licenza media 42,4 40,8 42,4/40,8= 1,04 Diploma 20,7 23,4 20,7/23,4= 0,88 Laurea 7,4 10,5 7,4/10,5= 0,70

15-17 32% 18-21 16% 22-25 15% 26-29 37% 48% LICEO CLASSICO 15,6% 52% 15-17 32% 18-21 16% 22-25 15% 26-29 37% LICEO CLASSICO 15,6% LICEO SCIENTIFICO 19,7% ALTRO LICEO 6,9% IST. TECNICO 33,5% IST. PROFESSIONALE 8,1% ALTRO 16,2% 48% 52% 42,2% 41,6%

Misure e test applicabili in sede di analisi monovariata Media aritmetica: somma dei valori, divisi per il loro numero (solo se la variabile è cardinale) Varianza: in una distribuzione, è la distanza dei singoli valori dal valore medio. Se la varianza è alta significa che i singoli valori sono molto diversi tra loro

Mediana: è il valore di una distribuzione che la divide in due parti Moda: è la modalità della distribuzione che ha la frequenza maggiore, cioè il maggior numero di casi (se la variabile è nominale è l’unica misura di tendenza centrale calcolabile)

Media, mediana, moda X1 + X2 + X3 +… Xn X = N Serie: 18, 20, 20, 20, 21, 23, 60 Media: Mediana: Moda:

La differenza interquartile Dividiamo i casi della distribuzione in 4 parti di eguale numerosità. I valori che segnano i confini sono detti QUARTILI. Il primo quartile è quel valore che ha sotto di sé il 25% della distribuzione e sopra di sé il 75%. Il secondo quartile coincide con la mediana Il terzo ha il 75% dei casi sotto di sé e il 25% sopra. Il quarto è l’ultimo caso della distribuzione DIFFERENZA INTERQUARTILE: Q = Q3 ─ Q1

Deviazione standard e varianza (per variabili cardinali) Scostamento semplice medio È la media aritmetica degli scarti di ogni singolo valore dalla media Es. 18, 20, 20, 20, 21, 23, 25 Media: 21 Per ogni valore della distribuzione si può calcolare il suo scarto dalla media, fare la somma di questi scarti e dividerli per il numero dei casi

Deviazione standard (scarto quadratico medio) Prendiamo gli scarti dei singoli valori dalla media e li eleviamo al quadrato; sommiamo questi scarti al quadrato, li dividiamo per il numero dei casi e poi estraiamo la radice quadrata La varianza È il quadrato della deviazione standard

Voti riportati agli esami di sociologia: 23, 21, 30, 18, 22, 29 Svolgimento: Calcolo la media: 23,8 Calcolo gli scarti: 0,8 + 2,8 + 6,2 + 5,8 + 1,8 + 5,2 Somma di ogni scarto elevato al quadrato = 0,6 +7,8 +38,4+33,6+3,2+27,0=110,6 Calcolo la deviazione standard (è la radice quadrata della somma degli scarti al quadrato, divisa per il n° dei casi): √ 110,6/6 = 4,29 Ottengo la varianza (è il quadrato della dev. standard) = 18,4

Distribuzione di frequenza della variabile ordinale “auto-collocazione sulla scala sinistra-destra” % % cum. Estrema sinistra 52 2,2 Sinistra 531 22,0 24,2 Centro-sinistra 742 30,8 55,0 Centro 313 13,0 68,0 Centro-destra 505 20,9 88,9 Destra 243 10,1 99,0 Estrema destra 24 1,0 100 Totale 2.410

ANALISI BIVARIATA Studia le relazioni che possono esistere tra 2 variabili. Ha come prodotto una tabella di contingenza. Se riporto percentuali di riga: totale marginale di riga = a 100 Se riporto percentuali di colonna: totali marginali di colonna = a 100 Si scelgono le percentuali da riportare sulla base di quella che consideriamo variabile indipendente.

Il numero delle categorie non deve essere troppo elevato FREQUENZA OSSERVATA: è il numero dei dati di una cella effettivamente rilevati FREQUENZA ATTESA: è la frequenza teorica che si dovrebbe ottenere sulla base dei totali marginali, se tra le due variabili considerate non esistesse alcuna associazione. FREQ. ATTESA = Prodotto dei totali marginali Totale dei casi

Se la frequenza osservata è molto diversa rispetto alla freq Se la frequenza osservata è molto diversa rispetto alla freq. attesa, allora c’è un’associazione tra le due variabili. I risultati sono affidabili e statisticamente significativi soltanto se le frequenze attese sono alte e le freq. osservate basse. Chi-quadrato: testa la significatività della relazione tra 2 variabili; si basa sulla differenza tra freq. osservate e freq. attese

Frequenze attese/Frequenze osservate