La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Accenni di analisi monovariata e bivariata

Presentazioni simili


Presentazione sul tema: "Accenni di analisi monovariata e bivariata"— Transcript della presentazione:

1 Accenni di analisi monovariata e bivariata

2 ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle relazioni con le altre variabili DISTRIBUZIONE DI FREQUENZA: è l’ordinamento tabulare dei dati raccolti e le frequenze corrispondenti

3 Verifiche da fare in sede di analisi monovariata:
Verifica di PLAUSIBILITÀ: controllo nella matrice dei “valori selvaggi” AGGREGAZIONE DELLE MODALITÀ, secondo due criteri: - equilibrio della distribuzione - affinità semantica

4 CONTROLLI SUI DATI: controlli di plausibilità; controllo in matrice dei valori selvaggi; controlli di congruenza; valori mancanti; ponderazione EQUILIBRIO DELLA DISTRIBUZIONE Le modalità si possono raggruppare secondo: I valori che assume la distribuzione L’affinità semantica (non si possono assommare variabili con significato divergente)

5 Valori mancanti Distinguiamo 4 situazioni di valori mancanti:
Non sa: il soggetto non sa rispondere Non applicabile: il soggetto non è tenuto a rispondere Non risponde: il soggetto rifiuta di rispondere Valore implausibile: si registra un valore non compreso nel codice Soltanto le ultime due costituiscono realmente dei valori mancanti

6 Valori selvaggi

7 Ponderazione Licenza elementare 29,5 25,3 29,5/25,3=1,17 Licenza media
% nella popolazione % nel campione Pesi Licenza elementare 29,5 25,3 29,5/25,3=1,17 Licenza media 42,4 40,8 42,4/40,8= 1,04 Diploma 20,7 23,4 20,7/23,4= 0,88 Laurea 7,4 10,5 7,4/10,5= 0,70

8 15-17 32% 18-21 16% 22-25 15% 26-29 37% 48% LICEO CLASSICO 15,6% 52%
% % % % LICEO CLASSICO ,6% LICEO SCIENTIFICO 19,7% ALTRO LICEO ,9% IST. TECNICO ,5% IST. PROFESSIONALE 8,1% ALTRO ,2% 48% 52% 42,2% 41,6%

9 Misure e test applicabili in sede di analisi monovariata
Media aritmetica: somma dei valori, divisi per il loro numero (solo se la variabile è cardinale) Varianza: in una distribuzione, è la distanza dei singoli valori dal valore medio. Se la varianza è alta significa che i singoli valori sono molto diversi tra loro

10 Mediana: è il valore di una distribuzione che la divide in due parti
Moda: è la modalità della distribuzione che ha la frequenza maggiore, cioè il maggior numero di casi (se la variabile è nominale è l’unica misura di tendenza centrale calcolabile)

11 Media, mediana, moda X1 + X2 + X3 +… Xn X = N
Serie: 18, 20, 20, 20, 21, 23, 60 Media: Mediana: Moda:

12 La differenza interquartile
Dividiamo i casi della distribuzione in 4 parti di eguale numerosità. I valori che segnano i confini sono detti QUARTILI. Il primo quartile è quel valore che ha sotto di sé il 25% della distribuzione e sopra di sé il 75%. Il secondo quartile coincide con la mediana Il terzo ha il 75% dei casi sotto di sé e il 25% sopra. Il quarto è l’ultimo caso della distribuzione DIFFERENZA INTERQUARTILE: Q = Q3 ─ Q1

13 Deviazione standard e varianza (per variabili cardinali)
Scostamento semplice medio È la media aritmetica degli scarti di ogni singolo valore dalla media Es. 18, 20, 20, 20, 21, 23, 25 Media: 21 Per ogni valore della distribuzione si può calcolare il suo scarto dalla media, fare la somma di questi scarti e dividerli per il numero dei casi

14 Deviazione standard (scarto quadratico medio)
Prendiamo gli scarti dei singoli valori dalla media e li eleviamo al quadrato; sommiamo questi scarti al quadrato, li dividiamo per il numero dei casi e poi estraiamo la radice quadrata La varianza È il quadrato della deviazione standard

15 Voti riportati agli esami di sociologia: 23, 21, 30, 18, 22, 29
Svolgimento: Calcolo la media: 23,8 Calcolo gli scarti: 0,8 + 2,8 + 6,2 + 5,8 + 1,8 + 5,2 Somma di ogni scarto elevato al quadrato = 0,6 +7,8 +38,4+33,6+3,2+27,0=110,6 Calcolo la deviazione standard (è la radice quadrata della somma degli scarti al quadrato, divisa per il n° dei casi): √ 110,6/6 = 4,29 Ottengo la varianza (è il quadrato della dev. standard) = 18,4

16 Distribuzione di frequenza della variabile ordinale “auto-collocazione sulla scala sinistra-destra”
% % cum. Estrema sinistra 52 2,2 Sinistra 531 22,0 24,2 Centro-sinistra 742 30,8 55,0 Centro 313 13,0 68,0 Centro-destra 505 20,9 88,9 Destra 243 10,1 99,0 Estrema destra 24 1,0 100 Totale 2.410

17 ANALISI BIVARIATA Studia le relazioni che possono esistere tra 2 variabili. Ha come prodotto una tabella di contingenza. Se riporto percentuali di riga: totale marginale di riga = a 100 Se riporto percentuali di colonna: totali marginali di colonna = a 100 Si scelgono le percentuali da riportare sulla base di quella che consideriamo variabile indipendente.

18 Il numero delle categorie non deve essere troppo elevato
FREQUENZA OSSERVATA: è il numero dei dati di una cella effettivamente rilevati FREQUENZA ATTESA: è la frequenza teorica che si dovrebbe ottenere sulla base dei totali marginali, se tra le due variabili considerate non esistesse alcuna associazione. FREQ. ATTESA = Prodotto dei totali marginali Totale dei casi

19 Se la frequenza osservata è molto diversa rispetto alla freq
Se la frequenza osservata è molto diversa rispetto alla freq. attesa, allora c’è un’associazione tra le due variabili. I risultati sono affidabili e statisticamente significativi soltanto se le frequenze attese sono alte e le freq. osservate basse. Chi-quadrato: testa la significatività della relazione tra 2 variabili; si basa sulla differenza tra freq. osservate e freq. attese

20 Frequenze attese/Frequenze osservate


Scaricare ppt "Accenni di analisi monovariata e bivariata"

Presentazioni simili


Annunci Google