Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoBernadetta Zanella Modificato 8 anni fa
1
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Analisi descrittiva di variabili qualitative e quantitative 2.Distribuzioni campionaria/empirica 3.Distribuzione di frequenza (diagramma a torta – diagramma a barre) per variabili qualitative 4.Distribuzione di frequenza relativa per variabili quantitative e distribuzione di probabilità: istogramma, diagramma a punti e linee, grafico a radar 5.Sintesi dei dati e Tabelle Pivot in Excel 6.Seriazione di frequenze in classi equiampie
2
comunicazioni Questa e la prossima settimana anche venerdì 9:30 – 11:00 (Aula 2B)
3
esercizi su Tecniche di Campionamento 1.Campionamento sistematico → Cosa succede se le unità della lista di campionamento NON sono ordinate in modo random rispetto al carattere di interesse? ad esempio se ordinate i dati della colonna “Fai uso di sostanze alcoliche”? 2.Campionamento stratificato → implementazione in Excel 3.Vedete le soluzioni date nel documento CampionamentoCasualeSemplice&Indipendente.xls 4.Attenzione: esercizi simili (su foglio) potrebbero essere esercizi di esame
4
dataset: osservazione (filtri automatici) cliccando si apre un menu a cascata che elenca tutti i valori all’interno della colonna visualizza solo le righe con il numero di amici selezionato dal menu (N=13, n.amici= 15) NUMFREND_DATASET.xls
5
ok…. ma come sintetizzare i dati?
6
Tabelle Pivot diversa veste grafica ma stesse funzionalità da MO 2007 in poi Borazzo e Pechinunno Cap. 5.5, pp 163-170
7
Tabelle Pivot Premi, poi tenendo premuto il tasto sinistro del mouse seleziona le colonne di interesse: nella finestra comparirà automaticamente la selezione effettuata: NUMFREND_DATASET!$A:$B
8
tabella a doppia entrata conta il numero di soggetti elenco ordinato del numero di amici
9
tabella a doppia entrata conta il numero di soggetti elenco ordinato del numero di amici trascina nell’area dei dati trascina nell’area delle righe
10
istogramma dinamico corretto in 1 click Foglio Pivot_Graph
11
frequenze relative come probabilità (%) Calocolo della % di amici inserendo la formula = B5/B34 nella cella D5 e trascinando il “+” nell’angolo in basso a destra della cella attiva in maniera da applicare la formula a tutte le righe attenzione! la cella che contiene il numero totale delle osservazioni (B34) deve essere bloccata (uguale per tutte le righe) scrivi “$” fra coordinata di riga e colonna ($B$34) oppure premi f4 abbiamo quindi ottenuto una funzione discreta di probabilità del numero di amici + =sum(D5:D32) ciascuna valore è compresa tra 0 e 1 e la somma è 100%
12
Inserimento grafici seleziona quindi scegli il grafico a colonne
13
definisci la serie Seleziona, poi seleziona tenendo premuto il tasto sinistro del mouse la colonna di dati corrispondente
14
definisci le proprietà quanti buoni amici hai? 0 0.04 0.08 0.12 0.16 0.2 13579 122024304150 759598 numero amici probabilità distribuzione di probabilità per variabile discreta gli eventi sono incompatibili/disgiunti vale quindi l’assioma distribuzione campionaria Ø intersezione → A e B unione → A o B Foglio Pivot_Table
15
definisci le proprietà quanti buoni amici hai? 0 0.04 0.08 0.12 0.16 0.2 13579 122024304150 759598 numero amici probabilità distribuzione di probabilità per variabile discreta Attenzione: c’è ancora un errore! gli eventi non hanno la stessa ampiezza distribuzione campionaria a b : a= 4; b= 46
16
correggiamo Crea una serie crescente da 1 al massimo valore presente nella variabile (99): a tal fine scrivi 1 nella prima riga; 2 nella seconda e poi trascina la selezione per altre 99 righe (1) Usando IF e VLOOKUP Crea il comando: se il numero in colonna C è presente nella lista di numeri in A allora calcola la % di amici altrimenti restituisci zero (2) 11 e 13 che non sono presenti nella colonna A sono messi a 0 nella colonna B Foglio Pivot_Table_corretto
17
rappresentazione alternativa discontinuo anche se la variabile è continua si può scegliere di usare una curva continua distribuzione campionaria quanti buoni amici hai? 0 0.04 0.08 0.12 0.16 0.2 020406080100 numero amici probabilità
18
grafico a radar utile per l’identificazione degli outlier
19
grafico a torta requisito: le fette sommano ad 1 (frequenze relative) più adeguato quando gli eventi sono pochi e di tipo categoriale (troppe fette non facilitano la lettura)
20
file di lavoro in moodle 2 http://moodle2.units.it/course/view.php?id=273 Cliccare sul link per scaricare il file
21
variabili qualitative 60 osservazioni della variabile sintomi dell’esposizione ai pesticidi J = gonfiore alle articolazioni, F = affaticamento, B = dolore alla schiena, M = debolezza muscolare, C = tosse, N = rinite, O = altro = COUNTIF($A$26:$D$40; A48) dataset A D 26 40 Scelta 1 Scelta 2 Sintomi&Pesticidi.xls
22
variabili qualitative 60 osservazioni della variabile sintomi dell’esposizione ai pesticidi J = gonfiore alle articolazioni, F = affaticamento, B = dolore alla schiena, M = debolezza muscolare, C = tosse, N = rinite, O = altro dataset A D 26 40 Esercizio Costruisci la tabella e i grafici in un click: facendo uso delle Tabelle Pivot Sintomi&Pesticidi.xls
23
Inferenza statistica processo di sintesi numerica che consente di trarre delle conclusioni a proposito delle caratteristiche di una popolazione (parametri) sulla base dei dati estratti da un campione (statistiche) 2 e 3 risposte più frequenti: ~ 16% distribuzione campionaria
24
parametri vs. statistiche parametri Numero di amici più frequentemente osservato nell’intera popolazione di adulti Tempo medio di partenza al verde semaforico quando viene usato/non-usato il cellulare durante la guida nell’intera popolazione dei guidatori attenzione! i parametri della popolazione sono generalmente ignoti statistiche Numero di amici più frequentemente osservato su un campione di 856 soggetti statunitensi Tempo medio di partenza al verde semaforico osservato su un campione di 100 guidatori che usavano/non-usavano il cellulare durante la guida
25
La % degli 856 soggetti che ha risposto 2/3 amici è una statistica finchè descrive una caratteristica del campione esso è e rimane una statistica descrittiva può essere utilizzato come statistica inferenziale per trarre inferenze sul valore di questo parametro della popolazione (se il campionamento è non viziato) statistica descrittiva vs. inferenziale
26
inferenza e descrizione possibile distorsione? distribuzione campionaria 2 e 3 risposte più frequenti: ~ 16% forte asimmetria bimodalità: nuovo picco a 10 altre variabili intervenienti? età? sesso?
27
la distribuzione dell’amicizia cambia in funzione dell’età? dataset con GSS analogo ma che contenga anche altre variabili: i.e., AGE. generiamo diversi isogrammi in funzione delle diverse fasce di età riportiamo i picchi di frequenza per ogni fascia di età e le relative % o proporzioni
28
È questo quello che vogliamo? NUMFREND_DATASET_AGE.xls
29
No! il numero di osservazioni per ogni categoria di età è troppo piccolo e troppo diverso per ciascuna categoria (distribuzioni campionarie non rappresentative) NUMFREND_DATASET_AGE.xls
30
La sintesi delle informazioni di un campione ottenuta mediante una distribuzione di frequenza è utile nel caso di variabili qualitative (come le risposte a un questionario) che assumono un numero limitato di modalità (quasi mai, poco frequentemente, abbastanza frequentemente, quasi sempre). Nel caso di variabili quantitative come l’età è invece necessario ragruppare le unità di osservazione in classi o intervalli disgiunti (che non abbiano cioè punti in comune) e associare ad ogni intervallo il numero dei casi (frequenza) i cui valori sono ricompresi nell'intervallo: si produce in tal modo una seriazione di frequenze. Due modi di farlo: con classi equiampie o con classi equiafrequenti In entrambi i casi il passo di seriazione è dato da /K dove K sono il numero di classi in cui la serie viene divisa e è la differenza fra valore massimo (X max ) e minimo (X min ) della serie seriazione di frequenze
31
tipi di distribuzioni empiriche
32
seriazione con classi equiampie Premere il tasto destro del mouse sul carattere da discretizzare (AGE) per far comparire il menu rapido selezionando l’opzione group (raggruppa) Inserisci il passo di seriazione nella casella “By”. Ad esempio se si vuole dividere l’età in 6 passi: (99-18)/6= 13.5 Borazzo, Perchinunno (Fig. 5.19 – 5.23 pp. 168, 169)
33
risultato poche osservazioni per la classe 85.5 – 99 vs. molte per quella 31.5 – 45. Anche questo può produrre distorsioni Per visualizzare il grafico basterà posizionarsi con il cursore sulla tabella pivot e premere
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.