Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Analisi descrittiva.

Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Analisi descrittiva di variabili qualitative e quantitative 2.Distribuzioni campionaria/empirica 3.Distribuzione di frequenza (diagramma a torta – diagramma a barre) per variabili qualitative 4.Distribuzione di frequenza relativa per variabili quantitative e distribuzione di probabilità: istogramma, diagramma a punti e linee, grafico a radar 5.Sintesi dei dati e Tabelle Pivot in Excel 6.Seriazione di frequenze in classi equiampie

comunicazioni  Questa e la prossima settimana anche venerdì 9:30 – 11:00 (Aula 2B)

esercizi su Tecniche di Campionamento 1.Campionamento sistematico → Cosa succede se le unità della lista di campionamento NON sono ordinate in modo random rispetto al carattere di interesse? ad esempio se ordinate i dati della colonna “Fai uso di sostanze alcoliche”? 2.Campionamento stratificato → implementazione in Excel 3.Vedete le soluzioni date nel documento CampionamentoCasualeSemplice&Indipendente.xls 4.Attenzione: esercizi simili (su foglio) potrebbero essere esercizi di esame

dataset: osservazione (filtri automatici) cliccando si apre un menu a cascata che elenca tutti i valori all’interno della colonna visualizza solo le righe con il numero di amici selezionato dal menu (N=13, n.amici= 15) NUMFREND_DATASET.xls

ok…. ma come sintetizzare i dati?

Tabelle Pivot diversa veste grafica ma stesse funzionalità da MO 2007 in poi Borazzo e Pechinunno Cap. 5.5, pp 163-170

Tabelle Pivot Premi, poi tenendo premuto il tasto sinistro del mouse seleziona le colonne di interesse: nella finestra comparirà automaticamente la selezione effettuata: NUMFREND_DATASET!$A:$B

tabella a doppia entrata conta il numero di soggetti elenco ordinato del numero di amici

tabella a doppia entrata conta il numero di soggetti elenco ordinato del numero di amici trascina nell’area dei dati trascina nell’area delle righe

istogramma dinamico corretto in 1 click Foglio Pivot_Graph

frequenze relative come probabilità (%)  Calocolo della % di amici inserendo la formula = B5/B34 nella cella D5 e trascinando il “+” nell’angolo in basso a destra della cella attiva in maniera da applicare la formula a tutte le righe  attenzione! la cella che contiene il numero totale delle osservazioni (B34) deve essere bloccata (uguale per tutte le righe)  scrivi “$” fra coordinata di riga e colonna ($B$34) oppure premi f4  abbiamo quindi ottenuto una funzione discreta di probabilità del numero di amici + =sum(D5:D32) ciascuna valore è compresa tra 0 e 1 e la somma è 100%

Inserimento grafici seleziona quindi scegli il grafico a colonne

definisci la serie Seleziona, poi seleziona tenendo premuto il tasto sinistro del mouse la colonna di dati corrispondente

definisci le proprietà quanti buoni amici hai? 0 0.04 0.08 0.12 0.16 0.2 13579 122024304150 759598 numero amici probabilità distribuzione di probabilità per variabile discreta  gli eventi sono incompatibili/disgiunti  vale quindi l’assioma distribuzione campionaria Ø intersezione → A e B unione → A o B Foglio Pivot_Table

definisci le proprietà quanti buoni amici hai? 0 0.04 0.08 0.12 0.16 0.2 13579 122024304150 759598 numero amici probabilità distribuzione di probabilità per variabile discreta  Attenzione: c’è ancora un errore!  gli eventi non hanno la stessa ampiezza distribuzione campionaria a b : a= 4; b= 46

correggiamo Crea una serie crescente da 1 al massimo valore presente nella variabile (99): a tal fine scrivi 1 nella prima riga; 2 nella seconda e poi trascina la selezione per altre 99 righe (1) Usando IF e VLOOKUP Crea il comando: se il numero in colonna C è presente nella lista di numeri in A allora calcola la % di amici altrimenti restituisci zero (2) 11 e 13 che non sono presenti nella colonna A sono messi a 0 nella colonna B Foglio Pivot_Table_corretto

rappresentazione alternativa  discontinuo anche se la variabile è continua  si può scegliere di usare una curva continua distribuzione campionaria quanti buoni amici hai? 0 0.04 0.08 0.12 0.16 0.2 020406080100 numero amici probabilità

grafico a radar utile per l’identificazione degli outlier

grafico a torta  requisito: le fette sommano ad 1 (frequenze relative)  più adeguato quando gli eventi sono pochi e di tipo categoriale (troppe fette non facilitano la lettura)

file di lavoro in moodle 2 http://moodle2.units.it/course/view.php?id=273 Cliccare sul link per scaricare il file

variabili qualitative 60 osservazioni della variabile sintomi dell’esposizione ai pesticidi J = gonfiore alle articolazioni, F = affaticamento, B = dolore alla schiena, M = debolezza muscolare, C = tosse, N = rinite, O = altro = COUNTIF($A$26:$D$40; A48) dataset A D 26 40 Scelta 1 Scelta 2 Sintomi&Pesticidi.xls

variabili qualitative 60 osservazioni della variabile sintomi dell’esposizione ai pesticidi J = gonfiore alle articolazioni, F = affaticamento, B = dolore alla schiena, M = debolezza muscolare, C = tosse, N = rinite, O = altro dataset A D 26 40 Esercizio Costruisci la tabella e i grafici in un click: facendo uso delle Tabelle Pivot Sintomi&Pesticidi.xls

Inferenza statistica processo di sintesi numerica che consente di trarre delle conclusioni a proposito delle caratteristiche di una popolazione (parametri) sulla base dei dati estratti da un campione (statistiche)  2 e 3 risposte più frequenti: ~ 16% distribuzione campionaria

parametri vs. statistiche parametri  Numero di amici più frequentemente osservato nell’intera popolazione di adulti  Tempo medio di partenza al verde semaforico quando viene usato/non-usato il cellulare durante la guida nell’intera popolazione dei guidatori  attenzione! i parametri della popolazione sono generalmente ignoti statistiche  Numero di amici più frequentemente osservato su un campione di 856 soggetti statunitensi  Tempo medio di partenza al verde semaforico osservato su un campione di 100 guidatori che usavano/non-usavano il cellulare durante la guida

 La % degli 856 soggetti che ha risposto 2/3 amici è una statistica  finchè descrive una caratteristica del campione esso è e rimane una statistica descrittiva  può essere utilizzato come statistica inferenziale per trarre inferenze sul valore di questo parametro della popolazione (se il campionamento è non viziato) statistica descrittiva vs. inferenziale

inferenza e descrizione possibile distorsione? distribuzione campionaria  2 e 3 risposte più frequenti: ~ 16%  forte asimmetria  bimodalità: nuovo picco a 10  altre variabili intervenienti? età? sesso?

la distribuzione dell’amicizia cambia in funzione dell’età?  dataset con GSS analogo ma che contenga anche altre variabili: i.e., AGE.  generiamo diversi isogrammi in funzione delle diverse fasce di età  riportiamo i picchi di frequenza per ogni fascia di età e le relative % o proporzioni

È questo quello che vogliamo? NUMFREND_DATASET_AGE.xls

 No! il numero di osservazioni per ogni categoria di età è troppo piccolo e troppo diverso per ciascuna categoria (distribuzioni campionarie non rappresentative) NUMFREND_DATASET_AGE.xls

 La sintesi delle informazioni di un campione ottenuta mediante una distribuzione di frequenza è utile nel caso di variabili qualitative (come le risposte a un questionario) che assumono un numero limitato di modalità (quasi mai, poco frequentemente, abbastanza frequentemente, quasi sempre).  Nel caso di variabili quantitative come l’età è invece necessario ragruppare le unità di osservazione in classi o intervalli disgiunti (che non abbiano cioè punti in comune) e associare ad ogni intervallo il numero dei casi (frequenza) i cui valori sono ricompresi nell'intervallo: si produce in tal modo una seriazione di frequenze.  Due modi di farlo: con classi equiampie o con classi equiafrequenti  In entrambi i casi il passo di seriazione è dato da  /K dove K sono il numero di classi in cui la serie viene divisa e  è la differenza fra valore massimo (X max ) e minimo (X min ) della serie seriazione di frequenze

tipi di distribuzioni empiriche

seriazione con classi equiampie Premere il tasto destro del mouse sul carattere da discretizzare (AGE) per far comparire il menu rapido selezionando l’opzione group (raggruppa) Inserisci il passo di seriazione nella casella “By”. Ad esempio se si vuole dividere l’età in 6 passi: (99-18)/6= 13.5 Borazzo, Perchinunno (Fig. 5.19 – 5.23 pp. 168, 169)

risultato poche osservazioni per la classe 85.5 – 99 vs. molte per quella 31.5 – 45. Anche questo può produrre distorsioni Per visualizzare il grafico basterà posizionarsi con il cursore sulla tabella pivot e premere

Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Analisi descrittiva.

Presentazioni simili

Presentazione sul tema: "Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Analisi descrittiva."— Transcript della presentazione:

Presentazioni simili

Sul progetto

Feed-back

Entrare

Autorizzarsi attraverso i social network:

Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Analisi descrittiva.

Presentazioni simili

Presentazione sul tema: "Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Analisi descrittiva."— Transcript della presentazione:

Presentazioni simili

Sul progetto

Feed-back