Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento sistematico in Excel 2.Campionamento stratificato 3.Campionamento a grappoli 4.Campionamento non probabilistico 5.Probabilità e variabili aleatorie 6.Distribuzione di probabilità (es. Gaussiana) 7.Creare un dataset in Excel da un file di testo 8.Il GSS: quanti buoni amici hai?
2 esercizi concludi la dimostrazione 1.Errore campionario e CCS: 10 estrazioni random per campioni di dimensione: 10, 20, 30 e 100. quando l’errore campionario tende ad essere minore? 2.Verifica che CCS e CCI si equivalgono quando N/n → : 10 estrazioni random per N= 20, 30, 50, 200, con n= 10. quando la proporzione di soggetti ripetuti tende ad essere minore e quindi il CCI → CCS? GeneratoreCampioneRandom.xls
campionamento sistematico Il primo soggetto viene selezionato a random tra i primi k soggetti contenuti nella lista di campionamento, con k= N/ n (N= dimensione lista di campionamento e n= dimensione campione) successivamente vengono selezionati tutti i soggetti che si trovano nella k-esima posizione dopo il primo k è detto passo di estrazione Perché usarlo? è di facile implementazione (amministrazioni) porta a risultati simili al CCS se le unità della lista di campionamento sono ordinate in modo random rispetto al carattere di interesse
file di lavoro in moodle 2 Cliccare sul link per scaricare il file
2 Ai CS in Excel N/n= I3/I2 = ROUNDUP(RAND()*I4;0) = I4 = E2 + $I$2 = E3 + $I$2 = E4 + $I$2 = E5 + $I$2 GeneratoreCampioneRandom.xls
2 Ai CS in Excel = I4 = E2 + $I$2 = E3 + $I$2 = E4 + $I$2 = E5 + $I$2
2 Ai CS in Excel VLOOKUP(E2;$A$2:$D$501;4;TRUE) per recuperare la caratteristica di interesse (uso di alcol) da ciascun ID selezionato
2 Ai CS in Excel VLOOKUP(E2;$A$2:$D$501;4;TRUE) per recuperare la caratteristica di interesse (uso di alcol) da ciascun ID selezionato
2 Ai CS in Excel VLOOKUP(E2;$A$2:$D$501;4;TRUE) per recuperare la caratteristica di interesse (uso di alcol) da ciascun ID selezionato
Esercizi: dimostrazioni 1.L’errore campionario si riduce aumentando la dimensione del campione? manipola la grandezza del campione in maniera sistematica e osserva l’output della tabella 2.Cosa succede se le unità della lista di campionamento NON sono ordinate in modo random rispetto alla caratteristica di interesse? ad esempio cosa succede all’errore campionario se ordini (usando sort) la colonna “Fai uso di sostanze alcoliche”
1.si suddivide la lista di campionamento in strati ben definiti (es. genere). 2.l’estrazione casuale avviene all’interno degli strati (dal gruppo dei maschi e dal gruppo delle femmine). 3.può essere proporzionale o non proporzionale campionamento stratificato lista di campionamento
prova a farlo con Excel? “ordina” la lista di campionamento prendendo come riferimento la colonna Sesso (dal menu “sort by” e “ascending”) copia e incolla i dati delle femmine (F) e dei maschi (M) su colonne separate in un nuovo foglio di lavoro usa la tecnica implementata per il CCS per effettuare l’estrazione random
1.si suddivide la lista in un gran numero di grappoli (es. isolati di NY) 2.un campione random dei grappoli viene selezionato 3.tutti i soggetti in ciascun grappolo vengono estratti campionamento a grappoli
selezione di di 40 studenti
campionamento non probabilistico 1.volontario o di comodo: consiste nell’intervistare le unità più accessibili al ricercatore. 2.per quote: si suddivide la lista di campionamento in più sottogruppi fissando le quote da intervistare per ciascun sottogruppo. 3.a valanga: si sceglie la prima unità, poi ad essa viene chiesto di suggerirne un’altra e cosi via.
probabilità presupposto essenziale per il processo di descrizione e inferenza statistica In realtà è una disciplina a sé stante inizialmente sviluppata per lo studio dei giochi d'azzardo con applicazioni in tutti i campi della scienza
variabili aleatorie Per definizione, un singolo evento aleatorio o casuale non è predicibile Tuttavia, le ripetizioni dei fenomeni aleatori esibiscono delle regolarità. Lo scopo della teoria della probabilità è quello di descrivere queste regolarità
Gauss e l’ordine del disordine
Gauss e l’ordine del disordine
distanza Probabilità Gauss e l’ordine del disordine La ripetizione di eventi singoli e indipendenti rivela la struttura sottostante del fenomeno
flusso attentivo e caso Le traiettorie apparentemente casuali seguite dal nostro flusso attentivo durante l’esplorazione rivelano la struttura sottostante degli oggetti consegnandoci una rappresentazione coerente e stabile del mondo
campioni di altezza altezza nel mondo 1,61 < h < 1,63 1,59 < h < 1,61 1,57 < h < 1,59 altezza nel mondo
campioni di altezza altezza nel mondo 1,61 < h < 1,63 1,59 < h < 1,61 1,57 < h < 1,59 Francesca Piccinini e Simona Gioli h = 1,85 Sara Anzanello h = 1,92 altezza nel mondo
probabilità e frequenza altezza nel mondo distribuzione di probabilità (per variabile discreta) Funzione di ripartizione empirica
… e nelle scienze sociali?
Database: General Social Survey Campione composto da 2813 adulti statunitensi Popolazione di riferimento dello studio nello stesso periodo era di oltre 200 milioni di persone
Quanti buoni amici hai? NUMFREND Digita il nome della variabile di interesse (carattere) come variabile di riga Impostazioni output: grafico a barre verticali, valori percentuali o più propriamente frequenze relative o proporzioni Esempio 1.1. Agresti e Finley: Pag 3.
Tabella associa ad ogni evento che caratterizza la variabile numfrend una frequenza e il corrisondente valore percentuale o frequenza relativa Istogramma a barre Ordinata: frequenza relative (%) di occorrenza dell’evento (modalità, x i ) Ascissa: numero amici (carattere)
correggiamo l’errore con Excel aprire un file di testo; organizzarlo; osservarlo; sintetizzare i dati con le Pivot Tables poco → errore: doppia codifica quanto è leggibile questo grafico?
creiamo il dataset in 6 passi 1 2
3 4
5 6
file di lavoro in moodle 2 Cliccare sul link per scaricare il file
apriamo il file di testo Text Import Wizard 1 2 3
prepariamo il dataset per il lavoro tasto destro del mouse selezionando la riga da inserire nomina le colonne cliccando sulla cella e inserendo il testo in fx NUMFREND_DATASET.xls
dataset: osservazione (filtri automatici) cliccando si apre un menu a cascata che elenca tutti i valori all’interno della colonna visualizza solo le righe con il numero di amici selezionato dal menu (N=13, n.amici= 15) NUMFREND_DATASET.xls