Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoBaldo Orsini Modificato 8 anni fa
1
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Campionamento sistematico in Excel 2.Campionamento stratificato 3.Campionamento a grappoli 4.Campionamento non probabilistico 5.Probabilità e variabili aleatorie 6.Distribuzione di probabilità (es. Gaussiana) 7.Creare un dataset in Excel da un file di testo 8.Il GSS: quanti buoni amici hai?
2
2 esercizi concludi la dimostrazione 1.Errore campionario e CCS: 10 estrazioni random per campioni di dimensione: 10, 20, 30 e 100. quando l’errore campionario tende ad essere minore? 2.Verifica che CCS e CCI si equivalgono quando N/n → : 10 estrazioni random per N= 20, 30, 50, 200, con n= 10. quando la proporzione di soggetti ripetuti tende ad essere minore e quindi il CCI → CCS? GeneratoreCampioneRandom.xls
3
campionamento sistematico Il primo soggetto viene selezionato a random tra i primi k soggetti contenuti nella lista di campionamento, con k= N/ n (N= dimensione lista di campionamento e n= dimensione campione) successivamente vengono selezionati tutti i soggetti che si trovano nella k-esima posizione dopo il primo k è detto passo di estrazione Perché usarlo? è di facile implementazione (amministrazioni) porta a risultati simili al CCS se le unità della lista di campionamento sono ordinate in modo random rispetto al carattere di interesse
4
file di lavoro in moodle 2 http://moodle2.units.it/course/view.php?id=273 Cliccare sul link per scaricare il file
5
2 Ai CS in Excel N/n= I3/I2 = ROUNDUP(RAND()*I4;0) = I4 = E2 + $I$2 = E3 + $I$2 = E4 + $I$2 = E5 + $I$2 GeneratoreCampioneRandom.xls
6
2 Ai CS in Excel = I4 = E2 + $I$2 = E3 + $I$2 = E4 + $I$2 = E5 + $I$2
7
2 Ai CS in Excel VLOOKUP(E2;$A$2:$D$501;4;TRUE) per recuperare la caratteristica di interesse (uso di alcol) da ciascun ID selezionato
8
2 Ai CS in Excel VLOOKUP(E2;$A$2:$D$501;4;TRUE) per recuperare la caratteristica di interesse (uso di alcol) da ciascun ID selezionato
9
2 Ai CS in Excel VLOOKUP(E2;$A$2:$D$501;4;TRUE) per recuperare la caratteristica di interesse (uso di alcol) da ciascun ID selezionato
10
Esercizi: dimostrazioni 1.L’errore campionario si riduce aumentando la dimensione del campione? manipola la grandezza del campione in maniera sistematica e osserva l’output della tabella 2.Cosa succede se le unità della lista di campionamento NON sono ordinate in modo random rispetto alla caratteristica di interesse? ad esempio cosa succede all’errore campionario se ordini (usando sort) la colonna “Fai uso di sostanze alcoliche”
11
1.si suddivide la lista di campionamento in strati ben definiti (es. genere). 2.l’estrazione casuale avviene all’interno degli strati (dal gruppo dei maschi e dal gruppo delle femmine). 3.può essere proporzionale o non proporzionale campionamento stratificato lista di campionamento
12
prova a farlo con Excel? “ordina” la lista di campionamento prendendo come riferimento la colonna Sesso (dal menu “sort by” e “ascending”) copia e incolla i dati delle femmine (F) e dei maschi (M) su colonne separate in un nuovo foglio di lavoro usa la tecnica implementata per il CCS per effettuare l’estrazione random
13
1.si suddivide la lista in un gran numero di grappoli (es. isolati di NY) 2.un campione random dei grappoli viene selezionato 3.tutti i soggetti in ciascun grappolo vengono estratti campionamento a grappoli
14
selezione di di 40 studenti
15
campionamento non probabilistico 1.volontario o di comodo: consiste nell’intervistare le unità più accessibili al ricercatore. 2.per quote: si suddivide la lista di campionamento in più sottogruppi fissando le quote da intervistare per ciascun sottogruppo. 3.a valanga: si sceglie la prima unità, poi ad essa viene chiesto di suggerirne un’altra e cosi via.
16
probabilità presupposto essenziale per il processo di descrizione e inferenza statistica In realtà è una disciplina a sé stante inizialmente sviluppata per lo studio dei giochi d'azzardo con applicazioni in tutti i campi della scienza
17
variabili aleatorie Per definizione, un singolo evento aleatorio o casuale non è predicibile Tuttavia, le ripetizioni dei fenomeni aleatori esibiscono delle regolarità. Lo scopo della teoria della probabilità è quello di descrivere queste regolarità
18
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 Gauss e l’ordine del disordine
19
0 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1
20
0 0 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1
21
0 0 0 0 0 0 0 0 1 1 1 1 1 1 0 0 0 0 0 0 0 0 2 2
22
0 0 0 0 1 1 3 3 5 5 10 5 5 4 4 0 0 0 0 0 0 Gauss e l’ordine del disordine
23
distanza Probabilità 0-2-3123 Gauss e l’ordine del disordine La ripetizione di eventi singoli e indipendenti rivela la struttura sottostante del fenomeno
24
flusso attentivo e caso Le traiettorie apparentemente casuali seguite dal nostro flusso attentivo durante l’esplorazione rivelano la struttura sottostante degli oggetti consegnandoci una rappresentazione coerente e stabile del mondo
25
campioni di altezza altezza nel mondo 1,61 < h < 1,63 1,59 < h < 1,61 1,57 < h < 1,59 altezza nel mondo
26
campioni di altezza altezza nel mondo 1,61 < h < 1,63 1,59 < h < 1,61 1,57 < h < 1,59 Francesca Piccinini e Simona Gioli h = 1,85 Sara Anzanello h = 1,92 altezza nel mondo
27
probabilità e frequenza altezza nel mondo distribuzione di probabilità (per variabile discreta) 1 0 0.5 Funzione di ripartizione empirica
28
… e nelle scienze sociali?
29
Database: General Social Survey http://sda.berkeley.edu/sdaweb/analysis/?dataset=gss12noweight http://sda.berkeley.edu/sdaweb/analysis/?dataset=gss12noweight Campione composto da 2813 adulti statunitensi Popolazione di riferimento dello studio nello stesso periodo era di oltre 200 milioni di persone
30
Quanti buoni amici hai? NUMFREND Digita il nome della variabile di interesse (carattere) come variabile di riga Impostazioni output: grafico a barre verticali, valori percentuali o più propriamente frequenze relative o proporzioni Esempio 1.1. Agresti e Finley: Pag 3.
31
Tabella associa ad ogni evento che caratterizza la variabile numfrend una frequenza e il corrisondente valore percentuale o frequenza relativa Istogramma a barre Ordinata: frequenza relative (%) di occorrenza dell’evento (modalità, x i ) Ascissa: numero amici (carattere)
32
correggiamo l’errore con Excel aprire un file di testo; organizzarlo; osservarlo; sintetizzare i dati con le Pivot Tables poco → errore: doppia codifica quanto è leggibile questo grafico?
33
creiamo il dataset in 6 passi 1 2
34
3 4
35
5 6
36
file di lavoro in moodle 2 http://moodle2.units.it/course/view.php?id=273 Cliccare sul link per scaricare il file
37
apriamo il file di testo Text Import Wizard 1 2 3
38
prepariamo il dataset per il lavoro tasto destro del mouse selezionando la riga da inserire nomina le colonne cliccando sulla cella e inserendo il testo in fx NUMFREND_DATASET.xls
39
dataset: osservazione (filtri automatici) cliccando si apre un menu a cascata che elenca tutti i valori all’interno della colonna visualizza solo le righe con il numero di amici selezionato dal menu (N=13, n.amici= 15) NUMFREND_DATASET.xls
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.