La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Campionamento.

Presentazioni simili


Presentazione sul tema: "Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Campionamento."— Transcript della presentazione:

1 Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Campionamento 2.Foglio di lavoro Excel 3.Esercitazione: 4.Generazione di una lista di campionamento simulata 5.Campionamento casuale semplice in Excel 6.Dimostrazione dell’errore campionario con CCS 7.Campionamento casuale indipendente in Excel 8.Dimostrazione dell’errore campionario con CCI

2 mettiamo le idee in pratica con Excel provare per comprendere programma per la creazione e gestione dei dati attraverso fogli elettronici  Insieme di fogli di carte sovrapposti  Ciascun foglio è diviso in righe e colonne  Le righe sono indicate da numeri  Le colonne sono indicate da lettere  I quadretti individuate dall’intersezione di righe e colonne sono detti celle  Ciascuna cella è indicata da una lettera e un numero (per esempio, in F8 valore 13579)

3 di cosa abbiamo bisogno? 1.lista di campionamento ordinata 2.algoritmo per la generazione uniforme di numeri casuali  funzione RAND() 3.riordinamento della lista in funzione dell’ordine definito dalla serie di numeri random 4.selezione campionamento casuale semplice  ogni unità della lista non può comparire più di una volta nel campione (senza rimpiazzo o reinserimento)  la probabilità di essere selezionati cresce al crescere dell’indice di selezione: P 1 = 1/N, P 2 = 1/(N-1).. P n = 1/(N-n-1) GeneratoreCampioneRandom.xls

4 lista di campionamento simulata/dinamica (fn + f9) uso di sostanze alcoliche

5 generare valori random  Nomina una colonna adiacente al set di dati  per inserire la funzione di generazione dei numeri random, fai clic in una cella per entrare in modo modifica  Il primo carattere da inserire deve essere l'uguale (=)  scrivi quindi la funzione: RAND()  trascina il “+” nell’angolo in basso a destra della cella attiva in maniera da applicare la formula a tutte le righe  Colonna di numeri random dinamica: premendo F9 i numeri si aggiornano + GeneratoreCampioneRandom.xls

6 funzioni in Excel: sintassi  nome della funzione, parentesi aperta, argomenti separati da punti e virgola, parentesi chiusa  All’interno di un argomento i : indicano da a  esempio somma(A1:A3), calcola nella cella B1 la somma degli elementi da A1 a A3 e restituisce 9

7 inserimento guidato clicca su una cella vuota per aprire la finestra di inserimento funzione seleziona la categoria della funzione che cerchi e scegli la funzione dalla finestra “Select a function” si apre la finestra degli argomenti della funzione. Basta selezionare con il mouse le celle da sommare

8 ordina/disordina e selezione  apri la finestra di ordinamento dati andando su data → sort  “ordina/disordina” l’intero set di dati prendendo come riferimento la colonna Numero Random (dal menu “sort by”) e “ascending”  N.B. la posizione di ciascun ID nell’array della colonna A è totalmente random: quale sarà la probabilità di ciascun ID di comparire in una o l’altra posizione?  Selezionando un sottoinsieme di ID dalla colonna A avremo quindi effettuato un campionamento casuale semplice

9 proprietà del CCS per campioni sufficientemente grandi la caratteristica misurata (per esempio, la quantità relativa di ID che fanno uso di sostanze alcoliche) è stabile da campione a campione e l’ errore campionario si riduce verifichiamo con Excel

10  se è vero il numero di persone che fanno uso di alcol su un campione abbastanza grande (n= 100) dovrebbe corrispondere in termini relativi al numero di persone che che fanno uso di alcol della popolazione (lista)  la funzione countif(x i→n ;”=Si”) conta il numero di si in una riga da i a n e la funzione rows(x i→n ) conta il numero di elementi della selezione proprietà del CCS

11  se è vero il numero di persone che fanno uso di alcol su un campione abbastanza grande (n= 100) dovrebbe corrispondere in termini relativi al numero di persone che che fanno uso di alcol della popolazione  la funzione countif(x i→n ;”=Si”) conta il numero di si in una riga da i a n e la funzione rows(x i→n ) conta il numero di elementi della selezione COUNTIF(D2:D501; “=Si”) COUNTIF(D2:D501; “=No”)I3/ROWS(D2:D501) I3 proprietà del CCS errore campionario=| 

12  ci fornisce un primo esempio di come procede la statistica  stima un parametro della popolazione P (proporzione di facenti uso di alchol) mediante la proporzione campionaria p  e la sua quota di errore e dovuta al campionamento stesso  le conclusioni statistiche sono sempre accompagnate da un certo grado di incertezza e P = p ± e errore campionario=| 

13 Esercizio concludi la dimostrazione  dovrebbe anche essere vero il contrario però: per campioni piccoli (n= 20) le proporzioni dovrebbero differire  come verificare?  fai 10 estrazioni random per campioni di dimensione: 10, 20, 30 e 100.  per ogni estrazione riporta i dati della tabella e l’errore campionario  quando l’errore campionario tende ad essere minore?

14 di cosa abbiamo bisogno? 1.algoritmo per la generazione uniforme di indici random (numeri casuali interi nel range di numerosità della popolazione, N)  fx ROUNDUP(RAND()*N) 2.selezione automatica degli ID dalla lista di campionamento in base agli indici random  fx VLOOKUP(indice;array;colonna array) campionamento casuale indipendente ogni unità della popolazione ha la stessa probabilità di essere selezionato, P= 1/N, dato che viene re-inserito nella popolazione se selezionato

15 estraiamo un n= 10 da una N= 30  Crea due colonne (C e D) accanto allle due colonne di dati (A e B)  Nella prima cella della colonna C genera il primo indice random moltiplicando RAND  la grandezza della lista di campionamento (N=30) e applicare la formula a tutte le righe trascinando  Nella prima cella della colonna D usa la funzione VLOOKUP per ottenere l’ ID corrispondente all’indice random  Trascina quindi la selezione fino alla riga 11 bloccando i riferimenti dell’array: immetti il segno $ prima della coordinata di riga (numero) e di colonna (lettera) ROUNDUP(RAND()*30) VLOOKUP(C2; $A$2:$B$31);2;TRUE) ID14 ID29 ID8 ID15 ID17 ID20

16 proprietà del CCI Se il campione è piccolo rispetto alla popolazione il CCS e il CCI si equivalgono dato che tanto più è piccolo il campione tanto meno è probabile che lo stesso individuo venga scelto più di una volta verifichiamo con Excel usando la funzione MATCH... e l’ingegno

17 Corrispondenza D 2 MATCH(D2; $D$2:$D$11;0) restituisce il numero della riga della selezione (1) del primo elemento dell’array che corrisponde a D2

18 D 2 Corrispondenza

19 MATCH(D9; $D$2:$D$11;0) D 9 Corrispondenza

20 MATCH(D9; $D$2:$D$11;0) D 9  Applichiamo a tutta la colonna  Nota che solo le celle che si riferiscono a ID ripetuti non sono in ordine ascendente Corrispondenza

21 9  Applichiamo a tutta la colonna  Nota che solo le celle che si riferiscono a ID ripetuti non sono in ordine ascendente  Nella Colonna di Confronto immettiamo quindi una serie crescente da 1 a 10 e Confrontiamo con la funzione IF nella colonna adiacente Corrispondenza

22 E 9  Applichiamo a tutta la colonna  Nota che solo le celle che si riferiscono a ID ripetuti non sono in ordine ascendente  Nella Colonna di Confronto immettiamo quindi una serie crescente da 1 a 10 e Confrontiamo con la funzione IF nella colonna adiacente F IF(OR(E2>F2;E2<F2);1;0) verifica se il valore in E è maggiore o (OR) minore del valore in F (i.e., ≠); restituisce 1 se vero; altrimenti 0 Corrispondenza

23 E 9  Applichiamo a tutta la colonna  Nota che solo le celle che si riferiscono a ID ripetuti non sono in ordine ascendente  Nella Colonna di Confronto immettiamo quindi una serie crescente da 1 a 10 e Confrontiamo con la funzione IF nella colonna adiacente F Corrispondenza

24 E 9  Applichiamo a tutta la colonna  Nota che solo le celle che si riferiscono a ID ripetuti non sono in ordine ascendente  Nella Colonna di Confronto immettiamo quindi una serie crescente da 1 a 10 e Confrontiamo con la funzione IF nella colonna adiacente F Corrispondenza

25 Esercizio concludi la dimostrazione  verifica che aumentando la dimensione della popolazione il numero di ID ripetuti nel campione si riduce  come?  fai 10 estrazioni random per popolazioni di dimensione: 20, 30, 50, 200.  per ogni estrazione riporta la proporzione di soggetti ripetuti nel campione.  quando la proporzione tende ad essere minore?


Scaricare ppt "Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Campionamento."

Presentazioni simili


Annunci Google