Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoGilda Gallo Modificato 8 anni fa
1
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Campionamento 2.Foglio di lavoro Excel 3.Esercitazione: 4.Generazione di una lista di campionamento simulata 5.Campionamento casuale semplice in Excel 6.Dimostrazione dell’errore campionario con CCS 7.Campionamento casuale indipendente in Excel 8.Dimostrazione dell’errore campionario con CCI
2
mettiamo le idee in pratica con Excel provare per comprendere programma per la creazione e gestione dei dati attraverso fogli elettronici Insieme di fogli di carte sovrapposti Ciascun foglio è diviso in righe e colonne Le righe sono indicate da numeri Le colonne sono indicate da lettere I quadretti individuate dall’intersezione di righe e colonne sono detti celle Ciascuna cella è indicata da una lettera e un numero (per esempio, in F8 valore 13579)
3
di cosa abbiamo bisogno? 1.lista di campionamento ordinata 2.algoritmo per la generazione uniforme di numeri casuali funzione RAND() 3.riordinamento della lista in funzione dell’ordine definito dalla serie di numeri random 4.selezione campionamento casuale semplice ogni unità della lista non può comparire più di una volta nel campione (senza rimpiazzo o reinserimento) la probabilità di essere selezionati cresce al crescere dell’indice di selezione: P 1 = 1/N, P 2 = 1/(N-1).. P n = 1/(N-n-1) GeneratoreCampioneRandom.xls
4
lista di campionamento simulata/dinamica (fn + f9) uso di sostanze alcoliche
5
generare valori random Nomina una colonna adiacente al set di dati per inserire la funzione di generazione dei numeri random, fai clic in una cella per entrare in modo modifica Il primo carattere da inserire deve essere l'uguale (=) scrivi quindi la funzione: RAND() trascina il “+” nell’angolo in basso a destra della cella attiva in maniera da applicare la formula a tutte le righe Colonna di numeri random dinamica: premendo F9 i numeri si aggiornano + GeneratoreCampioneRandom.xls
6
funzioni in Excel: sintassi nome della funzione, parentesi aperta, argomenti separati da punti e virgola, parentesi chiusa All’interno di un argomento i : indicano da a esempio somma(A1:A3), calcola nella cella B1 la somma degli elementi da A1 a A3 e restituisce 9
7
inserimento guidato clicca su una cella vuota per aprire la finestra di inserimento funzione seleziona la categoria della funzione che cerchi e scegli la funzione dalla finestra “Select a function” si apre la finestra degli argomenti della funzione. Basta selezionare con il mouse le celle da sommare
8
ordina/disordina e selezione apri la finestra di ordinamento dati andando su data → sort “ordina/disordina” l’intero set di dati prendendo come riferimento la colonna Numero Random (dal menu “sort by”) e “ascending” N.B. la posizione di ciascun ID nell’array della colonna A è totalmente random: quale sarà la probabilità di ciascun ID di comparire in una o l’altra posizione? Selezionando un sottoinsieme di ID dalla colonna A avremo quindi effettuato un campionamento casuale semplice
9
proprietà del CCS per campioni sufficientemente grandi la caratteristica misurata (per esempio, la quantità relativa di ID che fanno uso di sostanze alcoliche) è stabile da campione a campione e l’ errore campionario si riduce verifichiamo con Excel
10
se è vero il numero di persone che fanno uso di alcol su un campione abbastanza grande (n= 100) dovrebbe corrispondere in termini relativi al numero di persone che che fanno uso di alcol della popolazione (lista) la funzione countif(x i→n ;”=Si”) conta il numero di si in una riga da i a n e la funzione rows(x i→n ) conta il numero di elementi della selezione proprietà del CCS
11
se è vero il numero di persone che fanno uso di alcol su un campione abbastanza grande (n= 100) dovrebbe corrispondere in termini relativi al numero di persone che che fanno uso di alcol della popolazione la funzione countif(x i→n ;”=Si”) conta il numero di si in una riga da i a n e la funzione rows(x i→n ) conta il numero di elementi della selezione COUNTIF(D2:D501; “=Si”) COUNTIF(D2:D501; “=No”)I3/ROWS(D2:D501) I3 proprietà del CCS errore campionario=|
12
ci fornisce un primo esempio di come procede la statistica stima un parametro della popolazione P (proporzione di facenti uso di alchol) mediante la proporzione campionaria p e la sua quota di errore e dovuta al campionamento stesso le conclusioni statistiche sono sempre accompagnate da un certo grado di incertezza e P = p ± e errore campionario=|
13
Esercizio concludi la dimostrazione dovrebbe anche essere vero il contrario però: per campioni piccoli (n= 20) le proporzioni dovrebbero differire come verificare? fai 10 estrazioni random per campioni di dimensione: 10, 20, 30 e 100. per ogni estrazione riporta i dati della tabella e l’errore campionario quando l’errore campionario tende ad essere minore?
14
di cosa abbiamo bisogno? 1.algoritmo per la generazione uniforme di indici random (numeri casuali interi nel range di numerosità della popolazione, N) fx ROUNDUP(RAND()*N) 2.selezione automatica degli ID dalla lista di campionamento in base agli indici random fx VLOOKUP(indice;array;colonna array) campionamento casuale indipendente ogni unità della popolazione ha la stessa probabilità di essere selezionato, P= 1/N, dato che viene re-inserito nella popolazione se selezionato
15
estraiamo un n= 10 da una N= 30 Crea due colonne (C e D) accanto allle due colonne di dati (A e B) Nella prima cella della colonna C genera il primo indice random moltiplicando RAND la grandezza della lista di campionamento (N=30) e applicare la formula a tutte le righe trascinando Nella prima cella della colonna D usa la funzione VLOOKUP per ottenere l’ ID corrispondente all’indice random Trascina quindi la selezione fino alla riga 11 bloccando i riferimenti dell’array: immetti il segno $ prima della coordinata di riga (numero) e di colonna (lettera) ROUNDUP(RAND()*30) VLOOKUP(C2; $A$2:$B$31);2;TRUE) ID14 ID29 ID8 ID15 ID17 ID20
16
proprietà del CCI Se il campione è piccolo rispetto alla popolazione il CCS e il CCI si equivalgono dato che tanto più è piccolo il campione tanto meno è probabile che lo stesso individuo venga scelto più di una volta verifichiamo con Excel usando la funzione MATCH... e l’ingegno
17
Corrispondenza D 2 MATCH(D2; $D$2:$D$11;0) restituisce il numero della riga della selezione (1) del primo elemento dell’array che corrisponde a D2
18
D 2 Corrispondenza
19
MATCH(D9; $D$2:$D$11;0) D 9 Corrispondenza
20
MATCH(D9; $D$2:$D$11;0) D 9 Applichiamo a tutta la colonna Nota che solo le celle che si riferiscono a ID ripetuti non sono in ordine ascendente Corrispondenza
21
9 Applichiamo a tutta la colonna Nota che solo le celle che si riferiscono a ID ripetuti non sono in ordine ascendente Nella Colonna di Confronto immettiamo quindi una serie crescente da 1 a 10 e Confrontiamo con la funzione IF nella colonna adiacente Corrispondenza
22
E 9 Applichiamo a tutta la colonna Nota che solo le celle che si riferiscono a ID ripetuti non sono in ordine ascendente Nella Colonna di Confronto immettiamo quindi una serie crescente da 1 a 10 e Confrontiamo con la funzione IF nella colonna adiacente F IF(OR(E2>F2;E2<F2);1;0) verifica se il valore in E è maggiore o (OR) minore del valore in F (i.e., ≠); restituisce 1 se vero; altrimenti 0 Corrispondenza
23
E 9 Applichiamo a tutta la colonna Nota che solo le celle che si riferiscono a ID ripetuti non sono in ordine ascendente Nella Colonna di Confronto immettiamo quindi una serie crescente da 1 a 10 e Confrontiamo con la funzione IF nella colonna adiacente F Corrispondenza
24
E 9 Applichiamo a tutta la colonna Nota che solo le celle che si riferiscono a ID ripetuti non sono in ordine ascendente Nella Colonna di Confronto immettiamo quindi una serie crescente da 1 a 10 e Confrontiamo con la funzione IF nella colonna adiacente F Corrispondenza
25
Esercizio concludi la dimostrazione verifica che aumentando la dimensione della popolazione il numero di ID ripetuti nel campione si riduce come? fai 10 estrazioni random per popolazioni di dimensione: 20, 30, 50, 200. per ogni estrazione riporta la proporzione di soggetti ripetuti nel campione. quando la proporzione tende ad essere minore?
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.