Associazione tra variabili qualitative

Slides:



Advertisements
Presentazioni simili
Associazione tra variabili qualitative
Advertisements

1 Principali analisi statistiche 1. Confronto fra medie (2 o piú campioni) 2. Correlazione e regressione 3. Analisi di tabelle di contigenza Variabile.
Analisi della varianza
1 Simulazione Numerica dei Fenomeni di Trasporto Necessità di introduzione dei tensori  11  12  13  23  21  22 Vogliamo descrivere in un modo che.
Germana Scepi Corso di Statistica Anno accademico 2016-’17 Lezione:Argomento: Gli indici di variabilità4.
Corso di Analisi Statistica per le imprese
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
LA STATISTICA DESCRITTIVA
Effetto scuola o Valore aggiunto
Lezione 2 CARATTERI DEI DATI: approfondimento (Borra-Di Ciaccio, cap
Introduzione a Statistica e Probabilità
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
RICHIAMI DI INFERENZA:
Restituzione dati SNV a.s. 2015/2016
Esercitazioni su testi d’esame
PEDAGOGIA SPERIMENTALE
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Confronto fra 2 popolazioni
APPUNTI DI STATISTICA INFERENZIALE
Confronto tra diversi soggetti:
Accenni di analisi monovariata e bivariata
Introduzione a Statistica e Probabilità
Riepilogo La STANDARDIZZAZIONE, attraverso il calcolo dei punti z, ha un duplice obiettivo: Rende immediato il confronto tra punteggi ottenuti su scale.
misure di eterogeneità
La Statistica Istituto Comprensivo “ M. G. Cutuli”
Statistica descrittiva bivariata
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Corso di Analisi Statistica per le Imprese 2
Esercitazione di Statistica
Esercitazioni psicometria
Esercizio 1 La seguente distribuzione riporta i punteggi di autostima misurata su pazienti con disturbo depressivo maggiore: a) Costruire una tabella di.
Confronto tra diversi soggetti:
Università degli Studi di Modena e Reggio Emilia
Esercizio 1: 1) La seguente distribuzione riporta i punteggi di ansia misurata su studenti di psicometria:
Intervalli di confidenza
Esercizio 1 La seguente distribuzione riporta i punteggi di ansia misurata prima dell’esame di psicometria: a) Costruire una tabella di frequenza, indicando:
Compito 1: 1) La seguente distribuzione riporta i punteggi di depressione su individui con disturbo post-traumatico da stress:
Interpretare la grandezza di σ
Riepilogo La STANDARDIZZAZIONE, attraverso il calcolo dei punti z, ha un duplice obiettivo: Rende immediato il confronto tra punteggi ottenuti su scale.
Esercitazione 1: Rispetto alla scala di pregiudizio sociale (Media=12; σ=3), calcolare: Quale percentuale della popolazione di adulti italiani otterrà.
Statistica inferenziale
Test per campioni appaiati
Esercizio La popolazione di adulti presenta una media di ansia pari a 4. Ad un campione di 35 soggetti con disturbo ossessivo compulsivo è stato somministrato.
Esercizi La popolazione di adulti ha una media di depressione pari a 3 ed una varianza (σ2) uguale a 0,49. Un campione di 76 soggetti con disturbo bipolare.
Confronto tra medie di due popolazioni
Esercizio 2 Un gruppo di persone con DCA ha partecipato per tre mesi ad una psicoterapia di gruppo per aumentare la propria autostima. Verificare che la.
Compito 1: La seguente distribuzione riporta i punteggi di ansia su un campione non clinico: Costruire una tabella di frequenza, indicando: f, fc, %, %c.
Compito 1: La seguente distribuzione riporta il numero di errori di un gruppo di bambini con ritardo mentale in un test di lettura: Costruire una tabella.
Ansia Definizione: stato di apprensione o tensione derivante dal presagio di un pericolo imminente, in genere di origine sconosciuta. Spielberger, nello.
Corso di Analisi Statistica per le imprese
RICHIAMI DI INFERENZA:
Esercizio 1: La seguente distribuzione riporta i punteggi di un test sullo spettro autistico misurato su un gruppo di bambini: Costruire una tabella di.
Esercizio 1 Si vuole studiare la mobilità di voto degli elettori di una certa circoscrizione. Da un sondaggio telefonico risulta che: Si calcolino le distribuzioni.
Esercizio 1 Il voto medio della popolazione degli studenti della Lumsa al primo esonero di psicometria è pari a 26 (σ=3). Gli studenti hanno sempre svolto.
RICHIAMI DI INFERENZA:
Esercizi: 1)Verificare che i residenti al centro Italia (Ẍ=5,3; N=41) abbiano un punteggio maggiore rispetto ai residenti al nord Italia (Ẍ=5; N=38) di.
Associazione tra due variabili
Soddisfazione lavorativa
Corso di Analisi Statistica per le Imprese
Test per campioni indipendenti
Esercizi Verificare che gli agenti di polizia (N=56; Ẍ=4) abbiano un punteggio di ansia diverso rispetto alla popolazione italiana (µ=4,3; σ2=2,4). Risolvere.
I. I.S. Gobetti-de Libero Esiti Prove 2018.
Esercizi di riepilogo:
Corso di Analisi Statistica per le Imprese
Esercizi Verificare che gli addetti al lavoro front office (N=171; Ẍ=6,2) abbiano un punteggio maggiore di stress rispetto alla popolazione italiana (µ=
Interazioni tra v.i.: analisi di moderazione
Statistica e probabilità Università degli Studi di Sassari Facoltà di Medicina veterinaria Corso di Laurea in Medicina veterinaria Anno Accademico 2017/2018.
Esercitazione 1: Rispetto al test di ansia (Media=25; σ=5), calcolare:
Statistica descrittiva bivariata
Esercizi Verificare che gli psicologi (N=37; Ẍ=5,4) abbiano un punteggio diverso di empatia rispetto alla popolazione italiana (µ=5; σ2=0,64). Risolvere.
Transcript della presentazione:

Associazione tra variabili qualitative È possibile verificare l’associazione anche tra variabili qualitative (nominali o ordinali) attraverso un apposito test. Esempio: Verificare l’associazione tra genere e scelta della facoltà universitaria. Ossia ci si sta chiedendo: la scelta della facoltà universitaria dipende dal genere o è indipendente al genere? Dunque bisogna testare se vi sia dipendenza tra le due variabili.

Costruire la tabella di frequenza doppia Soggetti Genere Facoltà 1 Maschio Psicologia 2 Femmina 3 4 5 Ingegneria 6 7 8 9 10 11

Tabella di frequenza doppia Psicologia Ingegneria Totale riga Maschi 1 6 7 Femmine 4 Tot colonna 5 11 Informazioni della Tabella di frequenza doppia: Esprime la relazione tra le modalità (o livelli) di 2 variabili qualitative. I numeri all’interno di ciascuna cella indicano le frequenze osservate (fo) sul campione, ossia derivanti dalla rilevazione.

Frequenze attese Per verificare l’eventuale dipendenza è necessario calcolare la frequenza attesa (fe; expected frequencies) per ciascuna cella (frequenza osservata). Ossia in questo caso: sapendo che i maschi sono 7 e che gli iscritti a psicologia sono 5, quanti maschi “mi aspetto” che si iscrivano a psicologia?

Tabella doppia con fo ed fe Psicologia Ingegneria Totale riga Maschi 1 (fe=3,18) 6 (fe=3,82) 7 Femmine 4 (fe=1,82) (fe=2,18) Tot colonna 5 11 La somma delle frequenze attese per riga deve essere uguale al totale di riga. La somma delle frequenze attese per colonna deve essere uguale al totale di colonna. La somma di tutte le frequenze attese deve essere uguale a N.

Indice di dipendenza χ2 Dopo aver calcolato le fe si calcola il χ2: Se tutte le fo e le fe sono uguali tra loro il valore del χ2 sarà uguale a 0, dunque le due variabili non sono dipendenti. Di conseguenza, maggiore è la differenza tra fo ed fe, maggiore sarà il valore del χ2.

Calcolo del χ2 Psicologia Ingegneria Totale riga Maschi 1 (fe=3,18) 6 7 Femmine 4 (fe=1,82) (fe=2,18) Tot colonna 5 11

Caratteristiche del χ2 Il χ2 esprime l’associazione tra due variabili qualitative ed è un coefficiente è sempre positivo. Può assumere valori che variano tra 0 (massima indipendenza) ed N (massima dipendenza). Se si vogliono generalizzare i risultati ottenuti sul campione all’intera popolazione, ossia verificare che l’associazione non è dovuta al “caso” (o a errori di campionamento) è necessario condurre un test di ipotesi sul χ2. Le ipotesi sono sempre: H0: le due variabili sono indipendenti H0: χ2 = 0 H1: le due variabili sono dipendenti H1: χ2 > 0 (sempre monodirezionale)

Test di ipotesi sul χ2 e distribuzione Il χ2calc deve essere confrontato con il χ2cri. Si rifiuta H0 se χ2calc > χ2cri La distribuzione a cui fa riferimento tale test è proprio quella del χ2. La distribuzione del χ2 è asimmetrica e positiva e può assumere valori compresi tra 0 (indipendenza) e N (massima dipendenza); esistono pertanto diverse distribuzioni del χ2, ciascuna caratterizzata dai rispettivi gradi di libertà.

Forma distribuzione χ2

Gradi di libertà (DF) I gradi di libertà del χ2 indicano il numero di frequenze attese (e non scarti dalla media) liberi di variare, ossia indipendenti da altri valori. Quante frequenze attese sono libere di variare in una tabella di frequenza doppia 2X2, conoscendo i totali di riga e di colonna? Per calcolare le altre Fe è sufficiente conoscere 1 valore. Psicologia Ingegneria Totale riga Maschi 7 Femmine 4 Tot colonna 5 6 11 3,18

E se la tabella è 3 x 3? Lavorare Studiare Non so Totale riga Licei 3 Istituti tecnici 5 Istituti professionali 6 Tot colonna 2 14 1,29 1,29 2,14 2,14 In generale i gradi di libertà (DF) sono uguali a: DF = (r-1) (c-1) Dove: “r “ è il numero di righe (numero delle modalità della variabile sulle righe); “c” è il numero di colonne (numero delle modalità della variabile sulle colonne).

Soluzione esempio H0: χ2=0 H1: χ2>0 χ2cri=? χ2cri(1)=3,84 χ2calc = 7,52 Conclusioni: Siccome χ2calc > χ2cri rifiuto H0: vi è dipendenza tra genere e la scelta universitaria. Se si rifiuta H0 è necessario scrivere il commento specifico, controllando, all’interno di ciascuna cella, la distanza tra Fo e Fe: dove le Fo risultano maggiori di Fe significa che vi sono più soggetti di quelli attesi, ossia quelle modalità risultano associate.

Commento specifico Siccome χ2calc > χ2cri rifiuto H0: vi è dipendenza tra genere e la scelta universitaria. In particolare: i maschi scelgono ingegneria, mentre le femmine scelgono psicologia. Psicologia Ingegneria Totale riga Maschi 1 (fe=3,18) 6 * (fe=3,82) 7 Femmine 4 * (fe=1,82) (fe=2,18) 4 Tot colonna 5 6 11

Esercizio 1 Verificare, attraverso il test di ipotesi adeguato, l’associazione tra tipologia di reato e disturbi di personalità. Risolvere l’esercizio indicando: Ipotesi; Disegno (indicando area di accettazione e rifiuto di H0); Valore critico e calcolato; Conclusioni. Rapina Spaccio Omicidio Tot riga Dipendente 1 7 9 Antisociale 2 4 5 11 Tot colonna 3 6 20

Disegno e frequenze attese 1 χ2 cal =3,65 χ2 cri =5,99 Rapina Spaccio Omicidio Dipendente 1 Fe=1,35 7 Fe=4,95 Fe=2,7 9 Antisociale 2 Fe=1,65 4 fe=6,05 5 fe=3,3 11 3 6 20

Soluzione esercizio 1 H0: χ2=0 H1: χ2>0 χ2cri=? Χ2cri(2)=5,99 χ2calc = 3,65 Conclusioni: Siccome χ2calc < χ2cri accetto H0. Non vi è dipendenza tra tipologia di reati e disturbi di personalità.

Esercizio 2 Verificare, attraverso il test di ipotesi adeguato, l’associazione tra genere e livello di ansia. Risolvere l’esercizio indicando: Ipotesi; Disegno (indicando area di accettazione e rifiuto di H0); Valore critico e calcolato; Conclusioni. Basso Medio Alto Tot riga Maschi 1 3 5 9 Femmine 6 Tot colonna 7 8 18

Disegno e frequenze attese 2 χ2 cri =5,99 χ2 cal =7,07 Basso Medio Alto Tot riga Maschi 1 Fe=3,5 3 Fe=1,5 5 Fe=4 9 Femmine 6 Tot colonna 7 8 18

Soluzione esercizio 2 H0: χ2=0 H1: χ2>0 χ2cri=? Χ2cri(2)=5,99 χ2calc =7,07 Conclusioni: Siccome χ2calc > χ2cri rifiuto H0. Vi è dipendenza tra il genere e disturbo di ansia. In particolare….