Correlazione Il coefficiente di correlazione r è un indice campionario del grado e del tipo di associazione lineare. Il segno di tale coefficiente indica.

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

- le Medie la Moda la Mediana
Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Come organizzare i dati per un'analisi statistica al computer?
1 MeDeC - Centro Demoscopico Metropolitano Provincia di Bologna - per Valutazione su alcuni servizi erogati nel.
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
Intervalli di confidenza
Passo 1: trasformare tutte le percentuali in frequenze (senza sapere la numerosità sulla quale sono state calcolate, non si può fare il confronto tra %)
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
Lez. 3 - Gli Indici di VARIABILITA’
Uso dell’errore standard di misurazione
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
XXIV Congresso ACOI 2005 Montecatini Terme Maggio 2005
Valutazione delle Prestazioni di un Classificatore
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
DISTRIBUZIONE CAMPIONARIA CONGIUNTA DI DUE VARIABILI (1)
DALL'INTERVALLO DI PROBABILITÀ
Esercitazione su test d’ipotesi
Varianza campionaria Errore standard della varianza campionaria
La distribuzione normale e normale standardizzata
Campionamento casuale semplice
Obiettivi del corso di Statistica Medica.
DIFFERENZA TRA LE MEDIE
ALBERI DECISIONALI terza parte
La regressione logistica binomiale
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
ELEZIONI REGIONALI 2010 PRIMI RISULTATI E SCENARI 14 aprile 2010.
Matematica e statistica Versione didascalica: parte 8 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste
Canale A. Prof.Ciapetti AA2003/04
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
I lavoratori italiani e la formazione UNA RICERCA QUANTITATIVA SVOLTA DA ASTRA, IN COLLABORAZIONE CON DOXA, PER ANES (febbraio 2005)
La partita è molto combattuta perché le due squadre tentano di vincere fino all'ultimo minuto. Era l'ultima giornata del campionato e il risultato era.
VARIABILI E DISTRIBUZIONI DI FREQUENZA
Cos’è un problema?.
CALCIO SKY 2007 – 2008 PROFILO DI ASCOLTO. 2 INDICE DEGLI ARGOMENTI Profilo di ascolto CALCIO SERIE A 2007 – 2008 Totale campionato (tutte le partite)……………………………………………….
Gli italiani e il marketing di relazione: promozioni, direct marketing, digital marketing UNA RICERCA QUANTITATIVA SVOLTA DA ASTRA RICERCHE PER ASSOCOMUNICAZIONE.
STILI DI APPRENDIMENTO ED EVOLUZIONE INTERFACCE
Prof Luciano Marchino Dott.ssa Patrizia Marforio
Luciano giromini – la misura in psicologia, 2009 database e distribuzioni - misure di sintesi - misure di variabilità descrizione dei dati:
Da studi svolti negli anni ‘50 è emerso che il numero ideale di figli per famiglia è di 3. Nel 1980, ipotizzando una modifica nei costumi e nei modelli.
Verifica delle ipotesi su due campioni di osservazioni
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE.
Esercitazioni sul calcolo dei valori critici
Scomposizione polinomi
Le distribuzioni campionarie
Un trucchetto di Moltiplicazione per il calcolo mentale
Esercitazione 1) La seguente distribuzione riporta i punteggi di ansia misurata su studenti di psicometria:
Introduzione alla Regressione Lineare e alla Correlazione.
GLI OBIETTIVI DELLA RICERCA
Esempi risolti mediante immagini (e con excel)
Regressione e correlazione
Il test del Chi-quadrato
Esercizio 1: La seguente distribuzione riporta i punteggi di un test sullo spettro autistico misurato su un gruppo di bambini: a)Costruire una tabella.
Analisi Bivariata: Test Statistici
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
Gli indici di dispersione
Indagine Congiunturale 2011 Confcooperative Emilia Romagna CONFERENZA STAMPA CONFCOOPERATIVE EMILIA ROMAGNA Bologna, 30 Luglio 2013.
Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. SIGNIFICATIVITÀ.
Domande riepilogative per l’esame
UNIVERSITA’ DEGLI STUDI DI PERUGIA
STATISTICHE DESCRITTIVE
Correlazione e regressione lineare
TEST STATISTICI PER SCALE NOMINALI, TASSI E PROPORZIONI Non sempre la variabile aleatoria (risultato sperimentale) è un numero ma è spesso un esito dicotomico.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Correlazione Il coefficiente di correlazione r è un indice campionario del grado e del tipo di associazione lineare. Il segno di tale coefficiente indica il tipo (positivo se la variazione è concorde, negativo quando, all’aumentare di una variabile l’altra decresce), il valore assoluto ne specifica invece il grado. Il valore della correlazione varia tra -1 e +1. Il coefficiente r non è in grado di rilevare un’eventuale correlazione di tipo non lineare.

Esempi di r Perfetta correlazione positiva x y 1.000 Perfetta correlazione positiva r = x y 0.562 0.625 0.500 Debole correlazione positiva

Esempi di r Associazione lineare non significativa x y -0.079 0.026 0.078 Associazione lineare non significativa r = x y -0.544 -0.931 -1.000 Vari gradi di correlazione negativa

ESERCIZIO 52   La concentrazione plasmatica di sodio (mmol/L) e la pressione arteriosa sistolica (mmHg) sono state misurate contemporaneamente in un campione di 12 pazienti. I dati sono riportati nella seguente tabella.   Rappresentare i dati mediante un diagramma di dispersione e calcolare il coefficiente di correlazione.

  La correlazione lineare suggerita dal diagramma a dispersione è molto forte. All’aumentare della concentrazione di sodio aumenta in modo lineare la pressione sanguigna.

ESERCIZIO 53   Si consideri la distribuzione chi-quadrato con due gradi di libertà. a) Quale proporzione dell'area sotto la curva giace a destra di 9.21? b) Quale valore di delimita il 10% superiore della distribuzione?   a)   b)

Test chi quadrato Quando le variabili sono qualitative e i dati da confrontare indipendenti si utilizza il Test c2 Per l'applicazione di questo test è opportuno costruire una tavola di contingenza che contenga il numero di casi osservati (O) in ogni combinazione delle modalità delle due variabili analizzate, e di casi attesi (A), cioè il numero di casi che ci si potrebbe aspettare se non fosse presente la differenza studiata.

Esempio Si studia l’effetto di un farmaco antiinfiammatorio nella cura dell’artrite reumatoide. A 62 pazienti viene somministrato il farmaco e a 11 un placebo. La frequenza di rigidità articolare rilevata nei due gruppi è riportata nella tabella sottostante: farmaco placebo Totale Rigidità 14 5 19 Non rigidità 48 6 54 62 11 73

Risultato (Excel) Calcolo attesi: la probabilità di rigidità articolare in tutto il campione indipendentemente dal trattamento è 19 su 73. Se non ci fosse effetto del trattamento mi aspetterei la stessa proporzione di casi di rigidità nei due gruppi, cioè: (19/73)*62=16,14 e (19/73)*11=2.86 Il p-value non è significativo e non supporta quindi l’efficacia di tale farmaco.

Ipertese 8 15 23 Non ipertese 32 45 77 Tot 40 60 100 Orali Altro ESERCIZIO 54   Un gruppo di cardiologi conduce uno studio per accertare l'associazione che esiste tra metodo contraccettivo e ipertensione. Di 40 donne che usano contraccettivi orali e 60 donne che usano altri metodi, rispettivamente 8 e 15 sono ipertese. Testare l'ipotesi che tra il tipo di contraccettivo e ipertensione esista associazione ad un livello di significatività dell'1%. Ipertese 8 15 23 Non ipertese 32 45 77 Tot 40 60 100   Orali Altro frequenze osservate Ipertese 9.2 13.8 23 Non ipertese 30.8 46.2 77 Tot 40 60 100   Orali Altro frequenze attese

maschi femmine Tot 20-44 36 (39.7) 52 (48.3) 88 45-64 109 (102.1) ESERCIZIO 55   Saggiate ad un livello di significatività del 5% se il sesso e l'età sono significativamente associati.   20-44 anni 45-64 anni 65 anni maschi femmine 36 52 109 117 126 160 Tabella osservati e attesi   maschi femmine Tot 20-44 36 (39.7) 52 (48.3) 88 45-64 109 (102.1) 117 (123.9) 226 65 126 (129.2) 160 (156.8) 286 271 329 600

ESERCIZIO 56   Un farmaco per il trattamento del raffreddore è stato somministrato a metà di un gruppo di malati selezionati casualmente. All'altra metà dei pazienti con raffreddore è stato somministrato un placebo. I risultati ottenuti sono riportati nella seguente tabella: Farmaco 16 30 104   Nocivo Nessun effetto Utile Placebo 20 42 88   Verificare se l'opinione del paziente è indipendente dal trattamento ricevuto ammettendo un errore del I° tipo del 5%. Farmaco 16 (18) 30 (36) 104 (96) 150 Placebo 20(18) 42 (36) 88 (96) Tot 36 72 192 300   Nocivo Nessun effetto Utile

=0.05 Poichè (3.778<5.99) non ci sono motivi per affermare che vi sia una relazione tra opinione dei pazienti e tipo di trattamento. Il test non è significativo ad un livello del 5%.

ESERCIZIO 57   La distribuzione percentuale, in accordo allo stato civile, della popolazione USA al di sopra dei 18 anni nel 1968 è la seguente: celibe/nubile=21.6, coniugato/a=62.9, vedovo/a=7.7, divorziato/a=7.8. Un campione casuale di 400 persone, di età superiore ai 18 anni (selezionato nel 1990) ha mostrato che 102 di queste sono celibi/nubili, 220 coniugate, 35 vedove e 43 divorziate. Saggiate, ad un livello di significatività del 5%, se in questo periodo è cambiata la distribuzione percentuale dello stato civile della popolazione USA di età superiore ai 18 anni.   Single Cng Ved. Div. Tot Osservati %Attese Attesi 102 21.6 86.4 220 62.9 251.6 35 7.7 30.8 43 7.8 31.2 400 =0.05

Poichè (11.822>7.815) si può affermare che dal 1968 vi è stato un mutamento nella struttura dello stato civile in USA. ESERCIZIO 58   Una ditta ha 500 dipendenti. Di questi 300 sono uomini e 280 sono coniugati/e. Dei 300 uomini, 190 sono coniugati. Se un soggetto di questa ditta è selezionato a caso, qual è la probabilità che sia: a) una donna b) un uomo sapendo che è coniugato c) Si può ritenere che tra i dipendenti vi sia associazione tra sesso e stato civile (=0.05). Uomini 110 190 300 Donne 90 200 Tot 220 280 500 OSSERVATI Single Cng.

=0.05 a) b) c) Uomini 132 168 300 Donne 88 112 200 Tot 220 280 500 ATTESI Single Cng. Poichè (16.37>3.84) ci sono motivi per affermare che vi sia una relazione tra sesso e stato civile tra i dipendenti della fabbrica considerata.  

ESERCIZIO 59   500 maschi sono classificati secondo l'età in anni compiuti e il numero dei fratelli. I risultati ottenuti sono riportati nella seguente tabella: 68 32 36 89 1 9 57 24 60   1-5 6-10 11-13 14-18 2 59 25 20 21 a) con quale misura di dispersione è possibile confrontare la variabilità delle due variabili prese in considerazione, cioè l’età ed il numero di fratelli (non fare i calcoli)? b) calcolare per la variabile età una opportuna misura di posizione e una di dispersione. c) calcolare per la variabile N° di fratelli una opportuna misura di posizione e una di dispersione. d) quale è la probabilità che un soggetto estratto a caso abbia uno o più di un fratello? e) gli eventi "essere in età prescolare" ed "avere un solo fratello" sono mutualmente esclusivi? Dimostrarlo con il calcolo delle probabilità. f) verificare se esiste un’associazione tra età e numero di fratelli.

a) Il coefficiente di variazione a) con quale misura di dispersione è possibile confrontare la variabilità delle due variabili prese in considerazione, cioè l’età ed il numero di fratelli (non fare i calcoli)? a) Il coefficiente di variazione b) calcolare per la variabile età una opportuna misura di posizione e una di dispersione. b)   c) calcolare per la variabile N° di fratelli una opportuna misura di posizione e una di dispersione. c) Moda=0 Range=2-0=2   d) quale è la probabilità che un soggetto estratto a caso abbia uno o più di un fratello? d)  

e) P( età prescolare  avere un solo fratello) = 9/500  0   non sono eventi mutualmente esclusivi î í ì ne associazio : H za indipenden 1 a =0.05 X 2 36 39 7 109 102 126 129 52 48 3 117 123 9 160 156 8 3448 4663 0793 2834 3843 0653 6234 = - ( ) + . Poichè 05 , 6 c < (1.62<12.59) non ci sono motivi per affermare che vi sia una relazione tra età numero di fratelli