STATISTICA DESCRITTIVA BIVARIATA

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

- le Medie la Moda la Mediana
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
Rappresentazione tabellare dei dati
STATISTICA DESCRITTIVA
Il chi quadro indica la misura in cui le
COORDINATE POLARI Sia P ha coordinate cartesiane
Variabili casuali a più dimensioni
LA STATISTICA By prof. Pietro Rossi.
Algebra delle Matrici.
Descrizione dei dati Metodi di descrizione dei dati
Progetto Pilota 2 Lettura e interpretazione dei risultati
Elementi di STATISTICA DESCRITTIVA
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Analisi Bivariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°4.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Test Statistici Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Analisi Bivariata e Test Statistici
Esercizio 1 In una indagine statistica si vuole rilevare il numero di cellulari posseduti dagli studenti iscritti alla facoltà di economia. Si dica: -
Corso di Calcolo delle Probabilità e Statistica II Parte – STATISTICA
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Analisi della varianza (a una via)
L’analisi Bivariata Studia la relazione fra coppie di variabili.
Matematica e statistica Versione didascalica: parte 8 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste
Appunti di inferenza per farmacisti
Sistemi di equazioni lineari
STATISTICA a.a LA STATISTICA INFERENZIALE
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Modello di regressione lineare semplice
Analisi delle corrispondenze
Verifica delle ipotesi su due campioni di osservazioni
Cai Lin Lin Michela & Guidetti Emanuela presentano:
Un buon latinista è anche un bravo matematico? I.S. Artemisia Gentileschi - NAPOLI Convegno finale Progetto Lauree Scientifiche – Matematica Università
Le distribuzioni campionarie
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Corso di biomatematica lezione 7-3: Test di significatività
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Il test del Chi-quadrato
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
L’analisi del contenuto Doppia funzione dell’analisi del contenuto: -Può essere un tipo di ricerca specifico -Può essere una tecnica di ricerca Come TECNICA.
Accenni di analisi monovariata e bivariata
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Come analizzare una tabella di contingenza quando il valore del chi quadrato è significativo Analisi dei residui con un esempio reale: Studenti universitari.
Test basati su due campioni Test Chi - quadro
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Esercizio 1. Quesiti esercizio 1 Distribuzione congiunta: dalla definizione di distribuzione condizionale.
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Accenni di analisi monovariata e bivariata
ANALISI E INTERPRETAZIONE DATI
analisi bidimensionale #2
La covarianza.
DIPENDENZA STATISTICA TRA DUE CARATTERI Per una stessa collettività può essere interessante studiare più caratteri presenti contemporaneamente in ogni.
Accenni di analisi monovariata e bivariata. ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
La dipendenza e indipendenza statistica Prof. Daniela Bertozzi Itis Fauser - Novara Gli appunti sono stati tratti dal testo L. Sasso – Matematica a colori.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Analisi delle osservazioni
Classi di addettiF >2504 La seguente tabella riporta la distribuzione di 100 aziende per classi di addetti. a.Si calcoli:
Statistica di Base per le Scienze Pediatriche luigi greco D.C.H, M.D., M.Sc.M.C.H., Ph.D. Dipartimento di Pediatria UniFEDERICOII.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

STATISTICA DESCRITTIVA BIVARIATA Studio simultaneo di due caratteri distinti della popolazione

Tabella di distribuzione doppia disaggregata Consideriamo un gruppo di 9 studenti dei quali vengono raccolte informazioni su sesso e regione di provenienza. Nome Sesso Regione P. Neri M Sardegna G. Lanzarotti F Marche Bianchi Lombardia V. Rossi E. Mariononi M. Driu E. Erba V. Arrigoni M. Mauri Popolazione statistica? Variabili statistiche? Sesso Regione Tabella di distribuzione doppia disaggregata

Una distribuzione doppia può essere: * Quantitativa se entrambe le variabili sono quantitative * Qualitativa se entrambe le variabili sono qualitative * Mista negli altri casi

TABELLA DELLA DISTRIBUZIONE CONGIUNTA Regione Sardegna Marche Lombardia Sesso M 2 3 F Ogni casella contiene la FREQUENZA CONGIUNTA delle 2 variabili Vantaggio: facilità di lettura dati

DISTRIBUZIONI MARGINALI Regione Sardegna Marche Lombardia Totale Sesso M 2 3 5 F 4 9 Sommando le frequenze per riga si ottengono le FREQUENZE MARGINALI per la VS sesso Sommando le frequenze per colonna si ottengono le FREQUENZE MARGINALI per la VS regione Regione Frequenza Sardegna 4 Marche 2 Lombardia 3 Sesso Frequenza M 5 F 4

Si dice distribuzione marginale ogni distribuzione di frequenza che si ottiene considerando le frequenze associate a una sola variabile, indipendentemente dall’altra.

Ci si può domandare come si distribuisce la variabile sesso per gli studenti che provengono da una certa regione. Ad esempio considerando la regione Lombardia In questo caso si studia la variabile sesso CONDIZIONATA dalla variabile regione Regione = Lombardia Sesso Frequenze Relative Percentuali M 3 1 100% F 0% Totale VS Sesso | Regione = Lombardia

Data una distribuzione doppia (X,Y) si ottiene la distribuzione condizionata di Y rispetto a xi osservando come si distribuisce Y solo per i soggetti della popolazione che hanno per la variabile X il valore fissato xi In simboli Y|(X = xi ) N.B: Nelle frequenze condizionate si formano tante tabelle quante le modalità della variabile X

Lo scopo dell’analisi di una distribuzione doppia è stabilire un legame tra le due variabili X e Y E’ stata effettuata un’indagine sulla soddisfazione di 1316 utenti di una compagnia ferroviaria rispetto al tipo di treno su cui hanno viaggiato Soddisfazione Tipo di treno AV IC R Totale Si 203 118 178 499 No 122 167 528 817 325 285 706 1316

La soddisfazione dipende dal treno! Calcoliamo le frequenze condizionate della soddisfazione X al tipo di treno Y Soddisfazione AV Si 0,62 No 0,38 Soddisfazione AV IC R Totale Si 0,62 0,41 0,25 0,38 No 0,59 0,75 1 La soddisfazione dipende dal treno! La variabile X dipende da Y

Se la tabella delle frequenza condizionate fosse stata Soddisfazione AV IC R Totale Si 0,38 No 0,62 1 La soddisfazione sarebbe stata indipendente dal tipo di treno Soddisfazione AV IC R Totale Si 499 No 298 528 817 1316 La variabile soddisfazione dipende perfettamente dal tipo di treno

Test del 2 Come misurare il grado di dipendenza tra 2 variabili? Pearson 1900 Come si calcola questo indice?

Frequenza teorica in caso di indipendenza Soddisfatti dei treni AV 1) Si calcola la frequenza relativa dei soddisfatti 499/1316 2) Si moltiplica la frequenza relativa per il numero di utenti del treno AV (499/1316 )*325 FREQUENZA TEORICA IN CASO DI INDIPENDENZA

Frequenza teorica in caso di indipendenza insoddisfatti dei treni AV 1) Si calcola la frequenza relativa degli insoddisfatti 817/1316 2) Si moltiplica la frequenza relativa per il numero di utenti del treno AV (817/1316 )*325 FREQUENZA TEORICA IN CASO DI INDIPENDENZA ECC. ECC.

Calcolo della contingenza Frequenza misurata Frequenza teorica Contingenze Quadrato delle contingenze Si 203 123,23 79,77 6362,73 No 122 201,77 -79,77 Treno AV Contingenza = frequenza misurata – frequenza teorica in caso di indipendenza Si ripete il calcolo delle contingenze per tutte le tipologie di treno

Si dividono i quadrati delle contingenze per le frequenze teoriche AV IC R 51,63 0,80 30,06 31,54 0,49 18,36 La somma degli elementi della tabella è l’indice c2 Qual è il suo significato?

Se i 2 caratteri sono indipendenti, la somma delle contingenze è nulla è uguale a zero Se i 2 caratteri sono dipendenti, il valore di chi-quadro aumenta all’aumentare della dipendenza

c2 NORMALIZZATO C 0 < C < 1 c2 N (h-1) = N (h-1) N = numero di unità statistiche considerate h = minore tra il numero delle righe e delle colonne 0 < C < 1