Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.

Slides:



Advertisements
Presentazioni simili
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Come organizzare i dati per un'analisi statistica al computer?
Variabili casuali a più dimensioni
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Analisi Bivariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°4.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Esercizio 1 In una indagine statistica si vuole rilevare il numero di cellulari posseduti dagli studenti iscritti alla facoltà di economia. Si dica: -
VARIABILI DOPPIE: UN ESEMPIO
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
DISTRIBUZIONE CAMPIONARIA CONGIUNTA DI DUE VARIABILI (1)
L’analisi Bivariata Studia la relazione fra coppie di variabili.
Processi Aleatori : Introduzione – Parte I
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Sistemi di equazioni lineari
Corso di biomatematica lezione 6: la funzione c2
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Modello di regressione lineare semplice
Cap. 10 Indipendenza, connessione e associazione Cioè l’analisi statistica congiunta di una coppia di fenomeni qualitativi.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Statistica economica (6 CFU) Corso di Laurea in Economia e Commercio a.a Docente: Lucia Buzzigoli Lezione 5 1.
Corso di POPOLAZIONE TERRITORIO E SOCIETA’ 1 AA
La ricerca delle relazioni tra fenomeni
Introduzione alla Regressione Lineare e alla Correlazione.
COVARIANZA e CORRELAZIONE.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
La regressione come strumento di sintesi delle relazioni tra variabili
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Analisi Bivariata: Test Statistici
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Strumenti statistici in Excell
Corso di Laurea in Scienze e Tecniche psicologiche
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°13.
Accenni di analisi monovariata e bivariata
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
analisi bidimensionale #2
TEST STATISTICI PER SCALE NOMINALI, TASSI E PROPORZIONI Non sempre la variabile aleatoria (risultato sperimentale) è un numero ma è spesso un esito dicotomico.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
DIPENDENZA STATISTICA TRA DUE CARATTERI Per una stessa collettività può essere interessante studiare più caratteri presenti contemporaneamente in ogni.
Accenni di analisi monovariata e bivariata. ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
La dipendenza e indipendenza statistica Prof. Daniela Bertozzi Itis Fauser - Novara Gli appunti sono stati tratti dal testo L. Sasso – Matematica a colori.
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Classi di addettiF >2504 La seguente tabella riporta la distribuzione di 100 aziende per classi di addetti. a.Si calcoli:
Teoria dei Sistemi di Trasporto Tematica 4: Elementi minimi di teoria della probabilità.
Statistica descrittiva bivariata
Statistica descrittiva bivariata
Statistica descrittiva bivariata
Statistica descrittiva bivariata
Transcript della presentazione:

Metodi Quantitativi per Economia, Finanza e Management Lezione n°5

Statistica descrittiva bivariata Indaga la relazione tra due variabili misurate. Si distingue rispetto alla tipologia delle variabili indagate: var. qualitative/quantitative discrete: tavole di contingenza (o a doppia entrata) var. quantitative: analisi di correlazione lineare una var. qualitativa e una quantitativa: confronto tra le medie

Tavole di contingenza Sono tabelle a doppia entrata; i valori riportati all’interno della tabella sono le frequenze congiunte assolute, e la loro somma è pari al totale dei casi osservati. Dalla tabella si possono ricavare inoltre le distribuzioni marginali, sommando per riga e per colonna le frequenze congiunte; le frequenze relative congiunte, pari al rapporto tra le frequenze assolute congiunte e il totale dei casi osservati.

Dalle tabelle di contingenza si possono ricavare ulteriori distribuzioni unidimensionali : –Frequenze subordinate ovvero la frequenza di osservare il carattere x dato il carattere y e viceversa. Formalmente: P y|x (x i,y j ) = P (x i,y j ) / P x(x i ) P x|y (x i,y j ) = P (x i,y j ) / P y(y j ) Indipendenza statistica se al variare di X le distribuzioni subordinate (Y|X)= x i sono tutte uguali tra loro,si può concludere che la distribuzione del carattere Y non dipende da X. Nel caso di indipendenza statistica, la frequenza relativa congiunta è pari al prodotto delle marginali corrispondenti P(x i,y j )=P x (x i )P y (y j ) L’indipendenza stat. è un concetto simmetrico: se vale per X, vale anche per Y. Se si verifica, vuol dire che l’analisi bivariata di X (Y) non dà informazioni aggiuntive rispetto all’analisi univariata. Tavole di contingenza

–Perfetta dipendenza unilaterale ad ogni valore di X corrisponde un solo valore di Y, ma non è detto che si verifichi il contrario. In generale, quando il numero di colonne (valori assunti dalla Y) è inferiore al numero di righe (valori assunti dalla X) non è mai possibile che X dipenda perfettamente da Y. –Perfetta dipendenza bilaterale ad ogni valore di X corrisponde un solo valore di Y e viceversa; la perfetta dipendenza bilaterale si può avere allora solo per matrici quadrate. Tavole di contingenza

Indici di connessione Nella realtà è difficile che si verifichi la condizione di indipendenza statistica. Pertanto è utile disporre di indici che misurino il grado di connessione tra le variabili. –χ² (chi-quadrato) assume valore nullo se i fenomeni X e Y sono indipendenti. Risente del numero delle osservazioni effettuate quindi al crescere di N, l’indice tende a crescere. χ²=N Σ Σ [P(x i,y j )-P x (x i ) y (y j )] ²/ P x (x i ) P y (y j )

–Un indice più efficace (perchè relativo, e dunque non risente del numero di osservazioni) è l’indice di Cramer V, basato sul χ². assume valori compresi tra 0 e 1: 0 nel caso di indipendenza statistica, 1 nel caso di perfetta dipendenza almeno unilaterale e tende a crescere all’aumentare del grado di dipendenza delle variabili considerate. Indici di connessione

Nella realtà è difficile che si verifichi la condizione di indipendenza statistica. Pertanto è utile disporre di indici che misurino il grado di connessione tra le variabili. –χ² (chi-quadrato) assume valore nullo se i fenomeni X e Y sono indipendenti. Risente del numero delle osservazioni effettuate quindi al crescere di N, l’indice tende a crescere. χ²=N Σ Σ [P(x i,y j )-P x (x i ) y (y j )] ²/ P x (x i ) P y (y j )

–Un indice più efficace (perchè relativo, e dunque non risente del numero di osservazioni) è l’indice di Cramer V, basato sul χ². assume valori compresi tra 0 e 1: 0 nel caso di indipendenza statistica, 1 nel caso di perfetta dipendenza almeno unilaterale e tende a crescere all’aumentare del grado di dipendenza delle variabili considerate. Indici di connessione

Correlazione lineare Le misure di connessione possono essere applicate a variabili qualitative. Se si vuole misurare il grado di concordanza tra due variabili quantitative occorre utilizzare altri indici: –Covarianza Cov(X,Y) è un indice che assume valori positivi se vi è concordanza tra X e Y (a modalità elevate dell’una, corrispondono modalità elevate dell’altra); assume valori negativi nel caso di discordanza (a modalità elevate dell’una non corrispondono modalità elevate dell’altra). Nel caso di indipendenza statistica, assumerà valore nullo. È un indice assoluto, ovvero segnala la presenza e la direzione di un legame tra due variabili, ma nulla si può dire sul grado del loro legame. Cov(X,Y)= Σ Σ (x i -μ x ) (y j - μ y ) p(x i,y j )

Covarianza tra due variabili: Cov(x,y) > 0 x e y tendono a muoversi nella stessa direzione Cov(x,y) < 0 x e y tendono a muoversi in direzioni opposte Cov(x,y) = 0 x e y no relazione lineare –Riguarda solo la forza della relazione, ma non implica un effetto causale Correlazione lineare

–Coefficiente di correlazione lineare ρ(X,Y) è un indice relativo che ovvia al problema del precedente indice. Assume valori compresi tra -1 e 1. In particolare vale 1 se e solo se Y è funzione lineare di X (e viceversa) e in questo caso i punti corrispondenti alle osservazioni sono disposti su una retta con inclinazione positiva. Analogamente l’indice assume valore -1 nel caso in cui i punti siano disposti su una retta con inclinazione negativa. Assume valore nullo se tra le variabili non è presente alcun tipo di relazione lineare (indipendenti in correlazione). Correlazione lineare

Coefficiente di correlazione lineare ρ(X,Y) : ρ = 0 => non c’è relazione lineare tra X e Y ρ > 0 => relazione lineare positiva tra X e Y »quando X assume valori alti (bassi) allora anche Y probabilmente assume valori alti (bassi) »ρ = +1 => dipendenza lineare perfetta positiva ρ relazione lineare negativa tra X e Y »quando X assume valori alti (bassi) allora Y probabilmente assume valori bassi (alti) »ρ = -1 => dipendenza lineare perfetta negativa Correlazione lineare

Senza unità di misura Campo di variazione fra –1 e 1 Quanto più è vicino a –1, tanto più è forte la relazione lineare negativa Quanto più è vicino a 1, tanto più è forte la relazione lineare positiva Quanto più è vicino a 0, tanto più è debole la relazione lineare Correlazione lineare

Y X Y X Y X Y X Y X r = -1 r = -.6r = 0 r = +.3 r = +1 Y X r = 0 Correlazione lineare