Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.

Slides:



Advertisements
Presentazioni simili
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Advertisements

Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
TRATTAMENTO STATISTICO DEI DATI ANALITICI
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
Elementi di statistica descrittiva Prof.ssa Nadia Andreuzzi
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
Introduzione all’uso degli indicatori di valutazione ed ai metodi di valutazione Dott.ssa Gabriella Giuliano Direttore Sanitario CREAS-IFC-CNR giugno.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Indici di Posizione Giulio Vidotto Raffaele Cioffi.
Consentono di descrivere la variabilità all’interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche.
Organizzazione dei dati AnnoQ [m 3 /s]
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
ANALISI DATI ANTROPOMENTRICI
Precorso di Statistica per le Lauree Magistrali
Statistica I Grafici Seconda Parte.
LA STATISTICA DESCRITTIVA
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Introduzione a Statistica e Probabilità
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
Esercizio 1 Prezzo in euro libri
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
GLI STRUMENTI AUSILIARI
Esercitazioni su testi d’esame
PEDAGOGIA SPERIMENTALE
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
L’analisi monovariata
PROPORZIONALITÀ.
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Quantitative Market Research Set-up Protocol
Analisi delle Traiettorie: Modelli di Crescita Latente (LGM)
Indici di variabilità Gli indici di variabilità misurano
Intervalli di Fiducia Introduzione Intervalli di fiducia per la media – Caso varianza nota Intervalli di fiducia per la media – Caso varianza non nota.
Introduzione a Statistica e Probabilità
Precorso di Statistica per le Lauree Magistrali
La Statistica Istituto Comprensivo “ M. G. Cutuli”
L’analisi monovariata
I 7 strumenti della qualità
ANALISI DELLE DISTRIBUZIONI STATISTICHE
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Corso di Analisi Statistica per le Imprese 2
Organizzazione dei dati
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Momenti e valori attesi
Elaborazione statistica di dati
Statistica descrittiva
L’indagine statistica
Statistica Scienza che studia i fenomeni collettivi.
Informatica applicata alla EBP e alla ricerca in fisioterapia
Quantitative Market Research Set-up Protocol
Esercizio 1: 1) La seguente distribuzione riporta i punteggi di ansia misurata su studenti di psicometria:
Statistica descrittiva bivariata
Statistica descrittiva bivariata
“Una delle più grandi scoperte che un uomo può fare, una delle sue più grandi sorprese, è scoprire che può fare ciò che aveva paura di non poter fare”.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
Precorso di Statistica per le Lauree Magistrali
Compito 1: La seguente distribuzione riporta i punteggi di ansia su un campione non clinico: Costruire una tabella di frequenza, indicando: f, fc, %, %c.
Compito 1: La seguente distribuzione riporta il numero di errori di un gruppo di bambini con ritardo mentale in un test di lettura: Costruire una tabella.
Introduzione Oggetto della statistica: studio dei fenomeni collettivi
Esercizio 1: La seguente distribuzione riporta i punteggi di un test sullo spettro autistico misurato su un gruppo di bambini: Costruire una tabella di.
Esercizio 1 Si vuole studiare la mobilità di voto degli elettori di una certa circoscrizione. Da un sondaggio telefonico risulta che: Si calcolino le distribuzioni.
Associazione tra due variabili
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Corso di Analisi Statistica per le Imprese Sintesi della distribuzione di un carattere: indici di posizione Prof. L. Neri a.a
Esercizio 1 Prezzo in euro libri
Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.
Transcript della presentazione:

Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione tra variabili Retta di regressione

Statistica Descrittiva Induttiva Ho un insieme di dati e li voglio descrivere, sintetizzare e commentare Ho un insieme di dati e li utilizzo per fare inferenza

Abbiamo un insieme di dati che vogliamo sintetizzare e descrivere Esempio 1: # mensile di interventi di manutenzione per un macchinario Statistica descrittiva: Esempio 2: precipitazioni in pollici a Torino nel mese di aprile (20 giorni) Esempio 3: # di donne con un’occupazione professionale nel 1986 negli USA A: Ingegneria/Informatica: 347 B: Sanità: 1937 C: Istruzione: 2833 D: Area sociale/legale: 698 E: Arte/Sport: 901 F: Altro: 355 N osservazioni = dati che vogliamo analizzare

Statistica descrittiva: le variabili Variabili Numeriche Categoriche Discrete Continue Esempio 3 Esempio 1 Esempio 2

Grafici di distribuzioni di frequenze: Istogramma Caso discreto: Esempio 1 Si fissano sull’asse delle ascisse i valori delle classi e, in corrispondenza, si disegna una barra la cui altezza è pari alla frequenza (relativa o assoluta)

Grafici di distribuzioni di frequenze: Diagramma a barre /di Pareto: Esempio 3 Viene utilizzato nel caso di distribuzioni categoriche, ad ogni classe corrisponde una barra la cui altezza ne indica la frequenza mentre la base (uguale per ogni classe) non ha significato. Ogiva: grafico delle frequenze cumulative di v. numeriche (discrete o continue) Sulle ordinate si riportano le frequenze cumulative Sulle ascisse si riportano (caso discreto) i valori osservati (caso continuo) gli estremi degli intervalli di variabilità Si uniscono con una spezzata i punti ottenuti. Es1Es2

Principali indici statistici I grafici finora analizzati ci danno informazioni qualitative; possiamo quantificarle ricorrendo ai seguenti indici. Siano n osservazioni numeriche di posizione di forma di dispersione MODA MEDIANA MEDIA SCARTO QUADRATICO MEDIO VARIANZA RANGE ASIMMETRIA (SKEWNESS) CURTOSI ( KURTOSIS) INDICI

Indici di posizione: MODA E' definita come il valore che ha la frequenza più alta. E' quel valore al di sotto del quale cadono la metà dei valori campionari. MEDIANA E' quel valore che corrisponde alla somma di tutti i valori diviso il numero dei valori stessi. dove: X i = esito i-ma misura n = numero dei dati (taglia del campione) MEDIA Gli indici di posizione indicano attorno a quale valore il campione dei dati e’ posizionato mi interessa la dispersione dei dati intorno a tali valori N.B. NELLA DISTRIBUZIONE NORMALE MEDIA= MODA = MEDIANA

Indici di dispersione: MEDIA DEI QUADRATI DEGLI SCARTI x max -x min RANGE (Campo di variazione) SCARTO MEDIO ASSOLUTO VARIANZA DEVIAZIONE STANDARD p_esimo quantile/ 100p_esimo percentile: si considera np Se np non è intero, considero k l’intero successivo e il p_esimo quantile è x k Se np=k è intero, il p_esimo quantile è (x k + x k+1 )/2 Q 1 =primo quartile =25°percentile Q 2 =secondo quartile =50°percentile=mediana Q 3 =terzo quartile =75°percentile

Media uguale Deviazione Standard Diversa Media e varianza: Media=2 Varianza=1.33 Media=2 Varianza=4

Frequenze Frequenza assoluta: numero di oggetti del tipo i-esimo Si considerino N dati da analizzare. I dati vengono suddivisi in un opportuno numero di classi; per ogni classe si ha: Frequenza relativa: numero di oggetti del tipi i-esimo diviso Il numero totale

Frequenza cumulativa assoluta: è la somma della freq. assoluta + la freq. cumulativa assoluta del dato precedente. Frequenza cumulativa relativa: è la somma della freq. relativa + la freq. cumulativa relativa del dato precedente. Frequenza percentuale: è la freq. relativa moltiplicata per 100

Istogramma: quante classi scelgo? Taglia campione: n=100 6 classi10 classi 36 classi Regola pratica: n.classi   n Regola pratica: n.classi   n

Tabella di distribuzioni di frequenze: Caso discreto: Esempio 1 Le classi sono: N.B. : la somma delle freq.ass. = n° tot di osservazioni la somma delle freq.rel. =1 la somma delle freq.perc.=100

Correlazione tra variabili Finora abbiamo considerato una variabile alla volta, ora tratteremo analisi di tipo comparativo: a.Osservo una variabile su piu’ gruppi di individui b.Osservo piu’ variabili su un gruppo di individui c.Entrambe le situazioni a. e b. Esiste correlazione tra le variabili? Scatterplot, diagramma a dispersione

Indici di variazione bidimensionali Covarianza Date n osservazioni congiunte di 2 variabili Se c x,y >0 a valori grandi (piccoli) di x corrispondono valori grandi (piccoli) di y x e y sono direttamente correlate Se c x,y <0 a valori grandi (piccoli) di x corrispondono valori piccoli (grandi) di y x e y sono inversamente correlate Se c x,y =0 le variabili non sono correlate

Coefficiente di correlazione lineare

r = 0.6 y x y y x r = 1 y x r = -0.8 y x r = -1 x r = 0 x v y Diagramma di dispersione e indice di correlazione

Regressione lineare: retta di regressione Si vuole cercare la relazione lineare tra due variabili x e y. Date n osservazioni congiunte di 2 variabili cerco due coefficienti a e b tali che y=ax+b passi il più possibile vicino a questi punti. Cerco a e b tali che sia minima (Metodo dei minimi quadrati)

EXCEL: Retta di regressione Esercizio: Stabilire se c’e’ dipendenza lineare tra l’umidita’ del magazzino e l’evaporazione di un certo componente chimico. Step1: Scatterplot Step2: Coefficiente di correlazione Utilizzando la funzione =CORRELAZIONE(dati_1;dati_2) ottengo r = Ha senso determinare la retta di regressione

EXCEL: Retta di regressione Step3: Retta di regressione Avendo gia’ lo scatterplot seleziono: Grafico-Aggiungi linea di tendenza y = -0,0801x + 13,639

Retta di regressione N.B. Il coefficiente angolare della retta ha il segno di c x,y Utilizzando le informazioni ottenute tramite lo scatterplot e il coefficiente di correlazione, parto dal presupposto che ci sia relazione lineare tra x e y Valori stimati: Residui: Utilizzando la retta di regressione posso fare delle previsioni