STATISTICHE DESCRITTIVE

Slides:



Advertisements
Presentazioni simili
- le Medie la Moda la Mediana
Advertisements

Il senso dei dati: Elaborazione e Interpretazione.
LA VARIABILITA’ IV lezione di Statistica Medica.
“Teoria e metodi della ricerca sociale e organizzativa”
Variabilità Variabilità: inevitabile fluttuazione dei fenomeni naturali, fisici, sociali ecc le indicazioni fornite dalle misure di tendenza centrale (media.
Lez. 3 - Gli Indici di VARIABILITA’
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
STATISTICA DESCRITTIVA
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
DISTRIBUZIONE CAMPIONARIA CONGIUNTA DI DUE VARIABILI (1)
Analisi della varianza (a una via)
COSA VUOL DIRE FARE STATISTICA
Come descrivere un fenomeno in ambito sanitario: fondamenti di statistica descrittiva Brugnaro Luca.
Corso di biomatematica lezione 6: la funzione c2
Misure di dispersione Giovanni Filatrella
Statistica sociale Modulo A
Nicola Paparella, Università degli Studi, Lecce, aprile 2006 Pedagogia sperimentale Note ed appunti Corso di base / 5
Pedagogia sperimentale
Propagazione degli errori
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Fondamenti di informatica
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
Introduzione alla Regressione Lineare e alla Correlazione.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Simone Mosca & Daniele Zucchini 4Bi.
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
La Variabilità e La Concentrazione
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Sintesi della lezione Il concetto di variabilità Campo di variazione Differenza interquartile La varianza La deviazione standard Scostamenti medi VARIABILITA’
Lez. 3 - Gli Indici di VARIABILITA’
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Gli Indici di VARIABILITA’
Statistica La statistica è
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
PROPAGAZIONE DEGLI ERRORI:
Gli indici di dispersione
COSA VUOL DIRE FARE STATISTICA
Accenni di analisi monovariata e bivariata
Strumenti statistici in Excell
Corso di Analisi Statistica per le Imprese Indici di variabilita’ ed eterogeneita’ Prof. L. Neri a.a
Martina Serafini Martina Prandi
Marta Pinto Stefania Serra Valentina Paravidino
Elementi di statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
STATISTICHE DESCRITTIVE
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi.
Elaborazione statistica di dati
ANALISI E INTERPRETAZIONE DATI
Esercizio 1 La seguente distribuzione riporta i punteggi di ansia misurata prima dell’esame di psicometria: a) Costruire una tabella di frequenza, indicando:
TRATTAMENTO STATISTICO DEI DATI ANALITICI
analisi bidimensionale #2
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Gli Indici di VARIABILITA’
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Classe II a.s. 2010/2011 Prof.ssa Rita Schettino
Transcript della presentazione:

STATISTICHE DESCRITTIVE Parte II

INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione

introduzione Una distribuzione di dati contiene un insieme di informazioni complesse e di per se poco maneggevole. Il ricorso ad un indice di tendenza centrale comporta una forte semplificazione, e da solo non fornisce informazioni esaurienti sulla distribuzione. Occorre anche capire quanto i dati siano dispersi intorno all’indice di tendenza centrale. Esempio Consideriamo i risultati dei compiti di Psicometria di tre diverse Facoltà: Facoltà A = {18, 22, 24, 16, 19, 22 , 18, 21} Facoltà B = {10, 10, 12, 10, 30, 28 , 30, 30} Facoltà C = {20, 20, 20, 20, 20, 20 , 20, 20} In ogni Facoltà la media dei voti è pari a 20, ma è evidente una diversa dispersione intorno a tale valore.

gli indici di dispersione Gli indici che vedremo servono a misurare la dispersione (o variabilità) di una data distribuzione di dati. Per questo motivo vengono definiti come indici di dispersione o indici di variabilità. Gli indici di dispersione possono assumere solo valori positivi (non ha senso parlare di dispersione negativa) o nulli (nei casi in cui tutti i dati osservati sono uguali tra loro).

la gamma La gamma, detta anche campo di variazione, è la differenza fra il valore massimo e quello minimo dei dati. Esempio I seguenti dati rappresentano le altezze in centimetri dei giocatori di una squadra di pallavolo. {188, 195, 198, 170, 185, 199} La gamma di tale distribuzione sarà:

la differenza interquartilica La differenza interquartilica, o range interquartile, è data dalla differenza tra il terzo e il primo quartile (o equivalentemente tra il 75-esimo e il 25-esimo percentile) dei dati: Nota: La differenza interquartilica, non tiene conto dei valori estremi della distribuzione dei dati, evitando così di considerare valori anomali. Per questo motivo è considerata un indice “robusto”.

la varianza La varianza σ2 di un insieme di dati è definita come la media degli scarti al quadrato tra i dati e la media dei dati stessi. Essa assume il valore minimo di 0 quando i dati sono tutti uguali tra loro e aumenta al crescere della variabilità dei dati. Le formule per il calcolo della varianza sono differenti a seconda che i dati siano o meno raggruppati in classi.

formula per il calcolo della varianza - dati non raggruppati – dove: è lo scarto tra l’i-esima unità statistica e la media dei dati.

formula ridotta per il calcolo della varianza - dati non raggruppati – La varianza può essere anche calcolata attraverso la seguente formula, che consente un calcolo più agevole e veloce: varianza = media dei quadrati - quadrato della media

Esempio[1] Un ricercatore ha valutato la capacità linguistiche di 10 bambini in età prescolare ottenendo i dati sottoriportati. La capacità di linguistica è qui indagata come numero di parole non conosciute nella lettura di un testo [da Keppel, 1992]. Calcolare la varianza dei dati, sia con la formula generale che con quella ridotta. codice soggetto Numero parole non note 1 8 2 6 3 7 4 5 9 10

Esempio[2] Calcoliamo innanzi tutto la media dei dati: Utilizziamo ora la formula generale per il calcolo della varianza:

Esempio[3] Utilizziamo ora la formula ridotta. Per prima cosa calcoliamo la “media dei quadrati”: Calcoliamo ora il “quadrato della media”: Infine utilizzando la formula ridotta per il calcolo della varianza otteniamo:

formula per il calcolo della varianza - dati raggruppati – dove: è la frequenza relativa dell’i-esima modalità statistica.

Esempio[1] Calcolare la varianza dei dati dell’esempio precedente utilizzandoli in forma raggruppata. Per prima cosa rappresentiamo i dati in forma raggruppata: xi Parole sconosciute fi frequenze 4 1 6 2 7 8 9

Esempio[2] Ricordando che la media dei dati è pari a 7, applichiamo la formula per il calcolo della varianza per dati raggruppati:

formula per il calcolo della varianza - dati raggruppati in classi – dove: è il valore centrale dell’i-esima classe di frequenza.

Esempio[1] In un’azienda veronese che produce occhiali sono stati rilevati gli stipendi mensili dei 20 dipendenti: Stipendio mensile in Euro Frequenze 800 - 1200 10 1200 - 1600 5 1600 - 2000 3 2000 - 2400 2 Calcolare la media e la varianza di tali dati. Nota: gli intervalli di frequenza si intendono del tipo “primo valore incluso – secondo valore escluso”.

Esempio[2] Calcoliamo la media dei dati: Calcoliamo ora la varianza di tali dati: Formula non corretta nella varianza

la deviazione standard La deviazione standard (o scarto quadratico medio) è la radice della varianza: Essa è molto utile in chiave interpretativa perché, a differenza della varianza, è espressa nella stessa unità di misura del fenomeno studiato. Esempio In campione di 20 soggetti è stata rilevata la variabile peso. In tale campione la media è pari a 70 Kg e la deviazione standard è pari a 10.7. Si potrà affermare che i soggetti differiscono mediamente di 10.7 Kg dal peso medio di 70 Kg.

il coefficiente di variazione[1] Il coefficiente di variazione è dato dal rapporto tra la deviazione standard e il valore assoluto della media dei dati: Esso è un indice di variabilità relativa, che tiene conto oltre che della deviazione standard dei dati anche della media. Per questo motivo è molto utile per eseguire dei confronti in termini di variabilità tra fenomeni “diversi” tra loro.

il coefficiente di variazione[2] Esempio Nel reparto di ginecologia e ostetricia di un ospedale è stato rilevato il peso di un campione di 80 neonati maschi e contemporaneamente il peso dei rispettivi papà. I dati ottenuti sono espressi nella seguente tabella: gruppo media deviazione standard neonati 3.4 Kg 0.8 papà 82 Kg 15 Ci si chiede se, rispetto alla variabile peso, esiste più variabilità nel gruppo dei neonati o in quello dei papà.

il coefficiente di variazione[3] Naturalmente confrontare le deviazioni standard non è di grande aiuto. Esse dipendono fortemente dalle media dei dati su cui sono state calcolate. Per poter operare un confronto sulla variabilità dei due gruppi è opportuno calcolare i rispettivi coefficienti di variazione: Osservando i risultati si può concludere che il gruppo dei bambini presenta una maggiore variabilità rispetto a quella del gruppo dei papà.

il coefficiente di variazione[3] In conclusione, vediamo alcuni valori particolari del CV che possono essere utili nello studio di una distribuzione di dati: CV = 0 , in questo caso la deviazione standard è pari a 0. Tutti i dati sono uguali tra loro e la media può essere considerata come un indice perfetto per rappresentarli. CV ≥ 0.5 , in questo caso la deviazione standard è più della metà della media. La media, in questo caso, non può essere considerata un buon indice per rappresentare i dati. CV ≤ 0.5 , in questo caso la deviazione standard è meno della metà della media. La media, in questo caso, può essere considerata un buon indice per rappresentare i dati.