Introduzione alla statistica per la ricerca Lezione I

Slides:



Advertisements
Presentazioni simili
- le Medie la Moda la Mediana
Advertisements

Le distribuzioni di probabilità continue
SCALA INTERVALLO / A RAPPORTO
2. Introduzione alla probabilità
____________________
Variabili aleatorie discrete e continue
LA VARIABILITA’ IV lezione di Statistica Medica.
Distribuzione Normale o Curva di Gauss
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
Lez. 3 - Gli Indici di VARIABILITA’
Gli errori nell’analisi statistica
Progetto Pilota 2 Lettura e interpretazione dei risultati
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Statistica descrittiva
Inferenza statistica per un singolo campione
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
La distribuzione normale e normale standardizzata
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
Introduzione alla statistica per la ricerca Lezione II
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Processi Aleatori : Introduzione – Parte I
Distribuzioni di probabilità
Complementi al Corso di Ecologia - Approfondimenti di statistica
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Verifica delle ipotesi su due campioni di osservazioni
METODI E CONTROLLI STATISTICI DI PROCESSO
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Fondamenti di informatica
Le distribuzioni campionarie
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Introduzione alla Regressione Lineare e alla Correlazione.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Sintesi della lezione Il concetto di variabilità Campo di variazione Differenza interquartile La varianza La deviazione standard Scostamenti medi VARIABILITA’
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
Lez. 3 - Gli Indici di VARIABILITA’
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Gli indici di dispersione
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Accenni di analisi monovariata e bivariata
“Teoria e metodi della ricerca sociale e organizzativa”
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
La distribuzione campionaria della media
Elaborazione statistica di dati
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
Misurazione Raccolta sistematica e organizzata di elementi per classificare quantificare.
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
1 Statistica Scienza dell’incertezza PROBABILITÀ ALLA BASE DELL’INFERENZA Ipotesi VERA o FALSA? Campionamento Analisi statistica Scelta di una delle due.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Gli Indici di VARIABILITA’
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Introduzione alla statistica per la ricerca Lezione I Dr. Stefano Guidi Siena, 3 Ottobre 2012

Perché statistica? La conoscenza della statistica è importante per valutare la variabilità del mondo, e per aiutarci a vedere schemi all’interno di un mondo dominato dalla casualità, ed a distinguere tra relazioni causali tra diversi fenomeni e relazioni solo apparenti.

Introduzione Statistica Insieme di tecniche e procedure per: “Scienza di derivazione matematica che si occupa di studiare e descrivere la realtà fenomenica nei suoi aspetti di rilevazione numerica“ Insieme di tecniche e procedure per: Visualizzare dati Analizzare Interpretare Prendere decisioni a partire da essi Fondamentali nella ricerca scientifica

Ricerca Scientifica Metodo Scientifico Basato sull’osservazione Formulazione di ipotesi Verifica sperimentale Dati (risultato dell’osservazione) Incerti Parzialmente dovuti al caso Limitati Io voglio giungere a conclusioni generali Necessarie tecniche per ovviare ai problemi

Statistica Descrittiva Matematica Inferenziale Descrivere, riassumere e visualizzare insiemi di dati Matematica Fornisce la base teorica dei concetti di variabilità e probabilità Inferenziale Fare inferenze su una popolazione in base ad un campione estratto dalla popolazione

Statistica Descrittiva Insieme di metodi per riassumere in maniera chiara, comprensibile e possibilmente concisa un insieme di dati 2 Approcci: Grafico Numerico Variabile: una proprietà, o una caratteristica di eventi, oggetti o persone che può assumere diversi valori (se misurata)

Classificazione delle Variabili Diversi modi per classificare una variabile: In base ai valori che possono assumere (livelli) In base alla scala su cui le misuro In base al loro status in uno studio sperimentale

In base ai valori Qualitative Quantitative Discrete Continue Sesso, colore dei capelli, ecc… Quantitative Età, altezza, QI, ecc… Discrete Possono assumere un numero finito di livelli Continue Possono assumere un numero infinito di livelli

In base alla scala Scale Nominali Scale Ordinali Scale ad intervalli Permettono di dire quali elementi sono diversi e quali uguali (categorie) Scale Ordinali I valori sono ordinati, e permettono quindi di distinguere due valori in base al loro posto nella scala (classifica di una gara) Scale ad intervalli Permettono di definire la distanza tra due elementi (no zero assoluto): temperatura in C Scale a rapporti Permettono di definire dei rapporti: temperatura in K

Istogrammi Un istogramma è grafico che rappresenta la distribuzione di frequenza di un insieme di dati sull'asse delle ascisse (x) Le categorie a cui può appartenere il dato nominale Intervalli in cui può cadere un dato numerico sull'asse delle ordinate (y) il numero di volte che ho osservato un evento di una data categoria (frequenza assoluta) Il rapporto tra frequenza assoluta dell’evento ed numero totale di dati osservati (frequenza relativa)

Frequenza (relativa) dell’altezza (in pollici) di un campione di individui Frequenza relativa (proporzione) Altezza (pollici)

Frequenze degli esiti del lancio di una moneta e di un dado dopo 100 lanci Frequenza assoluta (conteggio) Frequenza assoluta (conteggio) Esito (moneta) Esito (dado)

Occhio alla scala! La scelta degli estremi della scala usata per l’asse Y ha conseguenze drammatiche per evidenziare visivamente (o nascondere!) differenze nei dati di frequenza. Stessi Dati Maggiore differenza Minore differenza

Considerazioni Istogrammi (e altri grafici) permettono di visualizzare la variabilità dei dati e di identificare tendenze. Informazioni soltanto indicative. Occhio alla scala: Unità di misura (y): Frequenza assoluta vs relativa (tra 0 e 1) Si può sempre passare dalla prima alla seconda, e viceversa (sapendo il numero totale di dati) Estremi (intervallo rappresentato su y): Più l’intervallo (range) rappresentato è piccolo, più grandi appariranno le differenze Le statistiche possono essere usate per mentire…

Indici Numerici Indicatori di tendenze centrali: Indicano dove tendono a concentrarsi i valori osservati della nostra variabile Indicatori di dispersione: Indicano il grado di variabilità dei valori della variabile nei dati Indicatori di forma: Indicano proprietà generali della distribuzione delle frequenze dei valori che può assumere la variabile

Media Somma dei valori osservati divisa per il numero dei dati reddito 3500 5800 8000 8300 8450 8680 15750 17500 media 9381,11 3500 5800 8000 8300 8450 8680 15750 17500 200000 28443 Somma dei valori osservati divisa per il numero dei dati Per scale numeriche Facilmente calcolabile e trattabile Molto sensibile a valori “anomali”

Mediana Il valore sotto cui si collocano il 50% delle osservazioni nei miei dati Per scale ordinali Meno sensibile ai dati “anomali”, più adatta per distribuzioni asimmetriche reddito 3500 5800 8000 8300 8450 8680 15750 17500 200000 media 9381,11 28443 mediana

Moda Il valore più frequente nei miei dati Poco usato Può esserci più di una moda in una distribuzione

Indicatori di dispersione Misurano la variabilità delle osservazioni rispetto ad un valore centrale Devianza (SS) Varianza (s2) Deviazione standard (s) Possono essere usati per stimare la variabilità nella popolazione generale

Devianza (SS) La somma degli scarti quadratici dei valori dalla media Più sono i valori “distanti” dalla media nei miei dati, più sarà grande Cresce con il numero delle osservazioni

Varianza (s2) La devianza (SS) divisa per il numero delle osservazioni Più è grande più c’è variabilità Non dipende dal numero di osservazioni Buona stima della variabilità di una popolazione Difficile da interpretare

Deviazione standard Radice quadrata della varianza Riporta la variabilità delle osservazioni in unità di misure significative (la stessa unità di misura della variabile misurata) Solo per distribuzioni normali

Indicatori di Forma Simmetria (Skew) Kurtosi La direzione in cui punta Misura la concentrazioni dei dati attorno alla media

Esercizi Calcolate media, mediana, moda, devianza, varianza e deviazione standard dei seguenti set di dati (osservazioni): Numero di canestri su 10 lanci liberi per ogni persona (10 persone): 1, 2, 4, 5, 5, 6, 6, 6, 8, 9 Numero di birre bevute da un pacco da 12 in una notte da ogni persona ad una festa (10 persone): 12, 4, 8, 6, 11, 12, 7, 9, 6, 10

Statistica Matematica Probabilità vs Frequenza Variabili Aleatorie Astrazioni che denotano l’incertezza che precede ad ogni evento Distribuzione di probabilità Discrete Continue

Distribuzioni

Distribuzione Normale Famiglia di distribuzioni di probabilità Forma “a campana” Media=mediana=moda Completamente specificate da 2 parametri indipendenti μ (media) σ (deviazione standard) Moltissimi fenomeni naturali sono distribuiti in modo normale Assunta dai test statistici

Distribuzione Normale II Area della parte colorata è la probabilità di osservare per caso un valore di QI compreso tra 90 e 110 (68.27% di probabilità). μ (media) (ex: punteggio QI di 100) σ (deviazione standard) (ex: 10 punti QI)