Introduzione alla statistica per la ricerca Lezione II

Slides:



Advertisements
Presentazioni simili
Le distribuzioni di probabilità continue
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
2. Introduzione alla probabilità
Definizione di probabilità, calcolo combinatorio,
Variabili aleatorie discrete e continue
STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA
La probabilità.
Scale di misura delle variabili
La scelta del paniere preferito
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Lez. 3 - Gli Indici di VARIABILITA’
Descrizione dei dati Metodi di descrizione dei dati
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Inferenza statistica per un singolo campione
CAMPIONAMENTO Estratto dal Cap. 5 di:
Analisi della varianza (a una via)
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
Introduzione alla statistica per la ricerca Lezione I
Processi Aleatori : Introduzione – Parte I
Distribuzioni di probabilità
Appunti di inferenza per farmacisti
Corso di biomatematica Lezione 2: Probabilità e distribuzioni di probabilità Davide Grandi.
Esercizi x1=m-ts x2=m+ts
VERIFICA DEI RIFLESSI …Tutto ciò che avreste voluto sapere e non avete mai osato chiedere… M. & D.
Complementi al Corso di Ecologia - Approfondimenti di statistica
Rappresentazione dei dati statistici
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
PROBABILITÀ La probabilità è un giudizio che si assegna ad un evento e che si esprime mediante un numero compreso tra 0 e 1 1 Evento con molta probabilità.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Statistica economica (6 CFU) Corso di Laurea in Economia e Commercio a.a Docente: Lucia Buzzigoli Lezione 5 1.
Le distribuzioni campionarie
Teorie e Tecniche di Psicometria
PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.
Introduzione alla Regressione Lineare e alla Correlazione.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
Laurea Ing EO/IN/BIO;TLC D.U. Ing EO 10 PROBABILITA’ E VARIABILI ALEATORIE.
Statistica Descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
Martina Serafini Martina Prandi
“Teoria e metodi della ricerca sociale e organizzativa”
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
La curva di Gauss Prof. Marco Lombardi.
Eventi aleatori Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati.
La distribuzione campionaria della media
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
ANALISI E INTERPRETAZIONE DATI
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Correlazione e regressione lineare
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
1 Statistica Scienza dell’incertezza PROBABILITÀ ALLA BASE DELL’INFERENZA Ipotesi VERA o FALSA? Campionamento Analisi statistica Scelta di una delle due.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Elementi di statistica e probabilità Misure Meccaniche e Termiche - Università di Cassino 2 Eventi aleatori e deterministici Un evento aleatorio può.
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Introduzione alla statistica per la ricerca Lezione II Dr. Stefano Guidi Siena, 11 Ottobre 2012

Riferimenti Online statistics (http://onlinestatbook.com/) Semplice, completo e con molte dimostrazioni interattive (anche ebook!) Psychological statistics (http://www4.uwsp.edu/psych/stat/) Corso di statistica online Statistics Hell (http://www.statisticshell.com) Più avanzato, ma strutturato a livelli, con esempi, esercizi e dati per SPSS

Esempi di affermazioni statistiche 4 dentisti su 5 raccomandano Mentadent Quasi l’85% dei casi di cancro al polmone negli uomini ed il 45% nelle donne sono legati al fumo Gli studenti di Science della Comunicazione hanno un QI più alto degli altri Le persone tendono ad essere più persuasive quando guardano gli altri negli occhi e parlano al alta voce e velocemente Gli americani tendono ad essere più individualisti degli europei Il numero di crimini violenti nelle città aumenta con il numero di chiese

Studiate queste parole x 2 minuti TROTTOLA PAUSA BOTTONE FORZA TAPPO SENSO CUSCINO GIOIA TAPPETO CORAGGIO CHITARRA LAMPIONE FURBIZIA SEDIA AIUTO VASO PERDITA MATITA SALUTE CHIAVE PENSIERO MAGLIONE GIOVENTU’ CANDELA IMPULSO OMBRELLO LANGUORE

Provate a rievocare Avete adesso 2 minuti per scrivere su un foglio tutte le parole che riuscite a ricordare

Quante parole ricordavate? TROTTOLA PAUSA BOTTONE FORZA TAPPO SENSO CUSCINO GIOIA TAPPETO CORAGGIO CHITARRA LAMPIONE FURBIZIA SEDIA AIUTO VASO PERDITA MATITA SALUTE CHIAVE PENSIERO MAGLIONE GIOVENTU’ CANDELA IMPULSO OMBRELLO LANGUORE

Introduzione Descrittiva Dati sono osservazioni del mondo Inferenziale Descrivere, riassumere (indicatori) e visualizzare (grafici) insiemi di dati Dati sono osservazioni del mondo Limitati in numero: abbiamo solo un campione di osservazioni, tra tutte quelle possibili Inferenziale Fare inferenze su una popolazione in base ad un campione estratto dalla popolazione

Istogrammi (frequenza relativa N=100) Frequenza relativa (proporzione) Frequenza relativa (proporzione) Esito (moneta) Esito (dado)

Indicatori di tendenze centrali Media “Il salario medio dei dipendenti di un’azienda è 4.800 €” Mediana Il valore al di sopra del quale si collocano il 50% delle osservazioni “La mediana del salario dei dipendenti è 1.300 €” Moda Il valore più frequente dell’insieme “Mentadent è il dentifricio più comprato dagli italiani”

Indicatori di dispersione Misurano la variabilità delle osservazioni Devianza (SS) Cresce con il numero delle osservazioni Varianza (s2) Rapporta la devianza al numero delle osservazioni Buona stima della variabilità di una popolazione Deviazione standard (s) Unità di misura significativa (la stessa della variabile che ho misurato: punti QI, numero di parole, ecc…)

Dati bivariati 2 variabili prese (simultaneamente) per ogni soggetto: Età, peso Altezza, peso Età del marito, età della moglie Peso auto, consumo di benzina (l/km) Statistiche descrittive Diagrammi a dispersione (scatterplots) Indicatori di associazione (correlazione)

Scatterplots r=0.97 r=0.63

Correlazione Misura di associazione tra 2 variabili osservate Indice di correlazione lineare di Pearson (r) r > 0  all’aumentare di una variabile aumenta l’altra r < 0  all’aumentare di una variabile diminuisce l’altra r = 0 assenza di correlazione r = ±1 correlazione perfetta Correlazione NON implica causazione Non si può stabilire la direzione dell’influenza (A->B vs B->A) Ci possono essere variabili latenti (non osservate) che causano la relazione

Indice r misura quanto sono sparsi i dati attorno ad una retta

Popolazioni Popolazione (il mondo) l'insieme completo, infinito o finito, di oggetti, osservazioni o punteggi appartenenti ad una data classe Popolazione può essere solo ipotetica In pratica è l’oggetto del mio interesse, il ricercatore definisce una popolazione come quello che vuole studiare Indici relativi ad una popolazione si dicono parametri

Campioni Campione (i dati) Sottoinsieme di dati di una popolazione a cui ho accesso Sono tutte le osservazioni che ho effettuato Indici relativi ad un campione si dicono statistiche È importante il modo in cui è stato scelto! (campionamento)

Campionamento Come scelgo le mie osservazioni Campionamento casuale Devono essere rappresentative della popolazione per consentire inferenze Evitare bias nella scelta Campionamento casuale Tutti i membri della popolazione hanno la stessa probabilità di entrare nel campione In pratica è spesso impossibile, ma basta un’approssimazione Campionamento stratificato Il campione rispecchia in alcune caratteristiche la popolazione Per garantire rappresentatività

Dimensioni del campione Fondamentali per la rappresentatività e per contrastare la variabilità casuale All’aumentare del campione le differenze dovute solo al caso tendono a cancellarsi a vicenda, ed a fare avvicinare le statistiche ai parametri Frequenza relativa n=10 n=100

Statistica Inferenziale Trarre inferenze su una popolazione a partire da un campione Inferenze probabilistiche: Conclusioni basate sulla probabilità di osservare i dati per caso (necessario campionamento casuale!) In pratica si basano su misure di variabilità Possono essere errate, ma posso cercare di contenere il rischio di errore

Probabilità Un concetto controverso… Definizione a priori Dati N esiti equiprobabili di un evento, la probabilità che ognuno di essi si verifichi è 1/N Definizione frequentista La proporzione di volte che un evento si verifica dopo un numero sufficientemente grande (in realtà infinito) di osservazioni Probabilità soggettiva

Probabilità P(evento) è compresa tra 0 e 1 P(testa)=1/2 La probabilità di un evento certo è 1 La probabilità di un evento impossibile è 0 P(non evento) = 1 – P(evento) P(≠1)=1-1/6 = 5/6

Probabilità: alcune leggi Dati due eventi A e B indipendenti, così che l’esito di A non ha nessuna influenza su quello di B, con probabilità rispettivamente pari a P(A) e P(B): P(A e B) = P(A)*P(B) Ex lancio 2 monete: P(T e T) = ? P(A o B) = P(A) + P(B) – P(A e B)

Distribuzioni di probabilità Per variabili discrete la distribuzione di probabilità contiene le probabilità di tutti gli esiti possibili

Distribuzione del QI

Distribuzioni continue (densità di probabilità) Per variabili continue si parla di densità di probabilità: Ex: tempo di reazione in ms (cliccare un tasto quando hai trovato una lettera T in un insieme di L) Qual è la probabilità di rispondere in 598,95629815730251 ms? Praticamente 0!

Distribuzioni continue (densità di probabilità) Descrive il variare della densità della probabilità (y) di una variabile continua (x) Area sotto la curva è 1 Probabilità di ogni singolo valore di x è 0 L’area sottesa dalla curva tra 2 punti sull’asse x è la probabilità che un numero scelto a caso cada tra i due punti P(a<t<b) a b t (ms)

Distribuzioni continue

Distribuzione Normale Famiglia di distribuzioni di probabilità simmetriche Forma “a campana” Media=mediana=moda Completamente specificate da 2 parametri indipendenti μ (media) σ (deviazione standard) Moltissimi fenomeni naturali sono distribuiti in modo normale Assunta dai test statistici

Distribuzione Normale II Area della parte colorata è la probabilità di osservare per caso un valore di QI compreso tra 85 e 115 (68.27% di probabilità). μ (media) (ex: punteggio QI di 100) σ (deviazione standard) (ex: 15 punti QI)

Distribuzione Normale Standard μ = 0; σ = 1 Posso sempre convertire una variabile con distribuzione normale in forma standard Esprimo la distanza di una variabile (normale) dalla media in termini di unità di deviazione standard Posso calcolare la probabilità di osservare casualmente quel valore!

Statistica Inferenziale Diverse tecniche, diversi fini: Stima Stimare un intervallo dei valori più probabili per un parametro di una popolazione a partire da un campione: Intervallo di confidenza Ex: capacità MBT = 7 parole? Verifica di Ipotesi Decidere se i dati a mia disposizione forniscono evidenza per rigettare una data ipotesi Ex: capacità MBT parole concrete ≠ parole astratte?