Gli errori nell’analisi statistica

Slides:



Advertisements
Presentazioni simili
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
Advertisements

MISURAZIONE Operazione che permette di associare coerentemente numeri alle caratteristiche di un insieme di oggetti o individui 4 i 5  2 R 3 1 6 3.
Il linguaggio della statistica
La misura in riabilitazione Giuseppe Stefanoni
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
“Teoria e metodi della ricerca sociale e organizzativa”
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Lez. 3 - Gli Indici di VARIABILITA’
Descrizione dei dati Metodi di descrizione dei dati
Progetto Pilota 2 Lettura e interpretazione dei risultati
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Inferenza statistica per un singolo campione
Introduzione alla statistica per la ricerca Lezione I
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Appunti di inferenza per farmacisti
Metodi di ricerca in Psicologia
Metodi della ricerca in Psicologia
STATISTICA a.a LA STATISTICA INFERENZIALE
STATISTICA a.a VARIABILITA’ BIOLOGICA E CASO
Statistica con Excel Procedure utili per l’analisi dati ottenute col foglio elettronico. Giovanni Raho 11/04/2011 Edizione 2011 prog. Giocìvanni Raho.
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Complementi al Corso di Ecologia - Approfondimenti di statistica
Misurazione Le osservazioni si esprimono in forma di misurazioni
METODI E CONTROLLI STATISTICI DI PROCESSO
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Fondamenti di informatica
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
Le distribuzioni campionarie
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
TRATTAMENTO DEI DATI ANALITICI
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Statistica La statistica è
Indici di posizione Francesco Michele Mortati - Istat.
Gli indici di dispersione
La statistica.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Accenni di analisi monovariata e bivariata
Controllo di qualità dei processi e collaudo
Marta Pinto Stefania Serra Valentina Paravidino
3 June Biostatistica Biostatitistica= Statistica per scienze Biostatitistica= Statistica per scienze biologiche e sanitarie. biologiche e sanitarie.
STATISTICHE DESCRITTIVE
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Accenni di analisi monovariata e bivariata
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
Misurazione Raccolta sistematica e organizzata di elementi per classificare quantificare.
ANALISI E INTERPRETAZIONE DATI
Misurazione Raccolta sistematica e organizzata di elementi per classificarequantificare.
TRATTAMENTO STATISTICO DEI DATI ANALITICI
EPG di Metodologia della ricerca e Tecniche Multivariate dei dati A.A
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Accenni di analisi monovariata e bivariata. ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle.
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Trattamento dei dati sperimentali
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Gli errori nell’analisi statistica Errore di Tipo I – Il trattamento NON ha effetto, ma noi riteniamo che lo abbia Errore di tipo II – Il trattamento ha effetto ma noi riteniamo che NON lo abbia Alfa è il criterio richiesto per la significatività statistica. Assumendo che l’ipotesi nulla sia vera, alfa è la proporzione di studi che risulteranno in un errore di tipo I Beta è la proporzione di studi che avranno un errore di tipo II

Potenza di uno studio Un’analisi di potenza viene svolta nella progettazione di uno studio, per poter anticipare la possibilità che si ottengano risultati significativi. E’ basata sugli stessi fattori associati alla significatività: 1) numerosità del campione, 2) dimensione dell’effetto, 3) valore di alfa Potenza è quindi la proporzione di studi che, date le caratteristiche elencate precedentemente, porterà ad un risultato significativo Errore di tipo II = 1 - potenza

Potenza di uno studio per dimensioni dell’effetto – Confronto fra due popolazioni

Potenza di uno studio per valore di alfa – Confronto fra due popolazioni

Campionamento casuale (1) Campioni di popolazione possono essere selezionati in modi differenti In statistica, tuttavia, per poter estendere le proprie conclusioni ad una popolazione generale, partendo da un campione, è necessario partire da una selezione basata sulla “randomizzazione” dei soggetti

Campionamento casuale (2) Ogni membro della popolazione ha una possibilità uguale ed indipendente di essere scelto o di essere assegnato ad un gruppo La scelta di un membro del gruppo non influenza in alcun modo la scelta dei membri successivi Un esempio …

Tipi di variabili Alfanumeriche Numeriche ( scale) Nominali Ordinali Intervallari e razionali, discrete e continue

Variabili alfanumeriche (stringa, ASCII) Parole, caratteri dell’alfabeto, numeri trattati come caratteri Non consentono operazioni matematiche, anche se molti software permettono operazioni logiche (es. “A” < “B”) Usate nella ricerca biomedica solo: a scopi identificavi (es. cognome, nome, acronimo, codice fiscale) per riportare un commento Es. “Che tipo di frattura ha subito?” 1. femore 2. polso 3. vertebra 4. altro (specificare) ____________________________________

Scale nominali (categoriche, qualitative) Categorie non ordinate, mutuamente esclusive L’assegnazione di un valore quantitativo piuttosto di un altro è arbitrario es. codici categorie professionali 1. medici 2. fisioterapisti 3. infermieri Un tipo particolare: le variabili dicotomiche es. stato vitale 1. vivo 2. morto

Scale ordinali Categorie mutuamente esclusive, ordinate I valori numerici esprimono il grado di intensità relativa della caratteristica es. grado di disabilità 0. non disabile 1. disabilità lieve 2. disabilità moderata 3. disabilità grave Uguali differenze numeriche non corrispondono ad uguali differenze di intensità

Scale intervallari e razionali Per ogni grado della scala, uguali differenze numeriche corrispondono ad uguali differenze di intensità Se lo zero è arbitrario, la scala è intervallare ma non razionale es. temperatura: Celsius 0 – Fahrenheit 32 50 ºC = (32 + 1.8 x 50) ºF = 122 ºF 100 ºC = (32 + 1.8 x 100) ºF = 212 ºF 100 è il doppio di 50, ma 212 non è il doppio di 122 Se lo zero corrisponde all’assenza della caratteristica, la scala è detta razionale es. scala Kelvin (temperatura), glicemia, pressione arteriosa

Scale discrete e continue Le scale intervallari (razionali o no) sono distinguibili in: Continue: sempre possibile trovare intervalli più piccoli es. distanza Discrete: intervalli interi es. numero di figli di una donna

Trasformazione di variabili Var. continue o discrete  var. ordinali sulla base di una soglia predefinita es. PAS, soglia diagnostica di ipertensione 140 mmHg sulla base della distribuzione di frequenza Vantaggio: semplicità di analisi Svantaggio: perdita di dettaglio

Controllo di qualità dei dati Preparare il manuale operativo Provare gli strumenti prima di cominciare la raccolta dati Addestrare il personale Prima dell’immissione dati, controllarne l’ appropriatezza (es. codifiche mancanti, impossibili o inesistenti)  correggere Doppia immissione (o verifica dell’immissione) Controlli logici e d’intervallo

Raccolta e presentazione dei dati Solitamente in tabelle, in cui ogni osservazione è rappresentata da una riga ed ogni variabile da una colonna Utili a questo scopo software tipo Excel, con: “fogli di lavoro” per l’immissione dati formule e funzioni per effettuare operazioni sui dati funzione di ordinamento grafici analisi statistica I dati Excel possono essere scambiati con altri software (esportati o importati)

Riduzione dei dati I dati relativi alle osservazioni individuali vanno sintetizzati, esprimendo: la frequenza delle osservazioni la tendenza centrale e la variabilità (dispersione) (A tale scopo, i dati vanno preliminarmente ordinati) I dati così sintetizzati possono essere presentati in forma di tabelle e grafici

Misure di tendenza centrale: media, mediana e moda Media (aritmetica): somma delle osservazioni diviso il loro numero Mediana: il valore che divide a metà le osservazioni (50% sono più basse o uguali, 50% sono maggiori) Moda: il (i) valore(i) più frequenti in una serie di osservazioni

Diversi andamenti di curve di distribuzione

Curve di distribuzione

Media, mediana e moda a confronto La media si presta meglio a rappresentare dati simmetricamente disposti rispetto al valore centrale La mediana è meno influenzata dai valori estremi, quindi è da preferirsi in caso di distribuzioni fortemente asimmetriche La presenza di più mode può suggerire che la popolazione in esame è in realtà composta da due subpopolazioni diverse V. esempi in Excel

Distribuzione normale Distribuzione teorica di probabilità per n∞

Proprietà della distribuzione normale Descritta interamente dalla media m e dalla deviazione standard s Simmetrica attorno a m, flesso a m–s e m +s Va da -∞ a +∞ X ~ N (m, s2) s s m-s m m+s X

Confronto tra distribuzioni normali m-s2 m-s1 m+s2 m+s1 Stessa media, diversa deviazione standard m1-s m2-s m1 m2 Stessa deviazione standard, diversa media