Progetto Moduli Formativi A.A

Slides:



Advertisements
Presentazioni simili
Che cosa vuol dire Statistica?
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
2. Introduzione alla probabilità
Corso “lettura critica” degli studi clinici.
STATISTICA DESCRITTIVA
La divulgazione della statistica
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Definizioni Chiamiamo esperimento aleatorio ogni fenomeno del mondo reale alle cui manifestazioni può essere associata una situazione di incertezza. Esempi:
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
RUOLO DELLA STATISTICA MEDICA nella LAUREA di BASE ed in quella SPECIALISTICA ATTITUDINI CONOSCENZE ABILITÀ
Analisi della varianza (a una via)
Distribuzioni di probabilità
Appunti di inferenza per farmacisti
Metodi di ricerca in Psicologia
Metodi della ricerca in Psicologia
Progettare una ricerca: approcci e metodologie
Progetto PON SIAMO TUTTI STATISTICI
Stima dei parametri di una distribuzione
VERIFICA DEI RIFLESSI …Tutto ciò che avreste voluto sapere e non avete mai osato chiedere… M. & D.
Complementi al Corso di Ecologia - Approfondimenti di statistica
Teorie e tecniche di psicologia clinica
Analisi della varianza
Verifica delle ipotesi su due campioni di osservazioni
Cai Lin Lin Michela & Guidetti Emanuela presentano:
Statistica Descrittiva
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
Le distribuzioni campionarie
Statistica Che cos’è?.
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
TRATTAMENTO DEI DATI ANALITICI
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
STATISTICA La statistica è la scienza che ha come fine lo studio quantitativo e qualitativo di un "collettivo". Studia i modi (descritti attraverso formule.
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
Statistica La statistica è
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
COSA VUOL DIRE FARE STATISTICA
Domande riepilogative per l’esame
“Teoria e metodi della ricerca sociale e organizzativa”
ORIENTAMENTO CONSAPEVOLE
Probabilità. Un percorso didattico esperimenti e simulazioni L. Cappello 9 Maggio Didattica probabilità e statistica PAS 2014.
I “ferri del mestiere”: metodi di ricerca in Psicologia dello Sviluppo
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
2) PROBABILITA’ La quantificazione della ‘possibilità’ del verificarsi di un evento casuale E è detta probabilità P(E) Definizione classica: P(E) è il.
Intervalli di confidenza
Potenziamento di matematica Scoperta di un nuovo mondo.
Medicina sociale … Prof. Giovanna Tassoni Istituto di Medicina legale – Università degli Studi di Macerata.
Eventi aleatori Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati.
La distribuzione campionaria della media
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
Studio fenomeni collettivi
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Corso di Statistica Applicata C. L. in Tecnologie forestali e ambientali 4 crediti (32 ore) Docente: Lorenzo Marini DAFNAE, Università di Padova
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
L’ecologia è oggi sempre più una disciplina che enfatizza lo studio olistico del sistema. Anche se il concetto che l’intero possa essere più della somma.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
Introduzione alle distribuzioni di probabilità di Gauss o normale di Bernoulli o binomiale di Poisson o dei casi rari.
Scienze tecniche e psicologiche
Elementi di statistica descrittiva Prof.ssa Nadia Andreuzzi
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Progetto Moduli Formativi A.A. 2014-2015 STATISTICA INFERENZIALE AGOSTINO ACCARDO – LAURA ZUCCHI accardo@units.it

STATISTICA INFERENZIALE – A.ACCARDO Cosa vedremo…. Cos’è e a cosa serve la statistica e quali sono i suoi campi di applicazione La statistica medica Cos’è l’Inferenza Concetti base Teoria Esercizi

STATISTICA INFERENZIALE – A.ACCARDO COS’E’ LA STATISTICA….. « Sai ched'è la statistica? È 'na cosa che serve pe fà un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che spósa. Ma pè me la statistica curiosa è dove c'entra la percentuale, pè via che, lì, la media è sempre eguale puro co' la persona bisognosa. Me spiego: da li conti che se fanno seconno le statistiche d'adesso risurta che te tocca un pollo, all'anno: e, se nun entra nelle spese tue, t'entra ne la statistica lo stesso perché c'è un antro che ne magna due. » (Trilussa, La Statistica)

STATISTICA INFERENZIALE – A.ACCARDO IN REALTA’…. La statistica è la scienza della rilevazione e dell’analisi dei dati SERVE ….. per comprendere fenomeni di varia natura: sociali economici naturali (delle scienze, della medicina) tecnologici (p.es. incidenza dei guasti) politici (sondaggi per capire tendenze di opinione) ……

STATISTICA INFERENZIALE – A.ACCARDO STATISTICA (definizione dalla Treccani) Scienza che ha per oggetto lo studio dei fenomeni collettivi suscettibili di misurazione e di descrizione quantitativa: basandosi sulla raccolta di un grande numero di dati inerenti ai fenomeni in esame, e partendo da ipotesi più o meno direttamente suggerite dall’esperienza o da analogie con altri fenomeni già noti, mediante l’applicazione di metodi matematici fondati sul calcolo delle probabilità, si perviene alla formulazione di leggi di media che governano tali fenomeni, dette leggi statistiche; spesso la raccolta dei dati viene limitata a un campione più ristretto che rappresenta il più fedelmente possibile le caratteristiche generali.

STATISTICA INFERENZIALE – A.ACCARDO CAMPI DI APPLICAZIONE….. (Treccani) Concepita inizialmente come attività descrittiva di certi fatti sociali e in particolare come attività amministrativa dello stato (Istat), ha via via ampliato i suoi confini, fino a diventare una vera e propria «scienza del collettivo», disciplina con finalità non solo descrittive dei fenomeni sociali e naturali, ma orientata anche a finalità di ricerca.

STATISTICA INFERENZIALE – A.ACCARDO LA STATISTICA NELLA BIOINGEGNERIA E IN MEDICINA RISPONDE A QUESITI DEL TIPO: Un determinato farmaco ha avuto un effetto significativo nella cura di una particolare malattia? Che valore deve presentare un certo esame perché possa essere considerato significativamente diverso da un altro (‘normale’) valore? Per quali valori degli esami posso concludere, con un trascurabile margine di errore, che un soggetto soffre di una determinata patologia piuttosto che un’altra?

STATISTICA INFERENZIALE – A.ACCARDO DUE APPROCCI STATISTICA DESCRITTIVA: insieme dei metodi che riguardano raccolta, presentazione e sintesi di un insieme di dati per descriverne le caratteristiche essenziali STATISTICA INFERENZIALE: insieme dei metodi con cui si possono elaborare i dati dei campioni per dedurne omogeneità o differenze nelle caratteristiche analizzate

STATISTICA INFERENZIALE – A.ACCARDO PROCEDURA CORRETTA: PRIMA DI PROGETTARE UNA RICERCA ANALIZZARE QUALE METODOLOGIA STATISTICA UTILIZZARE E QUINDI RACCOGLIERE I DATI NO PRIMA I DATI E POI SCEGLIERE IL METODO STATISTICO -- SINGOLO, DOPPIO O TRIPLO CIECO --------------------- STUDI DI: - COORTE (LONGITUDINALI) => NEL TEMPO SUGLI STESSI SOGGETTI (prospettico o retrospettivo) - CROSS-SECTIONAL (TRASVERSALI) => 1 MISURA PER SOGGETTO DI UNA POPOLAZ. IN UN DET. MOMENTO - CASI-CONTROLLO (LONGITUDINALI) => 1 FATTORE SU 2 GRUPPI

STATISTICA INFERENZIALE – A.ACCARDO STATISTICA MEDICA: offre la metodologia per analizzare quantitativamente fenomeni inerenti aspetti medici 2 APPROCCI: - POPOLAZIONE => EPIDEMIOLOGICO (Descrittiva) - DIAGNOSI/PROGNOSI/TERAPIA (Inferenziale) => CLINICO - SPERIMENTALE MOMENTI ESSENZIALI: - SCELTA DELLA/E VARIABILE/I - DETERMINAZIONE DELLA POPOLAZIONE DI RIFERIMENTO E DEL CAMPIONE DA CUI INFERIRE - SCELTA DELLA DIMENSIONE DEL CAMPIONE E SUA ESTRAZIONE

STATISTICA INFERENZIALE – A.ACCARDO Concetti base: Popolazione / Campione Variabile Distribuzioni di Probabilità

STATISTICA INFERENZIALE – A.ACCARDO Popolazione: Insieme delle entità (in generale non è detto si tratti di persone) sulle quali si effettua lo studio e si rilevano i valori (‘modalità’) Va delimitata temporalmente e spazialmente Campione: Un sottoinseme qualsiasi estratto A CASO da una popolazione; se considero più campioni questi possono o meno essere tra loro indipendenti

STATISTICA INFERENZIALE – A.ACCARDO Variabile: aleatoria, continua / discreta Distribuzioni di Frequenze => di Probabilità 𝐸𝑆𝐸𝑀𝑃𝐼𝑂 variabile continua: altezza (cm) di 40 piante: 107 83 100 128 143 127 117 125 64 119 98 111 119 130 170 143 156 126 113 127 130 120 108 95 192 124 129 143 198 131 163 152 104 119 161 178 135 146 158 176 Distribuzione di frequenze assolute e relative (%) dell'altezza delle 40 piante : classe (xi) 60-79 80-99 100-119 120-139 140-159 160-179 180-199 freq. ass. (ni) 1 3 10 12 7 5 2 freq. rel. ( fi) 2,5 7,5 25 30 17,5 12,5 5

STATISTICA INFERENZIALE – A.ACCARDO PROBABILITA’ E COMBINAZIONI POSSIBILI lancio di 1 moneta: 2 combinazioni possibili, probabilità uguali (1/2) Lancio di 2 monete: 3 combinazioni possibili, probabilità diverse (0.25=2 teste o 2 croci, 0.5=1 testa e 1 croce) Galileo (1656), lancio di 3 dadi: 9, 10, 11 e 12 si ottengono dal medesimo numero di combinazioni (6) ma 10 e 11 sono più probabili (26 possibilità) di 9 e 12 (23 possibilità)

STATISTICA INFERENZIALE – A.ACCARDO STATISTICA DESCRITTIVA - RAPPRESENTAZIONI - ANALITICHE ESPRIMONO LEGAMI FUNZIONALI/MODELLI INTEPRETATIVI - GRAFICHE DI DATI QUANTITATIVI, FORNISCONO: • una sintesi visiva delle caratteristiche fondamentali delle distribuzioni • impressioni percepite con maggiore facilità • meno particolari • una descrizione espressa mediante una interpretazione soggettiva ISTOGRAMMI, POLIGONI E TORTE SCATTER DIAGRAM (GRAFICO A PUNTI, PER 2 VARIABILI)

STATISTICA INFERENZIALE – A.ACCARDO STATISTICA DESCRITTIVA - SINTESI DEI DATI VALORE MEDIO (o valore Atteso/Expected ~1750), ‘centro’ di una distribuzione, non è detto sia il più probabile! VARIANZA e DEVIAZIONE STANDARD, stime della ‘variabilità’ di un fenomeno misurata attraverso una variabile, misura la ‘dispersione’ intorno al valore medio MEDIANA, MODA, PERCENTILI, COEFF. VARIAZIONE, SKEWNESS, CURTOSI

STATISTICA INFERENZIALE – A.ACCARDO STATISTICA INFERENZIALE, BASATA SULLA PROBABILITA’ CONCETTO DI PROBABILITA’ A PRIORI (Teorica): Basata sul concetto che la probabilità di un evento è il rapporto tra il numero di casi favorevoli ed il numero di casi possibili, purchè tutti i casi siano egualmente probabili! => limitazioni per la ricerca sperimentale (approccio empirico): per valutare una probabilità sarebbe necessario conoscere preventivamente le diverse probabilità dei vari eventi….

STATISTICA INFERENZIALE – A.ACCARDO PROBABILITA’ A POSTERIORI (Frequentista o Statistica) : se in un insieme di prove la frequenza di un evento è all'incirca costante, questo valore di frequenza è assunto come probabilità • la probabilità di un evento, in una serie di prove condotte nelle stesse condizioni, è il limite a cui essa tende al crescere del numero delle osservazioni (principio di von Mises, 1920) => media campionaria Si applica in tutti quei casi in cui non sono note a priori le leggi dei fenomeni studiati, ma possono essere determinate a posteriori conducendo una serie di osservazioni/esperimenti, in condizioni controllate, per rilevare la frequenza relativa del fenomeno

STATISTICA INFERENZIALE – A.ACCARDO GAUSSIANA 95%=1.96σ 99%=2.58σ

STATISTICA INFERENZIALE – A.ACCARDO TEOREMA DEL LIMITE CENTRALE (1700-1800) QUALUNQUE DISTRIBUZIONE DI VARIABILE CASUALE REGOLI IL FENOMENO IN ESAME, SE IL NUMERO DI OSSERVAZIONI TENDE AD INFINITO, ALLORA ESSA E’ RICONDUCIBILE AD UNA DISTRIBUZIONE NORMALE

STATISTICA INFERENZIALE – A.ACCARDO PER CHI DESIDERA APPROFONDIRE…. Altre distribuzioni di probabilità: Binomiale Poisson T_Student χ2 Fisher

STATISTICA INFERENZIALE – A.ACCARDO => Gaussiana per n=>∞ => Gaussiana per λ>>0

STATISTICA INFERENZIALE – A.ACCARDO La conduzione dell’indagine (o ESPERIMENTO) è un percorso articolato in 4 fasi: 1 - disegno sperimentale • osservazioni in natura e ripetizioni in laboratorio non raccolte ed attuate a caso, ma scelte e programmate in funzione della ricerca e delle ipotesi esplicative • chiarire a priori la formulazione dell'IPOTESI ESPLICATIVA (alternativa all'IPOTESI NULLA) Le eventuali differenze riscontrate dovranno essere imputate a FATTORI CAUSALI SPECIFICI oppure solamente a FATTORI CASUALI IGNOTI attribuibili alla naturale variabilità delle misure e del materiale utilizzato 2 - campionamento - raccogliere i dati in funzione dello scopo della ricerca - rispettare le caratteristiche della popolazione Da un numero limitato di dati –> conclusioni generali –> tutta la popolazione

STATISTICA INFERENZIALE – A.ACCARDO 3 - descrizione dei dati raccolti per verificare l'adeguatezza di: - disegno sperimentale - campionamento - analisi condotte - risultati conseguiti 4 - utilizzo dei tests (programmati nel disegno sperimentale e in funzione dei quali viene effettuato il campionamento) processo logico-matematico che, mediante il calcolo di probabilità, porta alla conclusione di non poter respingere oppure di dover respingere l'ipotesi nulla Soltanto con una corretta applicazione del campionamento e dei test di confronto statistico è possibile rispondere alla DOMANDA INFERENZIALE di verifica dell'ipotesi nulla: LE DIFFERENZE FRA LE OSSERVAZIONI EMPIRICHE SONO DOVUTE A FATTORI PURAMENTE CASUALI ?

STATISTICA INFERENZIALE – A.ACCARDO Quale è la probabilità che, fra le alternative possibili, si presenti solo per fattori legati al caso, proprio la situazione descritta dai dati raccolti? - probabilità ‘alta’ (convenzionalmente => 5%) –––> fattori casuali - probabilità bassa (convenzionalmente < 5%) –––> fattori non casuali Analisi e conclusioni sono rese complesse fondamentalmente da tre aspetti: - errori nelle misurazioni: generati da strumenti e da differenti abilità degli sperimentatori - utilizzo di campioni: i dati utilizzati in una ricerca non sono mai identici a quelli rilevati nelle altre - fattori contingenti di disturbo: possono incidere in modo differente sul fenomeno indagato (es.: tempo, luogo, …)

STATISTICA INFERENZIALE – A.ACCARDO INFERENZA STATISTICA Per effettuare uno studio non utilizzo tutta la popolazione d’interesse, ma limito lo studio ad un solo sottoinsieme, un CAMPIONE, per poi estendere i risultati a tutta la popolazione => INFERENZA   Immaginiamo di avere a disposizione TUTTA la popolazione (di media 𝝁 e deviazione standard 𝝈) Estraendo dei campioni lo si può fare con 2 modalità: Esaustiva e Bernoulliana: Esaustiva: estraggo un campione di n soggetti, in modo casuale, misurando media 𝑚 𝑖 e deviazione standard 𝑠 𝑖 e non considero più i soggetti scelti Bernoulliana: estraggo ugualmente un campione di n soggetti casualmente, misuro media e dev. std, ma poi i soggetti possono essere riestratti nel successivo campione. Solitamente si utilizza l’estrazione Bernoulliana.

STATISTICA INFERENZIALE – A.ACCARDO La distribuzione delle medie campionarie, in entrambe le estrazioni, 𝑚 𝑖 è GAUSSIANA, con media pari a 𝜇 (stimatore CORRETTO) varianza uguale a 𝜎 2 𝑛 per la Bernoulliana con n = numerosità del campione Se si considerasse la media delle mediane campionarie (ovvero dei singoli campioni), anche essa sarebbe pari a 𝜇 (anche la mediana è uno stimatore CORRETTO) mentre la varianza sarebbe maggiore per cui la media 𝒎 𝒊 rappresenta uno stimatore di 𝜇 più EFFICIENTE della mediana

STATISTICA INFERENZIALE – A.ACCARDO STIMA PUNTUALE DELLA MEDIA (della popolazione) La eseguo tramite la media sul campione inserendo un errore della stima: 𝝁 =mi ± σ 𝒏 Stima CONSISTENTE, perché per n => ∞ l’errore => 0 Se σ (dev.standard della popolazione) è ignota allora useremo la dev. st. del campione, si, per stimarla: σ = si 𝒏−𝟏 Le stime puntuali sono affette da errore per cui spesso si usa stimare un intervallo entro il quale, con un prefissato livello di probabilità, cadrà il valore del parametro => INTERVALLO DI CONFIDENZA

STATISTICA INFERENZIALE – A.ACCARDO STIMA DELLA MEDIA (della popolazione) PER INTERVALLI - INTERVALLO DI CONFIDENZA Dato α = probabilità che il valore vero cada fuori dell’intervallo individuato allora P = 1 – α = prob. che cada dentro = livello di confidenza (o p-value) Poiché la variabile campionaria è distribuita come una gaussiana la si può normalizzare: 𝒁 𝒊 = 𝒎 𝒊 −𝝁 𝝈 𝒏 e si può scrivere: Prob (− 𝒁 𝜶 𝟐 ≤ 𝒎 𝒊 −𝝁 𝝈 𝒏 ≤ 𝒁 𝜶 𝟐 ) = 1 – α da cui si ricava l’INTERVALLO DI CONFIDENZA: 𝝁 = 𝒎 𝒊 ± 𝒁 𝜶 𝟐 ∙ 𝝈 𝒏 nel quale la media µ è compresa con prob. pari a 1-α

STATISTICA INFERENZIALE – A.ACCARDO ± 𝒁 𝜶 𝟐 ∙ 𝝈 𝒏 rappresenta l’incertezza della stima = l’errore! da minimizzare: Aumentando n Selezionando α opportuna Selezionando un’altra variabile …… 1-α 𝒁 𝜶 𝟐 0.68 1 0.8 1.28 0.9 1.64 0.95 1.96 0.9544 2 0.99 2.58 0.9973 3 Se σ è ignota o n è ‘piccolo’ (<≈100) al suo posto utilizzerò Si (dev. st. del campione) e al posto della Gaussiana utilizzerò la t-Student (tα/2,n-1) per tener conto dell’ulteriore incertezza introdotta: 𝝁 = 𝒎 𝒊 ±tα/2,n−1∙ 𝑺𝒊 𝒏 Un discorso analogo vale se si utilizza una coda e non due

STATISTICA INFERENZIALE – A.ACCARDO DIMENSIONE OTTIMA DEL CAMPIONE n Esistono diversi metodi per ottenere l’n che porti alla significatività dello studio statistico. A partire dall’intervallo di confidenza si definisce l’errore come: 𝐸= 𝑍 𝛼 2 ∙ 𝜎 𝑛 Fissato E (errore tollerato, espresso in termini percentuali, 2-3%), si avrà come sola incognita n, la numerosità del campione, ovvero:   𝒏= 𝒁 𝜶 𝟐 𝟐 ∙ 𝝈 𝟐 𝑬 𝟐 NB: Se 𝜎 non è disponibile (come succede nella maggior parte dei casi) estraggo un piccolo campione (~10) e cerco una sovrastima della deviazione standard in maniera molto approssimativa mediante la formula: 𝜎 = 𝑚𝑎𝑥−𝑚𝑖𝑛 4

STATISTICA INFERENZIALE – A.ACCARDO PER CHI DESIDERA APPROFONDIRE…. Altman – Practical statistics for medical research Steel & Torrie – Principles and procedures of statistics Di Orio – Statistica medica