La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Progetto Moduli Formativi A.A

Presentazioni simili


Presentazione sul tema: "Progetto Moduli Formativi A.A"— Transcript della presentazione:

1 Progetto Moduli Formativi A.A. 2014-2015
STATISTICA INFERENZIALE AGOSTINO ACCARDO – LAURA ZUCCHI

2 STATISTICA INFERENZIALE – A.ACCARDO
Cosa vedremo…. Cos’è e a cosa serve la statistica e quali sono i suoi campi di applicazione La statistica medica Cos’è l’Inferenza Concetti base Teoria Esercizi

3 STATISTICA INFERENZIALE – A.ACCARDO
COS’E’ LA STATISTICA….. « Sai ched'è la statistica? È 'na cosa che serve pe fà un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che spósa. Ma pè me la statistica curiosa è dove c'entra la percentuale, pè via che, lì, la media è sempre eguale puro co' la persona bisognosa. Me spiego: da li conti che se fanno seconno le statistiche d'adesso risurta che te tocca un pollo, all'anno: e, se nun entra nelle spese tue, t'entra ne la statistica lo stesso perché c'è un antro che ne magna due. » (Trilussa, La Statistica)

4 STATISTICA INFERENZIALE – A.ACCARDO
IN REALTA’…. La statistica è la scienza della rilevazione e dell’analisi dei dati SERVE ….. per comprendere fenomeni di varia natura: sociali economici naturali (delle scienze, della medicina) tecnologici (p.es. incidenza dei guasti) politici (sondaggi per capire tendenze di opinione) ……

5 STATISTICA INFERENZIALE – A.ACCARDO
STATISTICA (definizione dalla Treccani) Scienza che ha per oggetto lo studio dei fenomeni collettivi suscettibili di misurazione e di descrizione quantitativa: basandosi sulla raccolta di un grande numero di dati inerenti ai fenomeni in esame, e partendo da ipotesi più o meno direttamente suggerite dall’esperienza o da analogie con altri fenomeni già noti, mediante l’applicazione di metodi matematici fondati sul calcolo delle probabilità, si perviene alla formulazione di leggi di media che governano tali fenomeni, dette leggi statistiche; spesso la raccolta dei dati viene limitata a un campione più ristretto che rappresenta il più fedelmente possibile le caratteristiche generali.

6 STATISTICA INFERENZIALE – A.ACCARDO
CAMPI DI APPLICAZIONE….. (Treccani) Concepita inizialmente come attività descrittiva di certi fatti sociali e in particolare come attività amministrativa dello stato (Istat), ha via via ampliato i suoi confini, fino a diventare una vera e propria «scienza del collettivo», disciplina con finalità non solo descrittive dei fenomeni sociali e naturali, ma orientata anche a finalità di ricerca.

7 STATISTICA INFERENZIALE – A.ACCARDO
LA STATISTICA NELLA BIOINGEGNERIA E IN MEDICINA RISPONDE A QUESITI DEL TIPO: Un determinato farmaco ha avuto un effetto significativo nella cura di una particolare malattia? Che valore deve presentare un certo esame perché possa essere considerato significativamente diverso da un altro (‘normale’) valore? Per quali valori degli esami posso concludere, con un trascurabile margine di errore, che un soggetto soffre di una determinata patologia piuttosto che un’altra?

8 STATISTICA INFERENZIALE – A.ACCARDO
DUE APPROCCI STATISTICA DESCRITTIVA: insieme dei metodi che riguardano raccolta, presentazione e sintesi di un insieme di dati per descriverne le caratteristiche essenziali STATISTICA INFERENZIALE: insieme dei metodi con cui si possono elaborare i dati dei campioni per dedurne omogeneità o differenze nelle caratteristiche analizzate

9 STATISTICA INFERENZIALE – A.ACCARDO
PROCEDURA CORRETTA: PRIMA DI PROGETTARE UNA RICERCA ANALIZZARE QUALE METODOLOGIA STATISTICA UTILIZZARE E QUINDI RACCOGLIERE I DATI NO PRIMA I DATI E POI SCEGLIERE IL METODO STATISTICO -- SINGOLO, DOPPIO O TRIPLO CIECO STUDI DI: - COORTE (LONGITUDINALI) => NEL TEMPO SUGLI STESSI SOGGETTI (prospettico o retrospettivo) - CROSS-SECTIONAL (TRASVERSALI) => 1 MISURA PER SOGGETTO DI UNA POPOLAZ. IN UN DET. MOMENTO - CASI-CONTROLLO (LONGITUDINALI) => 1 FATTORE SU 2 GRUPPI

10 STATISTICA INFERENZIALE – A.ACCARDO
STATISTICA MEDICA: offre la metodologia per analizzare quantitativamente fenomeni inerenti aspetti medici 2 APPROCCI: - POPOLAZIONE => EPIDEMIOLOGICO (Descrittiva) - DIAGNOSI/PROGNOSI/TERAPIA (Inferenziale) => CLINICO - SPERIMENTALE MOMENTI ESSENZIALI: - SCELTA DELLA/E VARIABILE/I - DETERMINAZIONE DELLA POPOLAZIONE DI RIFERIMENTO E DEL CAMPIONE DA CUI INFERIRE - SCELTA DELLA DIMENSIONE DEL CAMPIONE E SUA ESTRAZIONE

11 STATISTICA INFERENZIALE – A.ACCARDO
Concetti base: Popolazione / Campione Variabile Distribuzioni di Probabilità

12 STATISTICA INFERENZIALE – A.ACCARDO
Popolazione: Insieme delle entità (in generale non è detto si tratti di persone) sulle quali si effettua lo studio e si rilevano i valori (‘modalità’) Va delimitata temporalmente e spazialmente Campione: Un sottoinseme qualsiasi estratto A CASO da una popolazione; se considero più campioni questi possono o meno essere tra loro indipendenti

13 STATISTICA INFERENZIALE – A.ACCARDO
Variabile: aleatoria, continua / discreta Distribuzioni di Frequenze => di Probabilità 𝐸𝑆𝐸𝑀𝑃𝐼𝑂 variabile continua: altezza (cm) di 40 piante: Distribuzione di frequenze assolute e relative (%) dell'altezza delle 40 piante : classe (xi) freq. ass. (ni) freq. rel. ( fi) , , , ,

14 STATISTICA INFERENZIALE – A.ACCARDO
PROBABILITA’ E COMBINAZIONI POSSIBILI lancio di 1 moneta: 2 combinazioni possibili, probabilità uguali (1/2) Lancio di 2 monete: 3 combinazioni possibili, probabilità diverse (0.25=2 teste o 2 croci, 0.5=1 testa e 1 croce) Galileo (1656), lancio di 3 dadi: 9, 10, 11 e 12 si ottengono dal medesimo numero di combinazioni (6) ma 10 e 11 sono più probabili (26 possibilità) di 9 e 12 (23 possibilità)

15 STATISTICA INFERENZIALE – A.ACCARDO
STATISTICA DESCRITTIVA - RAPPRESENTAZIONI - ANALITICHE ESPRIMONO LEGAMI FUNZIONALI/MODELLI INTEPRETATIVI - GRAFICHE DI DATI QUANTITATIVI, FORNISCONO: • una sintesi visiva delle caratteristiche fondamentali delle distribuzioni • impressioni percepite con maggiore facilità • meno particolari • una descrizione espressa mediante una interpretazione soggettiva ISTOGRAMMI, POLIGONI E TORTE SCATTER DIAGRAM (GRAFICO A PUNTI, PER 2 VARIABILI)

16 STATISTICA INFERENZIALE – A.ACCARDO
STATISTICA DESCRITTIVA - SINTESI DEI DATI VALORE MEDIO (o valore Atteso/Expected ~1750), ‘centro’ di una distribuzione, non è detto sia il più probabile! VARIANZA e DEVIAZIONE STANDARD, stime della ‘variabilità’ di un fenomeno misurata attraverso una variabile, misura la ‘dispersione’ intorno al valore medio MEDIANA, MODA, PERCENTILI, COEFF. VARIAZIONE, SKEWNESS, CURTOSI

17 STATISTICA INFERENZIALE – A.ACCARDO
STATISTICA INFERENZIALE, BASATA SULLA PROBABILITA’ CONCETTO DI PROBABILITA’ A PRIORI (Teorica): Basata sul concetto che la probabilità di un evento è il rapporto tra il numero di casi favorevoli ed il numero di casi possibili, purchè tutti i casi siano egualmente probabili! => limitazioni per la ricerca sperimentale (approccio empirico): per valutare una probabilità sarebbe necessario conoscere preventivamente le diverse probabilità dei vari eventi….

18 STATISTICA INFERENZIALE – A.ACCARDO
PROBABILITA’ A POSTERIORI (Frequentista o Statistica) : se in un insieme di prove la frequenza di un evento è all'incirca costante, questo valore di frequenza è assunto come probabilità • la probabilità di un evento, in una serie di prove condotte nelle stesse condizioni, è il limite a cui essa tende al crescere del numero delle osservazioni (principio di von Mises, 1920) => media campionaria Si applica in tutti quei casi in cui non sono note a priori le leggi dei fenomeni studiati, ma possono essere determinate a posteriori conducendo una serie di osservazioni/esperimenti, in condizioni controllate, per rilevare la frequenza relativa del fenomeno

19 STATISTICA INFERENZIALE – A.ACCARDO
GAUSSIANA 95%=1.96σ 99%=2.58σ

20 STATISTICA INFERENZIALE – A.ACCARDO
TEOREMA DEL LIMITE CENTRALE ( ) QUALUNQUE DISTRIBUZIONE DI VARIABILE CASUALE REGOLI IL FENOMENO IN ESAME, SE IL NUMERO DI OSSERVAZIONI TENDE AD INFINITO, ALLORA ESSA E’ RICONDUCIBILE AD UNA DISTRIBUZIONE NORMALE

21 STATISTICA INFERENZIALE – A.ACCARDO
PER CHI DESIDERA APPROFONDIRE…. Altre distribuzioni di probabilità: Binomiale Poisson T_Student χ2 Fisher

22 STATISTICA INFERENZIALE – A.ACCARDO
=> Gaussiana per n=>∞ => Gaussiana per λ>>0

23 STATISTICA INFERENZIALE – A.ACCARDO
La conduzione dell’indagine (o ESPERIMENTO) è un percorso articolato in 4 fasi: 1 - disegno sperimentale • osservazioni in natura e ripetizioni in laboratorio non raccolte ed attuate a caso, ma scelte e programmate in funzione della ricerca e delle ipotesi esplicative • chiarire a priori la formulazione dell'IPOTESI ESPLICATIVA (alternativa all'IPOTESI NULLA) Le eventuali differenze riscontrate dovranno essere imputate a FATTORI CAUSALI SPECIFICI oppure solamente a FATTORI CASUALI IGNOTI attribuibili alla naturale variabilità delle misure e del materiale utilizzato 2 - campionamento - raccogliere i dati in funzione dello scopo della ricerca - rispettare le caratteristiche della popolazione Da un numero limitato di dati –> conclusioni generali –> tutta la popolazione

24 STATISTICA INFERENZIALE – A.ACCARDO
3 - descrizione dei dati raccolti per verificare l'adeguatezza di: - disegno sperimentale - campionamento - analisi condotte - risultati conseguiti 4 - utilizzo dei tests (programmati nel disegno sperimentale e in funzione dei quali viene effettuato il campionamento) processo logico-matematico che, mediante il calcolo di probabilità, porta alla conclusione di non poter respingere oppure di dover respingere l'ipotesi nulla Soltanto con una corretta applicazione del campionamento e dei test di confronto statistico è possibile rispondere alla DOMANDA INFERENZIALE di verifica dell'ipotesi nulla: LE DIFFERENZE FRA LE OSSERVAZIONI EMPIRICHE SONO DOVUTE A FATTORI PURAMENTE CASUALI ?

25 STATISTICA INFERENZIALE – A.ACCARDO
Quale è la probabilità che, fra le alternative possibili, si presenti solo per fattori legati al caso, proprio la situazione descritta dai dati raccolti? - probabilità ‘alta’ (convenzionalmente => 5%) –––> fattori casuali - probabilità bassa (convenzionalmente < 5%) –––> fattori non casuali Analisi e conclusioni sono rese complesse fondamentalmente da tre aspetti: - errori nelle misurazioni: generati da strumenti e da differenti abilità degli sperimentatori - utilizzo di campioni: i dati utilizzati in una ricerca non sono mai identici a quelli rilevati nelle altre - fattori contingenti di disturbo: possono incidere in modo differente sul fenomeno indagato (es.: tempo, luogo, …)

26 STATISTICA INFERENZIALE – A.ACCARDO
INFERENZA STATISTICA Per effettuare uno studio non utilizzo tutta la popolazione d’interesse, ma limito lo studio ad un solo sottoinsieme, un CAMPIONE, per poi estendere i risultati a tutta la popolazione => INFERENZA Immaginiamo di avere a disposizione TUTTA la popolazione (di media 𝝁 e deviazione standard 𝝈) Estraendo dei campioni lo si può fare con 2 modalità: Esaustiva e Bernoulliana: Esaustiva: estraggo un campione di n soggetti, in modo casuale, misurando media 𝑚 𝑖 e deviazione standard 𝑠 𝑖 e non considero più i soggetti scelti Bernoulliana: estraggo ugualmente un campione di n soggetti casualmente, misuro media e dev. std, ma poi i soggetti possono essere riestratti nel successivo campione. Solitamente si utilizza l’estrazione Bernoulliana.

27 STATISTICA INFERENZIALE – A.ACCARDO
La distribuzione delle medie campionarie, in entrambe le estrazioni, 𝑚 𝑖 è GAUSSIANA, con media pari a 𝜇 (stimatore CORRETTO) varianza uguale a 𝜎 2 𝑛 per la Bernoulliana con n = numerosità del campione Se si considerasse la media delle mediane campionarie (ovvero dei singoli campioni), anche essa sarebbe pari a 𝜇 (anche la mediana è uno stimatore CORRETTO) mentre la varianza sarebbe maggiore per cui la media 𝒎 𝒊 rappresenta uno stimatore di 𝜇 più EFFICIENTE della mediana

28 STATISTICA INFERENZIALE – A.ACCARDO
STIMA PUNTUALE DELLA MEDIA (della popolazione) La eseguo tramite la media sul campione inserendo un errore della stima: 𝝁 =mi ± σ 𝒏 Stima CONSISTENTE, perché per n => ∞ l’errore => 0 Se σ (dev.standard della popolazione) è ignota allora useremo la dev. st. del campione, si, per stimarla: σ = si 𝒏−𝟏 Le stime puntuali sono affette da errore per cui spesso si usa stimare un intervallo entro il quale, con un prefissato livello di probabilità, cadrà il valore del parametro => INTERVALLO DI CONFIDENZA

29 STATISTICA INFERENZIALE – A.ACCARDO
STIMA DELLA MEDIA (della popolazione) PER INTERVALLI - INTERVALLO DI CONFIDENZA Dato α = probabilità che il valore vero cada fuori dell’intervallo individuato allora P = 1 – α = prob. che cada dentro = livello di confidenza (o p-value) Poiché la variabile campionaria è distribuita come una gaussiana la si può normalizzare: 𝒁 𝒊 = 𝒎 𝒊 −𝝁 𝝈 𝒏 e si può scrivere: Prob (− 𝒁 𝜶 𝟐 ≤ 𝒎 𝒊 −𝝁 𝝈 𝒏 ≤ 𝒁 𝜶 𝟐 ) = 1 – α da cui si ricava l’INTERVALLO DI CONFIDENZA: 𝝁 = 𝒎 𝒊 ± 𝒁 𝜶 𝟐 ∙ 𝝈 𝒏 nel quale la media µ è compresa con prob. pari a 1-α

30 STATISTICA INFERENZIALE – A.ACCARDO
± 𝒁 𝜶 𝟐 ∙ 𝝈 𝒏 rappresenta l’incertezza della stima = l’errore! da minimizzare: Aumentando n Selezionando α opportuna Selezionando un’altra variabile …… 1-α 𝒁 𝜶 𝟐 0.68 1 0.8 1.28 0.9 1.64 0.95 1.96 0.9544 2 0.99 2.58 0.9973 3 Se σ è ignota o n è ‘piccolo’ (<≈100) al suo posto utilizzerò Si (dev. st. del campione) e al posto della Gaussiana utilizzerò la t-Student (tα/2,n-1) per tener conto dell’ulteriore incertezza introdotta: 𝝁 = 𝒎 𝒊 ±tα/2,n−1∙ 𝑺𝒊 𝒏 Un discorso analogo vale se si utilizza una coda e non due

31 STATISTICA INFERENZIALE – A.ACCARDO
DIMENSIONE OTTIMA DEL CAMPIONE n Esistono diversi metodi per ottenere l’n che porti alla significatività dello studio statistico. A partire dall’intervallo di confidenza si definisce l’errore come: 𝐸= 𝑍 𝛼 2 ∙ 𝜎 𝑛 Fissato E (errore tollerato, espresso in termini percentuali, 2-3%), si avrà come sola incognita n, la numerosità del campione, ovvero: 𝒏= 𝒁 𝜶 𝟐 𝟐 ∙ 𝝈 𝟐 𝑬 𝟐 NB: Se 𝜎 non è disponibile (come succede nella maggior parte dei casi) estraggo un piccolo campione (~10) e cerco una sovrastima della deviazione standard in maniera molto approssimativa mediante la formula: 𝜎 = 𝑚𝑎𝑥−𝑚𝑖𝑛 4

32 STATISTICA INFERENZIALE – A.ACCARDO
PER CHI DESIDERA APPROFONDIRE…. Altman – Practical statistics for medical research Steel & Torrie – Principles and procedures of statistics Di Orio – Statistica medica


Scaricare ppt "Progetto Moduli Formativi A.A"

Presentazioni simili


Annunci Google