La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

MATEpristem Matematica in classe/4 – Probabilità e Statistica Frascati, 14-16 ottobre 2011 Che cosè la significatività statistica (amena conversazione.

Presentazioni simili


Presentazione sul tema: "MATEpristem Matematica in classe/4 – Probabilità e Statistica Frascati, 14-16 ottobre 2011 Che cosè la significatività statistica (amena conversazione."— Transcript della presentazione:

1 MATEpristem Matematica in classe/4 – Probabilità e Statistica Frascati, ottobre 2011 Che cosè la significatività statistica (amena conversazione su concetto e uso della significatività in statistica) Walter Racugno – Università di Cagliari

2 Ci sono tre tipi di menzogne: le bugie, le grandi bugie e le statistiche Benjamin Disraeli (GB, ) Mark Twain (US, )

3 La statistica Ma – ahimè! - non sempre il buon senso conduce a conclusioni sensate: un trattamento semplicistico dei dati può portare a risultati ingannevoli. La statistica matematica è buon senso tradotto in una struttura logica e in un linguaggio matematico capaci di dare coerenza logica e algoritmi di calcolo alla conoscenza parziale.

4 Significatività statistica (attraverso esempi) i tranci di pizza sono terapeutici per la varicella? il dramma del professore laffondamento del Titanic: naufragio di statistici il dimorfismo sessuale tassa sul lusso

5 La pizza cura le pustole della varicella? (da:T.E. Bradstreet – The American Statistician, 1996) Il piano di lavoro Tesi Ipotesi da verificare Piano sperimentale Variabili risposta Risultati Conclusione La pizza cura le pustole Dopo 5 giorni di trattamento con pizza i pazienti con pustole presentano una durata delle lesioni inferiore del 40% rispetto ai non trattati (controlli) Prove cliniche parallele, randomizzate Durata delle lesioni

6 La pizza cura le pustole della varicella? I dati sperimentali % 29% < 40% la differenza non è significativa (clinicamente) controllo pizza durata media

7 La pizza cura le pustole della varicella? Piano di lavoro, risultati e conclusioni TesiLa pizza cura le pustole Ipotesi da testare Dopo 5 giorni di trattamento con pizza i pazienti con pustole presentano una durata delle lesioni inferiore del 40% rispetto ai non trattati (controlli) Piano sperimentaleProve cliniche parallele, randomizzate Variabili rispostaDurata delle lesioni Risultati Conclusione Differenza clinica non significativa Non cè evidenza sperimentale a favore dellipotesi che la pizza abbia efficacia terapeutica nel trattamento delle pustole da varicella

8 Il dramma del professore (per spiegare la significatività statistica) Dramma aperto in VI atti e un epilogo Protagonisti: lo studente; il professore

9 Atto I (il contesto) Lo studente deve sostenere un esame Può essere preparato o non-preparato Atto II (lazione) Il professore deve compiere lazione: Atto III (la trama si sviluppa) Lo studente e il professore si incontrano Il prof non sa se lo studente è preparato o no (forse neppure lo studente lo sa!) Non potendo esplorare tutta la preparazione dello studente, il prof ha la possibilità di fare alcune domande (ad es. 5) Atto IV (il dilemma) Il professore pensa: quante risposte esatte dovrà darmi lo studente per convincermi dessere preparato? (Nota: professore buono=2 risposte su 5; severo =3 su 5; cattivo=4 su 5; terribile=5 su 5). Atto V (il fatto) Atto VI (il dramma del prof) Epilogo Lo studente risponde a 3 domande il prof lo promuove Lo studente risponde a meno di 3 domande il prof lo boccia Ha promosso un non-preparato? Ha bocciato un preparato? promuovere bocciare Il professore si rivolge al suo statistico di fiducia !

10 (per spiegare la significatività statistica) Studente Azioni Regola di decisione preparato non-preparato Stati di natura : preparato, : non-preparato promuovere bocciare spazio campionario promuoverebocciare rifiutoaccetto

11 preparatonon-preparato promuovo boccio … in sintesi

12 zona di rifiuto zona di accettazione valore di soglia

13 rifiuto e accetto accetto e rifiuto

14 = P(rifiutare quando è vera) = P(rifiuto| ) Nella teoria della verifica (test) dipotesi di Neyman-Pearson-Wald l ivello di significatività del test : livello d errore con cui siamo disposti a rifiutare l ipotesi. è usualmente molto piccolo : valori standard 0.05; 0.01; anche Jerzy Neyman, (1894 – 1981) Sir Ronald Aylmer Fisher, (1890 – 1962) Egon Sharpe Pearson, (1895 – 1980) Abraham Wald, (1902 – 1950)

15 Laffondamento del Titanic (S.M. Iacus, G. Masarotto – 2007, 2^ Ed.) …………………………. Nel suo rapporto ufficiale Lord Mersey il parlamentare incaricato dellinchiesta sul naufragio del Titanic (15 aprile 1912): Si era sospettato prima dellinizio dellindagine che i passeggeri di terza classe fossero stati trattati in modo discriminatorio … e che fu data precedenza ai passeggeri di prima e seconda classe … … lelevata proporzione di perdite non deve essere ricercata nella discriminazione dei passeggeri di terza classe. Essi non sono stati discriminati

16 Laffondamento del Titanic ClasseSessoEtàMortiSalvati 1 uomini bambini adulti donne bambini adulti uomini bambini adulti donne bambini adulti uomini bambini adulti donne bambini adulti crew uomini donne 320 totale

17 Laffondamento del Titanic Una prima domanda: è stata rispettata la legge marinara prima le donne e i bambini ? Salvati (%)N°. imbarcati bambini52 %109 donne74 %425 uomini20 % %2201

18 Laffondamento del Titanic Altra domanda: vi è una relazione tra sopravvissuti e classe di imbarco ? classe mortisalvati crew

19 classemortisalvati (38%) 203 (62%) (59%) 118 (41%) (75%) 178 (25%) (62%) 499 (38%) 1316 Laffondamento del Titanic vi è una relazione tra sopravvissuti e classe di imbarco ? classemortisalvati (62%) 123 (38%) (62%) 108 (38%) (62%) 268 (38%) (62%) 499 (38%) 1316 Tabella realeTabella ideale

20 Laffondamento del Titanic distanza tra tabella reale e tabella ideale (con variabili indipendenti: ) confronto tra proporzioni o percentuali ipotesi : la differenza è dovuta al caso Accettare o rifiutare lipotesi Test Chi-quadrato rifiuto accetto distanza chi-quadro

21 Laffondamento del Titanic distanza tra tabella reale e tabella ideale (con variabili indipendenti: ) rifiuto accetto distanza chi-quadro I dati rilevati non forniscono unevidenza sperimentale per poter rifiutare lipotesi : la distanza della tabella reale dalla tabella ideale non è statisticamente significativa al livello = In altri termini: la differenza è attribuibile al caso e non a un errore sistematico

22 … ma …

23 Laffondamento del Titanic (A. Farcomeni – Convegno SIS, Venezia 6-8 settembre 2007) NOTA Le interazioni tra fattori (variabili) possono essere considerate come ulteriori fattori: esplicativi delleffetto di interesse. Es. tabella: fattore di riga fattore di colonna fattore di cella (interazione tra riga e colonna) tabelle a più di due dimensioni (vedi Titanic )

24 Come modellizzare linterazione Problema Descrivere il numero ( y ) di volte in cui un gruppo di pazienti visita annualmente il proprio medico di base, in dipendenza delletà ( ). n° visite età parametri Esempio Modello1

25 Come modellizzare linterazione età n° visite a Domanda: oltre letà, il sesso ha qualche influenza sul n° di visite?

26 Come modellizzare linterazione età n° visite a Modello 2 = 0 uomo = 1 donna a+c c = influenza del sesso sul n° visite NOTA: non cè interazione tra gli effetti delletà e del sesso leffetto del sesso è uguale per tutte le età!

27 Come modellizare linterazione Domanda: come esprimere algebricamente che le due rette (uomo-donna) non sono parallele? Risposta: creiamo una nuova variabile interazione = età-sesso Modello 3 uomo donna

28 Come modellizzare linterazione età n° visite a a+c d = effetto età-sesso sul n° visite NOTA: il modello considera leffetto di ciascuna variabile (età, sesso) e della loro interazione il n° delle visite dipende dalletà e dal sesso ma NON con uguale intensità!

29 Laffondamento del Titanic Nella prima analisi che abbiamo visto sono state considerate soltanto interazioni del secondo ordine: tra la variabile (fattore) Classe e la variabile Sopravvivenza (morti/salvati) si è visto che linterazione non è statisticamente significativa (mentre cè evidenza nelle interazioni di Sopravvivenza con Sesso e con Età) Con un modello più complesso che considera anche le interazioni del terzo ordine, sono risultate statisticamente significative le interazioni - Class:Sex:Age - Class:Sex:Survived - Class:Age:Survived

30 … morale

31 Il dimorfismo sessuale Il problema antropologico statistico Consideriamo due variabili X e Y che rappresentano una stessa dimensione antropometrica relativa ai due sessi. In letteratura è spesso considerata soltanto la diversit à tra i valori medi (dimorfismo di media)

32 Il dimorfismo sessuale La variabilità intrasesso può alterare il dimorfismo di media: a parità di distanza tra medie, una minore [maggiore] variabilità intrasesso determina un aumento [diminuzione] del dimorfismo

33 La variabilità intrasesso è dunque anch essa una componente del dimorfismo: dimorfismo di dispersione, (Marini, Racugno et al. 2005, 2007). Esempio (a parità di medie): Il dimorfismo sessuale

34 Due problemi: 1 – di natura antropologica 2 – di natura statistica 1.Dimorfismo di media; di variabilità; di asimmetria; di … altre componenti? 2.Rilevazione della presenza di dimorfismo; individuazione e stima delle differenze; misura dellevidenza; costruzione di statistiche in presenza di modelli e non. Il dimorfismo sessuale

35 Obiettivi: 1.Proporre una visione globale del dimorfismo sessuale nei caratteri metrici. Evidenziarne le varie forme di espressione (componenti). Sviluppare considerazioni sintetiche sulla sua natura nelle diverse tipologie di variabili antropometriche. 2.Considerare l intero contenuto informativo delle due (, ) distribuzioni campionarie di frequenza per ciascuna variabile antropometrica. Costruire procedure di analisi statistica per l applicazione dei test di confronto. Il dimorfismo sessuale

36 Tassa sul lusso Art. 4 L.R. 4/2006 (imposta sulla nautica) La politica Larticolo 4 della L.R. n. 4 del 2006 ha istituito unimposta regionale sulle unità da diporto di lunghezza maggiore o uguale a 14 mt., (scali tra il 1° giugno e il 30 settembre nei porti del territorio regionale). Domanda Limposta causa effetti negativi sullo scalo di unità da diporto nei porti sardi? Stime errate Stime ottenute confrontando gli scali osservati nel 2006 con quelli osservati nellanno precedente. Definizione di effetto Leffetto dellimposta sugli scali è la differenza tra il numero di scali osservati nel 2006 e il numero che avremmo osservato nello stesso periodo del 2005, in assenza dellimposta.

37 Tassa sul lusso Dati disponibili 56 gestori che possono accogliere barche oltre i 14 mt posti barca da 16 gestori non è stato possibile avere dati (15%) dei 40 gestori, 33 hanno collaborato, 19 hanno fornito dati completi Si sono analizzati i dati relativi a 57% dei posti barca (6926) per un totale di 5065 scali (il 77% di cui si è avuta notizia). Tra il 2005 e il 2006 si è verificata una riduzione del numero di scali pari al 15%: 18% di barche soggette a imposta; 8% non soggette. In particolare una riduzione del 20% delle barche tra 12 e 13 mt (NON assoggettate).

38 Tassa sul lusso Aspetti critici

39 Tassa sul lusso Aspetti critici

40 Infine la rondine … la primavera … … il reverendo Thomas Bayes … … sillogismi

41 La colpa di In una classe, alcuni studenti lamentano il malfunzionamento di WORD. Una parte degli studenti usa WINDOWS 2000, unaltra parte XP. Domanda: XP ha qualche colpa?

42 La colpa di I dati il 60% usa XP (il 40% altro!) il 20% ha problemi con WORD il 75% di coloro che hanno problemi usa XP malebene TOT TOT. No XP XP , Linformazione aggiuntiva sapendo che usano XP fa passare la probabilità da 0.20 a 0.25

43 Il reverendo e … la rondine Teorema di Bayes (1702 – 1761) Dove si vede che – ovviamente! -

44 Sillogismi (1) Domanda: Qual è la probabilità che WR sia un alieno?

45 Sillogismi (2) Domanda: Qual è la probabilità che WR sia un bandito?

46 Risposta: Alieno no, ma bandito un po sì (ma poco!!)


Scaricare ppt "MATEpristem Matematica in classe/4 – Probabilità e Statistica Frascati, 14-16 ottobre 2011 Che cosè la significatività statistica (amena conversazione."

Presentazioni simili


Annunci Google