La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Certo…anzi probabile. Atto di nascita: 1733 fu introdotta nella teoria della probabilità da Abraham De Moivre come approssimazione della distribuzione.

Presentazioni simili


Presentazione sul tema: "Certo…anzi probabile. Atto di nascita: 1733 fu introdotta nella teoria della probabilità da Abraham De Moivre come approssimazione della distribuzione."— Transcript della presentazione:

1 certo…anzi probabile

2 Atto di nascita: 1733 fu introdotta nella teoria della probabilità da Abraham De Moivre come approssimazione della distribuzione binomiale media µ

3 Distribuzione binomiale Sia dato un evento E di probabilità p(E)=0,47 si fanno 10 prove e si calcola la probabilità che levento E si verifiche 0 volte, 1 volta, 2 volte, ….10 volte n. successiprobabilità 00, , , , , , , , , , ,

4 n. successiprobabilità 03,05856E-06 15,42462E-05 20, , , , , , , , , , , , , , , , ,68447E ,23972E ,76667E-07 P(E) = 0,47 n= numero delle prove = 20

5 n. successiprobabilità 01,63604E-14 17,25413E-13 21,57606E-11 32,23623E-10 42,3301E-09 51,90101E-08 61,26435E-07 77,04766E-07 83,35927E-06 91,39019E ,05452E , , , , , , , , , , , , , , , , , , , , , , , , , , ,81184E ,06655E ,63878E ,37512E ,97425E ,65188E ,32474E ,31554E ,55548E ,49934E ,13157E ,2717E ,27008E ,02618E-17

6 La curva fu poi ripresa in un ambito matematico diverso da Carl Friedrich Gauss ( ) tanto che oggi è ricordata come curva di Gauss o curva degli errori. Gauss la descrisse come distribuzione delle misure atte a determinare la posizione degli astri.

7 Riportiamo sullasse orizzontale le misure di una certa grandezza fatte con uno strumento di precisione e sullasse verticale la frequenza con cui si sono verificate queste misure. Media = valore della misura

8 Quello che è eccezionale è che la curva gi Gauss caratterizza anche la distribuzione delle principali grandezze antropometriche di una popolazione di individui, come il peso, laltezza ecc… In questo grafico ad esempio in ascissa sono riportati i pesi di bambini nati da gravidanze singole nel 1991 negli Stati Uniti e in ordinate il numero dei neonati aventi un determinato peso. Le informazioni sono state raccolte utilizzando i certificati di nascita. Il valore del peso centrale che è la moda è anche la media dei pesi.

9 Uno dei primi che nei suoi lavori fece grande uso della curva di Gauss fu Adolphe Quételet che è ritenuto uno dei padri della statistica sociale. La statistica nasce attorno alla seconda metà del Seicento con il nome di ARITMETICA SOCIALE o CALCOLO SOCIALE o SCIENZA NUMERICA DELLA SOCIETA e DEGLI STATI. Si studiavano mediante indagini statistiche eventi naturali come le nascite, le morti, ma anche gli atti volontari come i matrimoni, i crimini e i suicidi. Tutto ciò per la promozione di una politica statale più informata e quindi più efficace. Di qui probabilmente il nome di Statistica, i suoi praticanti furono chiamati statisti e verso la fine del XIX secolo statistici. La Statistica si sviluppa poi in modo particolare nel corso dellOttocento appunto con Quételet. Ma le basi della statistica matematica moderna furono poste tra il 1890 e il Fra i fondatori della moderna statistica matematica ricordiamo Pearson, Spearman, Yule, Gosset, Fisher.

10 Astronomo, matematico interlocutore di matematici illustri come Fourier, Poisson, Laplace, è indubbiamente la figura più importante nello sviluppo della statistica scientifica. Cerca di portare in Statistica il rigore dei metodi usati in astronomia e limpiego sistematico della matematica. Nel 1834 fonda la Statistical Society di Londra. Per Quételet la matematica avrebbe dato un ordine allapparente caos sociale, nel senso che – pensava - in campo sociale esistono delle leggi come nel mondo naturale che possono essere scoperte con la statistica. Per lui la statistica divenne una Physique sociale. Adolphe Quételet (Gand Bruxelles 1874)

11 Ad esempio Quételet si occupò di eventi come il crimine e il suicidio e scoprì che lattività criminale variava di poco di anno in anno. E a proposito di tale regolarità Quételet osservava: essa ci insegna che lazione delluomo è limitata in tale ambito e che le grandi leggi della natura sono per sempre al di fuori della sua influenza; essa dimostra inoltre che nel mondo morale possono esistere delle leggi di conservazione allo stesso modo in cui si trovano nel mondo fisico. Sulla base delle leggi sociali scoperte la società era vista come unentità a se stante, indipendente dai capricci e dalle idiosincrasie degli individui che la costituiscono. Ci sono delle leggi sociali ineluttabili per quanto possa sembrare diverso ed irrazionale il comportamento dei singoli uomini. Cè una regolarità collettiva.

12 Questa visione della ineluttabilità delle leggi sociali diventa visione filosofica e in campo politico costituisce anche il fondamento della politica liberale del laissez faire: dato che la società era governata da leggi statistiche il suo governo si doveva limitare ad un ruolo ancillare, lo Stato doveva solo favorire e assecondare la naturale evoluzione sociale. Luomo può essere considerato un enigma solo come individuo, come massa è un problema matematico.

13 L homme moyen Nellultimo periodo del suo lavoro Quételet elabora il concetto di homme moyen. Questo essere astratto definito nei termini della media di tutte le sue qualità umane in un determinato paese costituiva il tipo nazionale rappresentativo della società nella scienza sociale analogo al baricentro in fisica. I calcoli relativi a lhomme moyen physique non poneva particolari problemi in quanto si trattava di misurare le altezze, i pesi, le dimensione delle membra e dei vari organi e di farne poi la media. Maggiori ostacoli presentava invece la definizione dell homme moyen moral perché non si poteva misurare il coraggio, la criminalità e i buoni sentimenti. Lo stesso risultato si poteva ottenere registrando gli atti coraggiosi o criminali dellintera società e quindi si poteva attribuire alluomo medio una tendenza al crimine equale al numero dei delitti commessi diviso il numero della popolazione. In questo modo un insieme di atti separati commessi dai singoli individui veniva trasformato in una grandezza costante, la propensione che era attribuita alluomo medio.

14 Per determinare le caratteristiche delluomo medio Quételet fece una serie di esperimenti in cui usò la curva a campana di Gauss. Infatti dimostrò che i caratteri antropometrici come il peso, laltezza, la lunghezza degli arti ecc.. Hanno una distribuzione gaussiana

15 Quételet misurò le circonferenza toraciche di 5738 soldati scozzesi e le raggruppò in intervalli di ampiezza un pollice,ottenendo sedici gruppi. Quételet osservò che la distribuzione delle frequenze approssimava la distribuzione gaussiana. Quételet concluse che se le misurazioni delle circonferenze toraciche si comportavano nel modo indicato dalla teoria degli errori di Gauss, allora le misure delle circonferenze toraciche dei soldati potevano essere interpretate come repliche sottoposte a errori di misurazioni della misura toracica delluomo medio. La stessa cosa vale per il peso, laltezza ecc..

16 µ= media σ x y In ascissa x: valori di una variabile In ordinata y: i valori della densità di probabilità della x deviazione standard I valori di µ e di σ individuano perfettamente la curva

17 Statura (cm) frequenzaFrequenza Relativa (probabilità p) ( ] 50,05 ( ] 90,09 ( ] 200,20 ( ] 320,32 ( ] 200,20 ( ] 90,09 ( ] 50,05 totale1001,00 Le probabilità p sono le aree dei rettangoli, le altezze h dei rettangoli sono le densità di probabilità: h x= area=p probabilità h= densità di probabilità x= 10

18 Al tendere a 0 di x listogramma diventa la curva a campana che ha quindi in ascissa x i valori delle altezze e in ordinate y i valori della densità di probabilità. x y x 1 x 2 Probabilità di trovare individui di altezza compresa fra x 1 e x 2

19 µ= media σ x y In ascissa x: valori di una variabile In ordinata y: i valori della densità di probabilità della x

20 Il problema della stima della media o di una proporzione di una popolazione - Indagine completa - Indagine campionaria: la inferenza statistica -Teorema del limite centrale: sia data una popolazione la cui media sia µ (e la cui proporzione sia P). Estraiamo da essa tutti i possibili campioni di dimensione n (grandi campioni con n30) e di ogni campione calcoliamo la media m (o la frequenza f). Otteniamo una distribuzione di medie campionarie (o di proporzioni campionarie). -Esempio se la popolazione ha dimensione N=10 e n= 2 allora i campioni sono 45 -Se N = 100 e n= 10 allora i campioni sono 1,

21 Sia la popolazione costituita da 4 elementi a, b, c, d Tutti i possibili campioni di dimensione 2 sarebbe costituito da: a, b a, c b, c b, d c, d

22 Valgono i seguenti risultati: 1)tali distribuzioni sono gaussiane 2)la media delle medie campionarie coincide con la media µ della popolazione 3)la media delle frequenze campionarie coincide con la proporzione P della popolazione 4)La deviazione standard della distribuzione delle medie campionarie è dove σ è la deviazione standard della popolazione. 5)La deviazione standard della distribuzione delle frequenze campionarie è dove P è la Proporzione della popolazione.

23 Medie campionarie Densità di frequenza delle medie campionarie 95% Media della popolazione

24 Un ingegnere addetto al controllo di quantità vuole stimare il peso medio di una scatola di cereali riempita da una certa macchina in un certo giorno. Estrae un campione casuale di 100 scatole ne calcola la media campionaria m = 300,5 grammi e la deviazione standard s= 15 grammi. dove σ è la deviazione standard della popolazione e n la dimensione del campione. Lintervallo di confidenza al 95% è [300,5 –(1,96)(1,5);300,5+(1,96)(1,5)] cioè (297,56;303,44) Livello di fiducia

25 La media campionaria m proviene dalle code del 5% della distribuzione delle medie campionarie, così lintervallo di confidenza al 95% non contiene la media della popolazione.

26 - Una stima è tanto più precisa quanto più piccolo è lintervallo di confidenza - È tanto più affidabile quanto maggiore è il livello di fiducia - Da notare che mantenendo costante la dimensione del campione, aumentando il livello di fiducia aumenta anche lintervallo di confidenza, cioè aumentando lattendibilità della stima diminuisce la sua precisione.

27 -Tuttavia si può conciliare laumento dellattendibilità con laumento della precisone o a precisione invariata, aumentando la dimensione del campione. Infatti allaumentare della dimensione del campione diminuisce la deviazione standard della distribuzione che si concentra maggiormente attorno alla media

28 Dimensione del campione n= 250 dimensione del campione n=100

29 La verifica delle ipotesi, i test di significatività Il nostro ingegnere potrebbe procedere in modo diverso per vedere se la produzione procede sotto controllo. Supponiamo che lazienda dichiari di produrre scatole di cereali del peso di 300 grammi, per cui la produzione sarà sotto controllo se la media è 300 grammi. Si tratta di verificare questa ipotesi al livello di fiducia del 95%. H 0 : µ = 300 si dice ipotesi nulla, lipotesi alternativa H 1 : µ 300. Ogni giorno per sapere se la produzione è sotto controllo lingegnere estrae a caso un campione di 100 scatole, ne calcola il peso medio m e la deviazione standard s Supponiamo che la media del campione sia 303 grammi. Si pone il problema seguente: La differenza 3 grammi rientra nella normale variabilità campionaria oppure è significativa del fatto che in realtà stiamo producendo scatole di peso medio superiore a 300 grammi?

30 σ è la deviazione standard della popolazione ed è stimata dalla deviazione standard del campione. Lintervallo verde indica la zona di accettazione dellipotesi nulla. Le semirette rosse indicano la zona del rifiuto dellipotesi nulla. Zona accettazione Zona rifiuto

31 P=0,95 si dice livello di fiducia α = 0,05 = 1-p = 1-0,95 = area delle due code si dice livello di significatività. α/2=2,5% P=95%

32 Ogni decisione che si prende è soggetta ad un errore, si hanno due tipi di errori: 1.Si rifiuta H 0 quando è vera. Lerrore si commette quando la media campionaria m cade nella zona di rifiuto. La probabilità dellerrore è α. Lerrore si dice di1° specie 2.Si accetta H 0 quando è falsa. Si dice che si commette un errore β di 2° specie Si prendono invece decisioni giuste quando 1.Si accetta H 0 quando è vera (La probabilità è il livello di fiducia p) 2.Si rifiuta H o quando è falsa (La probabilità è 1- β che è detta potenza del test).

33 E chiaro che la cosa migliore sarebbe costruire un test in modo da rendere minime le probabilità degli errori α e β, ma vediamo se ciò è possibile. E più agevole discutere la cosa nel caso in cui le ipotesi alternative siano 2. Supponiamo che due persone A e B stiano giocando ai dadi con la regola che A perde ogni volta che esce la faccia 1. supponiamo che in 100 lanci la faccia 1 si sia presentata 27 volte, per cui A ha perso con una frequenza pari a 0,27. Considerato che la probabilità che esca 1 è 0,167, A sospetta che B stia giocando con un dado truccato, magari con uno di quei dadi in cui 1 esce con probabilità 0,25. E possibile sottoporre a verifica tale sospetto?

34 Le ipotesi in conflitto sono: 1.Ipotesi nulla H 0 : p=0,167 il dado non è truccato 2.Ipotesi alternativa H 1 : p= 0,25, il dado è truccato Si deve assumere una regola di decisone che potrebbe essere la seguente: Se dopo una serie di 100 lanci la frequenza con cui esce 1 è f< 0,20 allora si accetta H 0, altrimenti si accetta H 1. La situazione per quanto riguarda gli errori di 1° e di 2° specie è allora la seguente.

35 Distribuzione delle frequenze campionarie di campioni di 100 lanci Zona rifiuto Zona accettazione

36 Aumentando la dimensione dei campioni è possibile diminuire sia α sia β

37 Esempio in campo giudiziario Limpossibilità di diminuire contemporaneamente α e β a parità di dimensione del campione è chiarita bene dal seguente esempio in campo giudiziario. Sia H 0 : limputato è innocente H 1 : limputato è colpevole α= errore di 1° specie, è la probabilità di condannare un innocente cioè la probabilità di rifiutare H 0 e quindi accettare H 1 quando H 0 è vera β = errore di 2° specie, è la probabilità di assolvere un colpevole cioè la probabilità di accettare H 0 (limputato è innocente) quando invece è vera H 1 cioè limputato è colpevole. Le riforme a carattere garantista che vogliono diminuire il rischio di condannare un innocente (α) portano necessariamente al rischio di aumentare β cioè ad aumentare il rischio di assolvere un colpevole.

38 Il T test Caso dellefficacia di un medicinale (ad esempio per abbassare la pressione) Pressione sistolica PazientePlacebomedicinaleDifferenze d

39 Si calcola la media delle differenze e si ottiene m= 24,1 e la deviazione standard delle differenze = 13,15 Lipotesi che vogliamo verificare è che tale differenza sia nulla, che corrisponde alla ipotesi della inefficacia del medicinale. Vogliamo verificare tale ipotesi al livello di significatività del 5%. H 0 : µ=0 H 1 : µ>0 In questo caso, dato che il campione è piccolo (<30), si adopera non la distribuzione gaussiana ma unaltra (la t di Student) che lapprossima.

40 Nel 1654 il cavalier Antonio de Méré si rivolse a Blaise Pascal per sapere perché mai puntando sulluscita del 6 nel gioco del dado, in 4 lanci la pratica del gioco rendeva evidente che fosse più facile vincere che perdere mentre puntando sulluscita del doppio 6 su 24 lanci di due dadi fosse viceversa più facile perdere che vincere. Secondo i calcoli che faceva Antonio de Méré avrebbe dovuto succedere il contrario. La risposta che diede Pascal fu molto semplice: fai bene i calcoli e vedrai che la teoria conferma la pratica. Agli inizi della probabilità Infatti nel primo caso si perde se nei 4 lanci esce sempre un numero diverso da 6. La probabilità di perdere è quindi 5/6*5/6*5/6*5/6= (5/6) 4 = 0,483 che è minore della probabilità di vincere che è 1-(5/6) 4 =0,517. Nel caso di 24 lanci di due dadi si perde se in ogni lancio non esce il doppio 6. La probabilità che nei 24 lanci non esca mai il doppio 6 è: (35/36) 24 =0,508 per cui la probabilità di vincere è 1-0,508=0,492 che è minore della probabilità di perdere.

41 E con Pierre-Simon Laplace che la probabilità cessa di essere una curiosità matematica. I lavori che Laplace pubblicò a partire dal 1794, in particolare la Théorie analitique des probabilités del 1812 trasformarono una serie di problemi legati principalmente ai giochi dazzardo e alle rendite vitalizie delle assicurazioni nella teoria classica della probabilità che divenne una disciplina scientifica davanguardia. E interessante illustrare le motivazioni che spingono Laplace a questa fatica. Laplace era un convinto sostenitore di una visione meccanicistica e deterministica del mondo, che secondo lui era regolato da ferree leggi esprimibili in termini matematici.

42 Scrive nel celeberrimo Essai philosophique sur les probabilités pubblicato nel 1814 e a partire dalla seconda edizione, premesso come introduzione alla Théorie: Dobbiamo dunque considerare lo stato presente delluniverso come leffetto del suo stato anteriore e come la causa del suo stato futuro. UnIntelligenza che, per un dato istante, conoscesse tutte le forze da cui è animata la natura e la situazione rispettiva degli esseri che la compongono, se per di più fosse abbastanza profonda da sottomettere questi dati allanalisi, abbraccerebbe nella stessa formula i movimenti dei più grandi corpi delluniverso e dellatomo più leggero: nulla sarebbe incerto per essa, e lavvenire come il passato sarebbe presente ai suoi occhi. Lo spirito umano offre, nella perfezione che ha saputo dare allastronomia, un pallido esempio di questintelligenza. Le sue scoperte in meccanica e in geometria, unite a quelle della gravitazione universale, lhanno messo in grado di abbracciare nelle stesse espressioni analitiche gli stati passati e quelli futuri del sistema del mondo.

43 Ma il punto è che luomo è ben lontano dalle capacità dellIntelligenza da lui immaginata. Infatti poco oltre Laplace afferma: La regolarità che lastronomia ci presenta nel movimento delle comete, ha luogo senza dubbio in tutti i fenomeni. La curva descritta da una semplice molecola di aria o di vapore è regolata con la stessa certezza delle orbite planetarie: non vè tra esse nessuna differenza, se non quella che vi pone la nostra ignoranza. La probabilità è relativa in parte a questa ignoranza, in parte alle nostre conoscenze. Secondo Laplace luomo non è lIntelligenza che lui si è figurato e pertanto molte volte non è in grado né di conoscere tutte le forze di cui la natura è animata, né le posizioni delle particelle che la compongono, né infine, conoscendo tanto le une quanto le altre, di sottoporre allanalisi matematica i dati in suo possesso. In questi casi si deve ricorrere alla probabilità. Quindi alla base della probabilità troviamo la nostra ignoranza.

44 Definizione classica o laplaciana di Probabilità Sia E un evento, siano n i casi possibili e m quelli favorevoli ad esso, allora P(E) = m/n. La definizione è valida nellipotesi che tutti i casi possibili siano ritenuti egualmente possibili. Esempio: Probabilità che lanciando un dado non truccato esca il numero 6 è 1/6 in quanto i casi possibili sono 6 e quelli favorevoli allevento sono 1. Per tutto lOttocento la definizione di probabilità fu quella classica di Laplace, tuttavia a partire dagli ultimi anni dellOttocento specie in fisica e in Biologia gli esempi di eventi per i quali si doveva ricorrere alle osservazioni per determinare le probabilità si andavano moltiplicandosi.

45 Definizione frequentista o statistica di probabilità Frequenza assoluta: numero delle volte che un evento si verifica. Es: lancio il dado 10 volte, il numero 6 si verifica 3 volte. 3 è la frequenza assoluta di 6 Frequenza relativa: è il rapporto fra la frequenza assoluta e il numero delle prove fatte. Nellesempio precedente: la frequenza relativa di uscita di 6 è 3/10 = 0,3 La probabilità di un evento in senso frequentista è il limite al quale tende la frequenza relativa quando il numero delle prove tende allinfinito oppure la probabilità di un attributo in una certa popolazione è il limite al quale tende la frequenza relativa dellattributo quando la frequenza è calcolata su campioni estratti dalla popolazione di grandezza via via crescente e tendente allinfinito.

46 Tuttavia perché la definizione sia valida occorre che levento sia ripetibile e le singole prove sia indipendenti o che i campioni via via usati siano casuali cioè tali che i componenti abbiano tutti la stessa probabilità di essere estratti. Esempio: supponiamo di lanciare un dado un gran numero di volte, diciamo mille, e di constatare che il 2 si è presentato 173 volte, per cui 173/1000=0,173 è la frequenza relativa delluscita del numero 2. Proseguendo nei lanci la frequenza relativa assumerà valori diversi ma tenderà a stabilizzarsi attorno ad un certo valore che viene assunto come valore della probabilità dellevento. Lesperienza ci mostra che in tutti i fenomeni di massa la frequenza relativa di un certo attributo si stabilizza al crescere del numero delle osservazioni ed è proprio questo fatto che in qualche modo giustifica la definizione frequentista di probabilità.

47 Un ponte fra le definizione di probabilità in senso classico e in senso frequentista fu gettato agli inizi del Novecento da Guido Castelnuovo che nel suo Calcolo delle probabilità del 1919 introdusse la famosa legge empirica del caso che dice: In una serie di prove ripetute un gran numero di volte e nelle stesse condizioni, ciascuno degli eventi possibili si manifesta con una frequenza relativa che è presso a poco uguale alla sua probabilità. Lapprossimazione cresce ordinariamente col crescere del numero delle prove.

48 Esempio di simulazione al computer del lancio di un dado. Frequenza con cui si presenta il numero 3 al crescere del numero dei lanci. Probabilità classica di uscita di 3 = 1/6 = 0, Un contributo determinante alla formulazione di questa definizione fu data da Richard von Mises tedesco che pubblicò un trattato sulla probabilità dal titolo impronunciabile nel n. Lanci Frequenza assoluta Frequenza relativa 0, , , , , , , , , , , , , , , , ,165700

49 MATEMATICA ATTUARIALE Le aziende per testare la vita media dei loro prodotti, per esempio lampadine e frigoriferi, eseguono dei test di durata; vale a dire che scelgono un campione casuale della loro produzione e li fanno funzionare finché non si guastano. In questo modo se 100 lampadine scelte a caso da una produzione sono accese in media 60 ore (si registra la vita di ogni lampadina e poi si fa la media) possiamo dire che la vita media di una lampadina di quel tipo è di 60 ore (in realtà si fa una stima per intervalli). In matematica attuariale e per le molte applicazioni nel campo delle assicurazioni ha molta importanza stabilire quale sia la vita media di un individuo di età x oppure sapere quale è la probabilità che un individuo che oggi ha 40 anni possa vivere ancora 20 anni. E chiaro che per calcolare la vita media delle persone non si può seguire il metodo delle lampadine cioè scegliere 100 individui e poi seguirli finché non muoiono tutti. Sarebbe troppo lungo. Queste valutazioni si fanno ricorrendo alle tavole demografiche o tavole di sopravvivenza.

50 La prima rudimentale ma interessante tavola di sopravvivenza risale alla prima metà del XVII secolo e fu composta dallinglese J. Graunt che reperì i dati dai registri parrocchiali. Un tretennio più tardi lastronomo inglese Edmund Halley ( ) compilò una tavola simile sempre basandosi sui registri parrocchiali. Da allora applicando i metodi della statistica e del calcolo delle probabilità si sono potute costruire tavole demografiche sempre più precise ed affidabili basandosi essenzialmente su due tipi di osservazioni, diverse ma complementari: i dati dei censimenti e quelli dei decessi. In Italia si occupa della compilazione delle tavole lIstituto di Statistica (Istat). Dai censimenti che nel nostro paese vengono fatti ogni 10 anni, si possono estrarre i dati relativi ai viventi suddivisi per età e sesso. Rilevando invece per un certo numero di anni i dati sui decessi dai registri dello stato civile, si possono ricavare informazioni sul numero medio dei morti, suddivisi per fasce di età. Si costruiscono quindi delle tavole che anno per anno indicano quante persone sono sopravvissute rispetto ad un nucleo iniziale e quante quindi sono decedute. E importante avvalersi di tavole aggiornate perché al cambiare delle condizioni di vita cambiano le probabilità di vita e di morte.

51 d x = l x - l x+1. Descrizione delle tavole

52 Si può vedere che l x ( il numero dei sopravvissuti) è una funzione decrescente delletà, (ovviamente man mano che passa il tempo il numero dei vivi diminuisce, qualcuno muore) ma prima fino a circa 60 anni decresce lentamente poi in maniera più rapida. Dal grafico di d x si vede che il numero dei morti diminuisce abbastanza rapidamente nei primi anni di vita poi a partire da 10 anni circa comincia ad aumentare fino a 80 anni poi diminuisce rapidamente fino alletà estrema.

53 Alcune probabilità di vita e di morte calcolate in base alla definizione frequentista di probabilità. Tasso annuo di sopravvivenza, cioè la probabilità che un individuo di età x arrivi alletà x+1. Esempio: probabilità che un individuo maschio di 60 anni arrivi a 61 Probabilità che un individuo di 80 anni arrivi a 81

54 Tasso annuo di mortalità, cioè la probabilità che un individuo di età x muoia prima di compiere letà x+1 Esempio: probabilità che una persona di 20 anni muoia prima di compiere 21 anni.

55 Probabilità di essere in vita dopo h anni Esempio: probabilità che un individuo maschio di 39 anni arrivi alletà di 59 anni.

56 Vita media È il tempo medio di vita residua che ha una persona di età x. Si calcola nel modo seguente: sia l x il numero delle persone di età x, d x è il numero delle persone di questo gruppo che moriranno entro lanno, si può pensare che ognuna di queste persone vivranno in medio ½ di anno. Le persone che moriranno lanno successivo cioè alletà x+1 sono d x+1, si può pensare che ognuno di essi abbia vissuto un anno e mezzo cioè 3/2 di anno. Le persone che moriranno alletà x+2 sono d x+2 e si può pensare che ognuno di essi abbai vissuto 2 anni e mezzo cioè 5/2 di anno. E così via. In conclusione in questo modo abbiamo calcolato la vita media di ogni individuo del gruppo iniziale. La vita media di un individuo di età x sarà la media ponderata delle vite medie di tutto il gruppo dei viventi alletà x, cioè: vita media età x = Esempio La vita media di un maschio di 60 anni è

57 Vita probabile La vita probabile di un individuo di età x è il numero di anni che devono trascorrere affinché la popolazione dei viventi alletà x diventi la metà. Essa viene indicata con il simbolo π x. Allora π x si trova risolvendo lequazione l x+πx = ½ l x Ad esempio Dalle tavole risulta che il numero dei viventi maschi alletà di 50 è l 50 = Essi diventano la metà (cioè 46508) quando il gruppo ha unetà compresa fra 78 e 79 per cui si può dire che la vita media è circa = 28

58 Calcolo del premio di una assicurazione di capitale differito. Una persona di età x riscuote un certo capitale C se sarà vivo alletà x+n. Quale premio deve pagare? Ad esempio una persona di 30 anni vuole che la Compagnia di assicurazione gli versi la somma di se sarà in vita alletà di 60 anni. Il premio può essere: A)Unico o periodico B)Puro o caricato

59 Calcolo del premio unico puro Si interpreta il contratto come un gioco di sorte, in cui lassicurato vince la somma C se arriva vivo alletà x+n, e paga per giocare il premio U. Che cosa è la vincita attesa? È il prodotto della somma da vincere per la probabilità di vincerla Il premio è puro se il gioco di sorte è equo cioè la vincita attesa del banco e del giocatore sono uguali..

60 La vincita del banco (in questo caso la Compagnia di Assicurazione) è certa perché egli riscuote oggi con certezza il premio U. Quindi la vincita attesa del banco è U*1 = U La vincita attesa dellassicurato e la somma che riscuoterà fra n anni valutata ad oggi ( C(1+i) -n dove i è il tasso tecnico delloperazione) moltiplicata per la probabilità che egli sia in vita fra n anni. Quindi la vincita attesa dellassicurato è: Quindi il premio puro da pagare sarà U=

61 Nel nostro esempio C= , i = 0,02, x =30, n = 30

62 Teorema di Bayes Thomas Bayes ( ) matematico e ministro britannico. Il teorema fu pubblicato postumo nel Supponiamo che un evento E possa essere determinato da n cause H 1, H 2,……H n di cui è certo che solo una si può verificare. Supponiamo di conoscere le probabilità con cui si verificano le n cause p(H 1 ), p(H 2 ),…p(H n ) e la probabilità con cui si verifica levento E dato la causa cioè p(E/H 1 )….p(E/H n ). Supponiamo che si sia verificato levento E, il teorema di Bayes ci permette di calcolare la probabilità che sia stata la causa H i a determinare E.

63 Esempio: Supponiamo che un medico sappia che un certo sintomo E (esempio una febbre altissima in un quadro clinico specifico) possa essere leffetto di tre sole malattie H 1, H 2, H 3 le cui probabilità sono: p(H 1 )=0,03 p(H 2 )=0,70 p(H 3 )=0,27 Supponiamo inoltre che la probabilità che ci sia febbre alta con la malattia H 1, H 2, H 3 siano: p(E/H 1 )=0,90 p(E/H 2 )=0,10 p(E/H 3 )=0,30. Come si vede a priori la malattia H 2 è la più probabile.

64 Il problema è: visto che il paziente ha febbre altissima quale è la causa più probabile? Il teorema di Bayes nellesempio dice che: N.B. il denominatore della frazione è la p(E) Analogamente per le altre cause: Come si vede la presenza del sintomo febbre E ha modificato lopinione del medico circa la graduatoria delle malattie; infatti a priori la malattia più probabile era H 2, seguita da H 3 e infine H 1. Vista la febbre, la malattia più probabile a posteriori è H 3. Visto che i denominatori delle frazioni sono uguali la malattia più probabile dipende dalle probabilità a priori della malattia e dalle probabilità condizionate del sintomo data la malattia.

65 Applicazioni del teorema di Bayes nei test diagnostici. Esempio: la diagnosi della sindrome di Down La sindrome di Down è una condizione cromosomica patologica, che riguarda circa un feto su Il più accurato test per la sindrome di Down richiede lamniocentesi, un intervento che purtroppo implica un piccolo rischio di aborto (circa un caso su 200). Cè un altro test accurato della sindrome di Down che è privo di rischi, noto come triplo test. Questo esame è diventato recentemente di uso comune e si basa sulla concentrazione di tre ormoni nel sangue materno a circa 16 settimane di gravidanza. Come ogni test anche il triplo test non è sempre perfetto, cioè è possibile che il test risulti negativo cioè non indica malattia ma il feto è malato (errore detto falso negativo) oppure che risulti positivo cioè indica malattia ma il feto è sano (errore detto falso positivo). I termini della questione sono i seguenti:

66 Prevalenza della malattia o anche detta probabilità a priori: è la probabilità che un individuo sia malato, nel caso della sindrome di Down p(E m )= 0,001 cioè 1 su 1000, o anche su , 1000 sono malati e sono sani. la probabilità di un falso positivo = p(T + /E s ) = 0,05 cioè 5%. Su sani il 5% cioè risulteranno falsi positivi al test specificità del test = probabilità che il test sia negativo dato che lindividuo è sano p(T - /E s ) = 1-p(T + /E s )= 1-0,05=0,95. Sui sani il 95% cioè risulteranno negativi al test. sensibilità del test = probabilità che il test sia positivo dato che il feto è malato, p(T + /E m ) = 0,60. Dei 1000 malati il 60% cioè 600 risulteranno positivi al test Quindi su di test risulteranno positivi =50550 di cui solo 600 veri positivi in quanto malati. probabilità di un falso negativo = p(T - /E m ) = 1- p(T + /E m ) =0,40 cioè il 40%. Dei 1000 malati il 40% cioè 400 risulteranno negativi al test

67 Il problema è calcolare la probabilità che il feto sia malato dopo che il test è risultato positivo, tale valore è detto valore predittivo di un test positivo o probabilità a posteriori. Risulta: Esiste una bassa probabilità che un feto risultato positivo al triplo test sia effettivamente affetto da sindrome di Down. Tale valore si poteva ottenere anche considerando che su test positivi solo 600 sono malati per cui Calcoliamo ora la probabilità che un feto risultato negativo sia effettivamente sano cioè il valore predittivo di un test negativo. Esiste quindi quasi la certezza che se il test è negativo il feto è sano.

68 Le tabelle di contingenza Alla scoperta della dipendenza o indipendenza fra variabili o mutabili Esempio: il casco protettivo è efficace per prevenire i traumi cranici conseguenti a incidenti? Casco protettivo Trauma cranico sinoTotaleFrequenze osservate Si /793=29,6% No /793=70,4% totale Campione di 793 soggetti coinvolti in incidenti con la motocicletta in un anno.

69 La tabella delle frequenze attese se non ci fosse alcuna dipendenza fra il casco protettivo e il trauma cranico. Dalla tabella precedente si deduce che in tutto il campione ha avuto un trauma cranico il 29,6% delle persone e non lo ha avuto il 70,4%. Se luso del casco non avesse alcuna influenza nel proteggere dal trauma cranico ci aspetteremmo che il 29,6% dei 147 che avevano il casco, avranno trauma cranico cioè 0,296x147=43,6 e la differenza cioè 103,4 avente casco non avranno avuto trauma cranico. Analogamente se luso del casco non avesse alcuna influenza sul trauma cranico ci aspetteremmo che il 29,6% dei 646 che non avevano casco avranno trauma cranico, cioè 0,296x 646= 191,4 e la differenza pari a 454,6 non aventi il casco non avranno avuto trauma cranico. Casco protettivo Trauma cranicosinototale si43,6191,4235 no103,4454,6558 Totale

70 Casco protettivo Trauma cranico sinoTotale Si /793=29,6% No /793=70,4% totale Tabella delle frequenze osservate (O) Casco protettivo Trauma cranicosinototale si43,6191,4235 no103,4454,6558 Totale Tabella delle frequenze attese (A) nel caso della indipendenza

71 E naturale pensare che i caratteri saranno tanto più indipendenti quanto più le frequente osservate si avvicinano a quelle attese e quindi tanto più dipendenti quanto più le frequenze osservate si discostano da quelle attese. Un indice significativo di questa discordanza sarà quindi: Se i caratteri sono indipendenti e il numero delle osservazioni sufficientemente elevati ( in pratica non ci devono essere frequenze attese inferiori a 5) lindice dato ha una distribuzione che si avvicina a Chi-quadrato con un grado di libertà uguale a (p-1)(q-1) dove p e q sono rispettivamente il numero delle colonne e delle righe della tabella. Allora se i caratteri sono indipendenti cè una probabilità del 95% che il chi- quadrato calcolato sia inferiore al chi-quadrato tabulato cioè presente nella tabella del chi-quadrato allincrocio della colonna corrispondente a 0,95 e alla riga del grado di libertà (p-1)(q-1). Per cui se il chi-quadrato calcolato è superiore al chi-quadrato tabulato si conclude che i caratteri sono dipendenti al grado di fiducia del 95%.

72 La distribuzione χ 2 Sia data popolazione gaussiana con varianza σ 2, estraiamo da essa tutti i possibili campioni di dimensione n e per ogni campioni consideriamo il rapporto: dove m è la media del Campione. Otteniamo una distribuzione di numeri, detta distribuzione chi-quadrato il cui grafico al variare della dimensione dei campioni è il seguente:

73

74 Allincrocio della colonna χ 2 di pedice 0,95 e la riga 9 cè il numero 16,9. Il significato è il seguente. Estraendo dalla popolazione un campione di dimensione 10 si ha una probabilità del 95% che esso abbia un chi-quadrato inferiore a 16,9.

75 Annixixi yi , , , , , , , , , , ,1 Andamento della mortalità infantile in Italia (y i = morti per 1000 nati vivi) La statistica prevede il futuro

76 1981Valori extrapolati Annixixi yiyi Ip. lineareIp. esponenzialeValori reali ,528,128,928, ,026,526,827, ,225,024,926, ,923,523,122, ,222,021,421, ,520,419,919, ,118,918,418, ,117,417, ,715,9 15, ,614,314,714, ,112,813,714, ,312,712, ,811,812, ,210,911, ,710,110, ,29,410,1

77 FINE

78 Al CALCOLO SOCIALE era attribuita molta importanza in relazione al governo dei popoli. Significativa è questa frase di Jean-Jacques Rousseau ( ) tratta dal Contratto sociale: Il Governo sotto il quale (…) i cittadini realizzano il massimo incremento e si moltiplicano è infallibilmente il migliore. Allo stesso modo, il Governo sotto il quale un popolo diminuisce e si logora è il peggiore: esperti di calcolo! Lascio a voi il compito di contare, di misurare, di paragonare. Comunque è nel corso del XIX secolo che il CALCOLO SOCIALE si sviluppa e prende forma come tecnica statistica usata su larga scala. Alcuni esempi di studi statistici: dopo le guerre napoleoniche i medici militari focalizzarono la loro attenzione sulla salubrità degli orfanotrofi, delle prigioni e degli ospizi per i poveri, di solito con lo scopo di stimolare le riforme necessarie. Ci sono poi le ricerche sullistruzione pubblica.

79 Ecco alcuni obiettivi di ricerca posti nel 1835 dalla Statistical Society di Londra per quanto riguarda listruzione: 1) Qual è stato leffetto dellestensione dellistruzione nel comportamento del popolo? E diventato più disciplinato, sobrio, soddisfatto o è successo il contrario? 2) Qual è il rapporto fra crimini e istruzione? Gli scolarizzati sono più esenti dei non scolarizzati o accade il contrario? 3) Quale crimine prevale di più nelle province colte: i reati contro la proprietà o contro la persona? 4) Quanti criminali, specialmente nelle classi di crimini più volgari, sapevano leggere e scrivere in base ai rendiconti del 1833 o del 1834? 5) Qual è il numero dei libri pubblicati durante lultimo anno e come sono classificati?

80 Influenza di Quételet sulla fisica Fu il lavoro di Quetelet a ispirare James Clerk Maxwell e Ludwig Boltzmann a dare alla teoria cinetica dei gas unimpostazione statistica. In una conferenza alla British Association nel 1873 Maxwell fece un chiaro riferimento alla fisica sociale di Quételet, dicendo che non si sarebbero mai trovate le leggi dei gas seguendo il moto e le collisioni di milioni di particelle indipendenti dato che non erano disponibili informazioni sulle singole molecole ed i calcoli sarebbero stati in ogni caso estremamente complessi. In effetti nella teoria cinetica dei gas il comportamento di un gas perfetto viene descritto attraverso delle grandezze macroscopiche come il Volume, la Temperatura e la Pressione, le ultime due fanno riferimento allenergia cinetica media delle molecole secondo le note formule: Energia cinetica media =E cm = 3/2KT dove k è la costante di Boltzmann, PV=2/3nN E cm dove n è il numero di grammomolecole e N è il numero di Avogadro.

81 Le velocità delle molecole di un gas si distribuiscono secondo una gaussiana detta distribuzione maxwelliana. Come si vede dal grafico al crescere della temperatura del gas il picco della distribuzione (velocità media) si sposta verso destra (verso valori più alti).


Scaricare ppt "Certo…anzi probabile. Atto di nascita: 1733 fu introdotta nella teoria della probabilità da Abraham De Moivre come approssimazione della distribuzione."

Presentazioni simili


Annunci Google