Le distribuzioni di probabilità discrete

Slides:



Advertisements
Presentazioni simili
DISTRIBUZIONE BINOMIALE (cenni) DISTRIBUZIONE NORMALE
Advertisements

Appunti di analisi matematica: Integrale Definito
Le distribuzioni di probabilità continue
2. Introduzione alla probabilità
Definizione di probabilità, calcolo combinatorio,
____________________
Variabili aleatorie discrete e continue
Intervalli di confidenza
La probabilità.
Matematica I: Calcolo differenziale, Algebra lineare, Probabilità e statistica Giovanni Naldi, Lorenzo Pareschi, Giacomo Aletti Copyright © The.
6. Catene di Markov a tempo continuo (CMTC)
1 2. Introduzione alla probabilità Definizioni preliminari: Prova: è un esperimento il cui esito è aleatorio Spazio degli eventi elementari : è linsieme.
I sistemi di riferimento
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Lez. 3 - Gli Indici di VARIABILITA’
6. Catene di Markov a tempo continuo (CMTC)
3. Processi Stocastici Un processo stocastico è una funzione del tempo i cui valori x(t) ad ogni istante di tempo t sono v.a. Notazione: X : insieme di.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Probabilistici, Statistici e Processi Stocastici Università Carlo Cattaneo Emanuele Borgonovo Metodi Probailistici, Statistici e Processi Stocastici.
Inferenza statistica per un singolo campione
Le Variabili Casuali Corso di Teoria dell’Inferenza Statistica 1
Valutazione delle ipotesi
Capitolo 9 I numeri indici
DISTIBUZIONE BINOMIALE
Introduzione alla statistica per la ricerca Lezione I
Processi Aleatori : Introduzione – Parte I
Distribuzioni di probabilità
Matematica e statistica Versione didascalica: parte 8 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste
8. Reti di Code Nella maggior parte dei processi produttivi risulta troppo restrittivo considerare una sola risorsa. Esempio: linea tandem arrivi 1 v.
Corso di biomatematica lezione 9: test di Student
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
Esercizi x1=m-ts x2=m+ts
Valutazione della stima: gli intervalli di confidenza
Stima dei parametri di una distribuzione
Il Teorema del Limite Centrale
Misure di dispersione Giovanni Filatrella
VERIFICA DEI RIFLESSI …Tutto ciò che avreste voluto sapere e non avete mai osato chiedere… M. & D.
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Lezione 8 La valutazione dello scarto per “fuori tolleranza”
METODI E CONTROLLI STATISTICI DI PROCESSO
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
1)Completa la seguente successione: C4, B7, E10, D13, G16,. A. G19 B
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Le distribuzioni campionarie
1.PROBABILITÀ A. Federico ENEA; Fondazione Ugo Bordoni Scuola estiva di fonetica forense Soriano al Cimino 17 – 21 settembre 2007.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
Lez. 3 - Gli Indici di VARIABILITA’
Laurea Ing EO/IN/BIO;TLC D.U. Ing EO 10 PROBABILITA’ E VARIABILI ALEATORIE.
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Strumenti statistici in Excell
Calcolo delle probabilità a cura di Maurizio Brizzi
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
Intervalli di confidenza
Distribuzioni di probabilità di uso frequente
Eventi aleatori Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati.
Elaborazione statistica di dati
TRATTAMENTO STATISTICO DEI DATI ANALITICI
1 Statistica Scienza dell’incertezza PROBABILITÀ ALLA BASE DELL’INFERENZA Ipotesi VERA o FALSA? Campionamento Analisi statistica Scelta di una delle due.
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
1 VARIABILI CASUALI. 2 definizione Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico). Esempi l’esito.
Introduzione alle distribuzioni di probabilità di Gauss o normale di Bernoulli o binomiale di Poisson o dei casi rari.
Transcript della presentazione:

Le distribuzioni di probabilità discrete Elaborazione Statistica dei Dati Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio Le distribuzioni di probabilità discrete Giovanni Filatrella (filatrella@unisannio.it) G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Cos’è una distribuzione di probabilità discreta Abbiamo definito una variabile casuale X una variabile che può assumere diversi valori: {x1, x2, …, xN} Ognuno di questi con probabilità: {p1, p2, …, pN} La funzione che associa una probabilità pi al valore i-esimo della variabile casuale xi è la distribuzione di probabilità. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Attenzione a non confondere i seguenti 4 concetti: X è il simbolo che denota la variabile casuale che può assumere i valori {xi} L’indice i serve solo a numerare i possibili risultati Le xi sono i valori numerici che si ottengono per l’i-esimo risultato Le pi sono il rapporto fra i casi favorevoli all’i-esimo risultato e tutti i risultati possibili G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Attenzione a non confondere i seguenti 4 concetti: X è il simbolo che denota la variabile casuale che può assumere i valori {xi} L’indice i serve solo a numerare i possibili risultati Le xi sono i valori numerici che si ottengono per l’i-esimo risultato Le pi sono il rapporto fra i casi favorevoli all’i-esimo risultato e tutti i risultati possibili G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Rappresentazione grafica: La funzione distribuzione è la legge che regola le probabilità (le altezze dei rettangoli). 0.25 0.20 Probabilità 0.15 Variabile casuale 0.10 0.05 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 xi G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Un’importante distinzione Il concetto di distribuzione discreta vuol dire che solo un numero intero di differenti valori è possibile, e si riferisce all’indice i; Il valore della variabile xi non è necessariamente un intero. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Esempio: la distribuzione di probabilità uniforme: Se supponiamo che tutti valori della variabile casuale siano equiprobabili: Allora la distribuzione è detta uniforme. D.: Quanto vale p? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Valore aspettato e varianza Per le variabili discrete è possibile definire un valore aspettato E[x] ed una varianza Var[x] che sono analoghe alle misure di posizione e dispersione valore medio e scarto quadratico medio: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Valore aspettato e varianza non coincidono con media e scarto quadratico medio Per un numero di tentativi molto elevato è ragionevole che si identifichino le fi e le pi. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Esercizio: *Quanto vale il valore aspettato per la distribuzione uniforme? ***Quanto vale la varianza per la distribuzione uniforme? Si provi prima con un intervallo specifico (ex, 4) e poi con un N generico. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Definizione formale di processo binomiale o bernoulliano Ciascuna prova ha solo due esiti, che chiameremo successo e insuccesso La probabilità p di un successo in ciascuna prova resta costante per tutte le prove e non è influenzata dagli esiti precedenti (le prove sono indipendenti). La probabilità di un insuccesso è q = 1 - p. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Diagramma ad albero per la distribuzione binomiale Si può derivare la distribuzione binomiale immaginando che il processo avvenga in sequenza, e che ad ogni “scelta” sia associata una probabilità elementare G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Calcolo esplicito delle probabilità per l’albero binomiale Prob. di avere: La probabilità degli eventi w può essere trovata osservando che ognuno dei risultati è la combinazione di eventi indipendenti non necessariamente equiprobabili, ovvero pq 3S 2S 2S 1S 2S 1S 1S 0S S: un cliente sceglie “soup”, F: sceglie “fish”. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Probabilità non identiche fra le più scelte Notare: i diagrammi ad albero possono essere utilizzati per il calcolo di probabilità di sequenze generiche, ma non sono distribuzioni binomiali! G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Distribuzione binomiale in formule Dato un esperimento che si può verificare solo in due modi (“successo” ed “insuccesso”) mutuamente esclusivi e complementari, quindi con probabilità p e 1-p. Qual è la probabilità di avere n successi su N misure? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Definizione di fattoriale Il fattoriale di un numero intero n si indica con n! ed è definito come: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Esempi di distribuzione binomiale Quante teste si ottengono lanciando 10 monete? Se il 23% della popolazione della provincia di Benevento risiede nel capoluogo, su 4 persone quante risiederanno nel capoluogo? Se una fabbrica produce l’1% di pezzi difettosi, in un lotto di 20 quanti sono difettosi? D1.: Sono distribuzioni binomiali? Perché? D2.: Trovare per ognuno degli esempi i parametri della distribuzione binomiale. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Proprietà della distribuzione binomiale: il valore aspettato Coincide, come intuibile, con il prodotto del numero di tentativi per la probabilità di successo. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Proprietà della distribuzione binomiale: la varianza E’ proporzionale al numero di tentativi, moltiplicata per la probabilità di successo e per la probabilità di insuccesso. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Esempi di distribuzioni binomiali Ciò che conta e’ il prodotto Np Infatti: 0.5X160 = 80 0.3X270 = 80 p=0.3 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Un esempio numerico Se si lanciano dieci monete supposte perfettamente simmetriche (o non truccate), cosa si può dire dei possibili esiti? La probabilità di successo p=1/2 Il numero di tentativi è N=10 Il valore aspettato è Np=5 La varianza è Np(1-p)=2.5 La deviazione standard è √(Np(1-p))=1.58 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Risultati del calcolo della formula binomiale per N=10, p=0.5 Successi B0.5,10(n) n 0 0.0010 1 0.0098 2 0.0439 3 0.1172 4 0.2051 5 0.2461 6 0.2051 7 0.1172 8 0.0439 9 0.0098 10 0.0010  Il valore aspettato (5) è il più probabile Attorno al valore aspettato in un intervallo di semiampiezza la deviazione standard (1.5) si trovano circa il 70% dei casi. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Un’applicazione Le finali di alcuni tornei di calcio si decidono calciando 6 rigori. D.: il pareggio dopo sei rigori succederà più spesso se: La probabilità di segnare per entrambe le squadre è alta (ex, p=0.8) La probabilità di segnare per entrambe le squadre è media (ex, p=0.5) La probabilità di segnare per entrambe le squadre è bassa (ex, p=0.2) G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Distribuzione di Poisson Supponiamo di avere una variabile binomiale dove Il numero molto elevato di tentativi (N) La probabilità è molto bassa (p0), ma in modo tale che il valore aspettato sia finito: Np=. Qual è la distribuzione di probabilità? In principio si potrebbe sempre calcolare la Binomiale, ma i fattoriali rendono il calcolo estremamente laborioso. La distribuzione di Poisson è il limite della Binomiale nelle ipotesi 1) e 2). G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Esempi di distribuzione di Poisson Quanti studenti iscritti in questa Facoltà hanno un altezza superiore al 95mo percentile? Una malattia rara colpisce l’1% della popolazione. Quante persone sono colpite in una città come Benevento? Quanti dei residenti in Benevento sono nati il 29 febbraio? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Distribuzione di Poisson: formulazione matematica La distribuzione di Poisson ha un solo parametro: . Ovviamente se il valore aspettato è: Np=. D.: Trovare le distribuzioni di probabilità per gli esempi precedenti. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Distribuzione di Poisson: formulazione matematica La distribuzione di Poisson ha un solo parametro:  Ovviamente se il valore aspettato è: Np=: La varianza anche vale : G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Confronto con la distribuzione di Bernoulli m = Np si ricava da due parametri indipendenti s2 = Np(1-p) si potrebbe anche scrivere come: s2 = m(1-p) Per p molto piccola s2  m Poisson m é l’unico parametro che caratterizza la distribuzione si trova che la varianza dipende dal parametro m e s2 = m G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Osservazioni (1) Un processo per essere poissoniano dovrebbe ammettere un numero infinito di tentativi e quindi ammettere un numero infinito di successi. In pratica si applica a casi in cui questo è solo approssimativamente vero. D: negli esempi di distribuzione di Poisson precedente c’è un limite al numero di successi? Quale? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Osservazioni (2) Anche se tutti i processi reali sono solo approssimativamente poissoniani è assai comodo utilizzare questa distribuzione perché è più semplice da valutare. Di fatto per N molto grande i fattoriale della distribuzione di Bernoulli sono enormi. D: qual è l’intero più grande di cui potete calcolare il fattoriale con la calcolatrice da tasca? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Estensione della distribuzione di Poisson Supponete che per un evento non si conosca davvero il numero di tentativi: Es.: Supponiamo che una persona guardi mezz’ora di una qualsiasi partita di un turno di serie A. Se sono state segnate 22 reti nelle 9 partite, qual è la probabilità che questa persona assista a 2 reti? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Perché si può usare la distribuzione di Poisson Si può immaginare che nell’intervallo di tempo considerato vi siano N tentativi di fare goal. La probabilità p di fare goal per ogni tentativo è sconosciuta, ma è bassa perché in tutto si sono segnate solo 22 reti in 9 partite. Se supponiamo che i tentativi siano molti (al limite, infiniti) in principio possiamo usare la distribuzione di Poisson, e per farlo basterebbe conoscere il suo valore medio m=Np. D.: Come si può stimare m=Np? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Soluzione In tutte le 9 partite vi sono 27 periodi di mezz’ora. Se sono stati segnati 22 goal in tutto, in media in ogni periodo sono stati segnati: D.: ** Come verifichereste che il metodo funziona? Provare a casa con i risultati di un qualsiasi turno di serie A. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Descrizione formale dei processi di Poisson Un processo di Poisson si può quindi definire come un processo caratterizzato da n eventi che in un intervallo di tempo Dt : Si possono verificare nell’intervallo di tempo indipendentemente da quanto è avvenuto negli intervalli precedenti; La probabilità che si verifichi un evento è proporzionale alla durata dell’intervallo Dt, con costante di proporzionalità l; Allora si avrà un processo di Poisson con valore aspettato m=lDt: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Esercizi * Nell’esempio precedente dei goal segnati in mezz’ora, identificare le varie quantità n, Dt, l. ** Supponiamo che in un lago artificiale senza altro cibo vengono immesse trote, una ogni 10 minuti. Se ci sono 10 pescatori: Quante trote prenderanno ogni ora? Trovare i parametri del processo di Poisson. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali