Prof.ssa Nadia Cococcioni

Slides:



Advertisements
Presentazioni simili
Elementi di calcolo delle probabilità
Advertisements

DISTRIBUZIONE BINOMIALE (cenni) DISTRIBUZIONE NORMALE
8) GLI INTERVALLI DI CONFIDENZA
Le distribuzioni di probabilità discrete
Le distribuzioni di probabilità continue
2. Introduzione alla probabilità
variabili aleatorie discrete e continue
Variabili aleatorie discrete e continue
Distribuzione Normale o Curva di Gauss
Intervalli di confidenza
La probabilità.
Matematica I: Calcolo differenziale, Algebra lineare, Probabilità e statistica Giovanni Naldi, Lorenzo Pareschi, Giacomo Aletti Copyright © The.
1 2. Introduzione alla probabilità Definizioni preliminari: Prova: è un esperimento il cui esito è aleatorio Spazio degli eventi elementari : è linsieme.
5) IL CAMPIONE CASUALE SEMPLICE CON RIPETIZIONE
LA DISTRIBUZIONE NORMALE
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Lez. 3 - Gli Indici di VARIABILITA’
Definizioni di probabilità
Definizioni Chiamiamo esperimento aleatorio ogni fenomeno del mondo reale alle cui manifestazioni può essere associata una situazione di incertezza. Esempi:
3. Processi Stocastici Un processo stocastico è una funzione del tempo i cui valori x(t) ad ogni istante di tempo t sono v.a. Notazione: X : insieme di.
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Le Variabili Casuali Corso di Teoria dell’Inferenza Statistica 1
STATISTICA DESCRITTIVA
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Processi Aleatori : Introduzione – Parte I
Distribuzioni di probabilità
Corso di biomatematica lezione 4: La funzione di Gauss
Corso di biomatematica Lezione 2: Probabilità e distribuzioni di probabilità Davide Grandi.
STATISTICA a.a DISTRIBUZIONE BINOMIALE (cenni)
LA PROBABILITA’.
Misurazione Le osservazioni si esprimono in forma di misurazioni
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
PROBABILITÀ La probabilità è un giudizio che si assegna ad un evento e che si esprime mediante un numero compreso tra 0 e 1 1 Evento con molta probabilità.
METODI E CONTROLLI STATISTICI DI PROCESSO
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Le distribuzioni campionarie
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
Gli indici di dispersione
Calcolo delle probabilità a cura di Maurizio Brizzi
“Teoria e metodi della ricerca sociale e organizzativa”
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
La variabile casuale (v.c.) è un modello matematico in grado di interpretare gli esperimenti casuali. Infatti gli eventi elementari  che compongono lo.
Modelli di variabili casuali
Intervalli di confidenza
Distribuzioni di probabilità di uso frequente
Eventi aleatori Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati.
Elaborazione statistica di dati
TRATTAMENTO STATISTICO DEI DATI ANALITICI
1 Statistica Scienza dell’incertezza PROBABILITÀ ALLA BASE DELL’INFERENZA Ipotesi VERA o FALSA? Campionamento Analisi statistica Scelta di una delle due.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
La probabilità matematica
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
1 VARIABILI CASUALI. 2 definizione Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico). Esempi l’esito.
1 TEORIA DELLA PROBABILITÁ. 2 Cenni storici i primi approcci alla teoria della probabilità sono della metà del XVII secolo (Pascal, Fermat, Bernoulli)
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
Introduzione alle distribuzioni di probabilità di Gauss o normale di Bernoulli o binomiale di Poisson o dei casi rari.
Gli Indici di VARIABILITA’
Un evento è un fatto che può accadere o non accadere. Se esso avviene con certezza si dice evento certo, mentre se non può mai accadere si dice evento.
Teoria dei Sistemi di Trasporto Tematica 4: Elementi minimi di teoria della probabilità.
Transcript della presentazione:

Prof.ssa Nadia Cococcioni VARIABILI CASUALI Prof.ssa Nadia Cococcioni

INDICE Variabili casuali discrete Distribuzione di probabilità di una variabile casuale discreta Funzione di ripartizione di una variabile casuale discreta Caratteristiche numeriche di una variabile casuale discreta La distribuzione binomiale o di Bernoulli La distribuzione di Poisson La disuguaglianza di Bienayme-Cebicev Variabili casuali continue La funzione di densità di una variabile casuale continua Funzione di ripartizione di una variabile casuale continua Caratteristiche numeriche di una variabile casuale continua Distribuzione normale o gaussiana Distribuzione normale standardizzata

VARIABILI CASUALI DISCRETE

Un concetto fondamentale della teoria della probabilità è quello di variabile aleatoria o casuale . Si chiama variabile casuale una grandezza X variabile in un insieme numerico tale che ad ogni modalità , che essa assume, è associata la probabilità che essa si verifichi . Una variabile si dice discreta se può assumere un numero finito o un’infinità numerabile di valori, si dice invece continua se può assumere gli infiniti valori di un intervallo .

ESEMPIO Illustriamo il concetto di variabile casuale con un esempio . F Consideriamo le famiglie che hanno tre figli . La composizione di tali famiglie, rispetto al sesso dei figli, può essere rappresentata con un diagramma ad albero . I casi possibili sono otto : MMM MMF MFM MFF FMM FMF FFM FFF

Prendiamo in considerazione il numero delle figlie femmine in una famiglia con tre figli e vediamo come è possibile elaborare un modello matematico per studiare la situazione. Notiamo che il numero delle figlie femmine può assumere quattro valori numerici legati ciascuno ad un valore di probabilità secondo la seguente tabella : N° figlie 0 1 2 3 probabilità 1\8 3\8 3\8 1\8 Questa tabella, che associa a tutti i possibili esiti del fenomeno la relativa probabilità, è un esempio di come si rappresenta la variabile aleatoria “Numero delle figlie femmine in una famiglia con tre figli” .

DISTRIBUZIONE DI PROBABILITA' DI UNA VARIABILE CASUALE DISCRETA

Si chiama distribuzione di probabilità di una variabile casuale discreta ogni relazione che stabilisce una corrispondenza tra i valori della variabile e le probabilità ad essi associate . X … … P(X) … ... Nella definizione di variabile casuale la somma delle probabilità è 1 in quanto vengono presi in considerazione tutti i possibili esiti dell’evento, la cui unione dà l’insieme universo . La legge di distribuzione di una variabile casuale discreta può essere rappresentata graficamente con un diagramma a barre.

ESEMPIO Rappresentare graficamente la variabile aleatoria X con la seguente distribuzione di probabilità: X 1 2 3 4 5 P(X) 0.1 0.2 0.3

FUNZIONE DI RIPARTIZIONE DI UNA VARIABILE CASUALE DISCRETA

Spesso nello studio di un fenomeno si è interessati alla ricerca della probabilità in un dato intervallo . Per esempio in un controllo di qualità che un azienda effettua sulla propria produzione si può considerare accettabile un numero di pezzi difettosi compreso in un intervallo assegnato piuttosto che fissare il numero esatto di pezzi difettosi . Per questo si studia un’importante funzione associata ad una variabile aleatoria: la funzione di ripartizione . Si chiama funzione di ripartizione di probabilità della variabile aleatoria X la funzione F(x) che fornisce la probabilità che X non assuma un valore superiore a un valore fissato x: F(x) = P(X x)

Dalla definizione segue che il valore di F(x) si ottiene sommando i valori di probabilità per . P(x) …... F(x) ….. 1 Rappresentiamo graficamente una funzione di ripartizione: La funzione di ripartizione è una funzione a gradini definita su tutto l’asse dei reali tale che: F(x) = 0 per F(x) = 1 per

P(a < X b) = P(X b) - P( X a) = F(b) - F (a) Come abbiamo già detto, nel risolvere problemi pratici relativi a variabili aleatorie è necessario calcolare la probabilità che una variabile assuma un valore compreso in un intervallo ( a, b ) . Per la definizione data della funzione di ripartizione, supposto che l’estremo destro dell’intervallo gli appartenga e quello sinistro no , risulta : P(a < X b) = P(X b) - P( X a) = F(b) - F (a) Possiamo dedurre, quindi ,che: La probabilità che la variabile aleatoria appartenga a un dato intervallo è uguale all’incremento della funzione di ripartizione in questo intervallo .

ESEMPIO La seguente variabile aleatoria con relativa funzione di ripartizione descrive i voti di una verifica di matematica in una classe . X 3 4 5 6 7 8 9 P(X) 0,04 0,06 0,15 0,47 0,18 0,07 0,03 F(x) 0,04 0,1 0,25 0,72 0,9 0,97 1 L’insegnante è interessato a valutare : a) la percentuale di alunni insufficienti; b) la percentuale di alunni con voto compreso fra 6 e 7; c) la percentuale di alunni con voto maggiore di 7 . Le risposte sono : a) b) c)

CARATTERISTICHE NUMERICHE DI UNA VARIABILE ALEATORIA DISCRETA

Media o speranza matematica Per descrivere in modo sintetico una variabile aleatoria è sufficiente indicare alcuni parametri numerici che la caratterizzano . Un valore medio intorno al quale si raggruppano i valori della variabile, un numero che caratterizza la dispersione di questi valori intorno al valore medio sono valori sintetici della distribuzione che ne forniscono un’immagine riassuntiva . Media o speranza matematica Data la variabile aleatoria X : X …. …. P(X) …. …. Si chiama media o speranza matematica della variabile X la somma dei prodotti dei valori della variabile per le rispettive probabilità:

Scarto quadratico medio Varianza La varianza è la caratteristica numerica della dispersione, cioè della deviazione dei valori della variabile casuale rispetto al valore medio . Si definisce varianza della variabile X la mediadel quadrato della differenza tra la variabile X e la sua speranza matematica : Per il calcolo della varianza esiste una formula alternativa più utile : Scarto quadratico medio Si chiama scarto quadratico medio della variabile X la radice quadrata della varianza :

LA DISTRIBUZIONE BINOMIALE O DI BERNOULLI

IL PROBLEMA DELLE PROVE RIPETUTE Le probabilità associate ai valori che può assumere una variabile casuale X costituiscono la distribuzione di X e vengono elencati in una tabella , ma a volte è anche possibile formulare una legge matematica che, al variare dei valori di X, determini i relativi valori di probabilità . IL PROBLEMA DELLE PROVE RIPETUTE Immaginiamo di ripetere più volte e nelle stesse condizioni una certa prova in modo indipendente . Ogni prova può condurre ad un evento casuale A ( detto successo ) oppure all’evento contrario ( detto insuccesso ) , Sia p la probabilità che l’evento A si verifichi e q=1-p la probabilità dell’evento contrario, allora : La probabilità che su n prove indipendenti, l’evento A di probabilità p, si presenti x volte è data dalla funzione di probabilità : TEOREMA

Caratteristiche numeriche di una distribuzione bernoulliana La distribuzione di probabilità legata ad un problema delle prove ripetute è detta distribuzione binomiale ( di ordine n e parametro p ) perché per x=0, 1,2, 3, … , n corrisponde ai successivi termini dello sviluppo binomiale : Questa distribuzione è anche detta bernoulliana in onore di J. Bernoulli che la scoprì alla fine del XVIII secolo . Caratteristiche numeriche di una distribuzione bernoulliana Se X è una variabile aleatoria bernoulliana di ordine n e parametro p : il suo valore medio è dato da : M(X)=np ; la sua varianza è data da : V(X)=npq ; il suo scarto quadratico medio è dato da : TEOREMA

Un’urna contiene 4 palline rosse e 6 palline verdi, siano p e q le probabilità di estrarre dall’urna rispettivamente una pallina rossa e una pallina verde . Si eseguono 4 estrazioni, riponendo ogni volta la pallina estratta nell’urna .Si determini la distribuzione di probabilità della variabile casuale X “ numero delle palline rosse estratte “, il valore medio e la varianza . Si calcoli inoltre : ESEMPIO a. la probabilità che vengano estratte esattamente due palline rosse b. la probabilità che vengano estratte almeno due palline rosse c. La probabilità che il numero delle palline rosse estratte sia compreso tra uno e tre . X 0 1 2 3 4 P(X=x) 0,1296 0,3456 0,3456 0,1536 0,0256 M(X ) = 1,6 V(X) = 0,96 a. P(X=2) = 0,3456 b. P(X 2) = 0,3456 + 0,1536 + 0,0256 c. P(1 X 3) = 0,356 + 0,356 + 0,1536

LA DISTRIBUZIONE DI POISSON

Quando in una distribuzione bernoulliana il numero n delle prove ripetute assume un valore molto alto e la probabilità p del successo assume un valore molto piccolo , cioè se la probabilità dell’evento A è vicina a 0 e n , la distribuzione di Bernoulli può essere approssimata da un’altra distribuzione che prende il nome di distribuzione di Poisson ( dal nome del matematico che la costruì nel 1837). Nella distribuzione di Poisson la variabile aleatoria X assume i valori 0, 1, 2 ... e la funzione di probabilità di X è : dove è una costante positiva che rappresenta il parametro della distribuzione . Nel caso in cui questa distribuzione approssima quella bernoulliana è data dalla media np . Si dimostra che il valore medio e la varianza di una variabile X che ha una distribuzione di Poisson hanno lo stesso valore ed è :

La distribuzione di Poisson descrive molti fenomeni naturali come il numero di chiamate telefoniche che arrivano ad un centralino in un certo intervallo di tempo, il numero di particelle radioattive emesse da una sostanza nell’unità di tempo, il numero di utenti che arrivano allo sportello di un ufficio in un’ora . . . Il parametro in questi casi rappresenta il numero medio di volte che il fenomeno si verifica nell’intervallo di tempo che prendiamo in considerazione . In un ufficio postale transitano , per un certo sportello, mediamente 90 persone ogni ora . Se l’operatore si deve allontanare per 5 minuti, qual è la probabilità che non arrivi nessuno in quei 5 minuti ? Qual è la probabilità che arrivino 3 persone ? = ( 90 : 60 ) x 5 = 7,5 ESEMPIO

LA DISUGUAGLIANZA DI BIENAYME - CEBICEV

Fin qui abbiamo visto che, nota la distribuzione di probabilità di una variabile casuale, è possibile determinare i due valori che la caratterizzano: la media e la varianza . Ma spesso capita nelle ricerche sperimentali di conoscere il valore medio e la varianza di una variabile senza conoscere la sua distribuzione . La disuguaglianza di Bienayme-Cebicev mette in relazione tra di loro gli indicatori caratteristici di una distribuzione , la media e lo scarto quadratico medio , offrendo la possibilità di avere infornazioni sui valori di probabilità . Per ogni variabile aleatoria X, di media e scarto quadratico medio , fissato un opportuno valore positivo K, vale la seguente relazione : TEOREMA La probabilità che la variabile aleatoria X assuma valori al di fuori dell’intervallo non supera il rapporto tra la varianza e il valore di k elevato al quadrato .

VARIABILI CASUALI CONTINUE

Nella realtà è molto frequente lo studio di quei caratteri , che possono assumere tutti i valori in un certo intervallo, come il peso o l’altezza di un gruppo di individui, il tempo, la distanza e, in generale, tutte quelle grandezze che possono essere misurate . Sono questi caratteri continui per i quali non è possibile, nè tantomeno interessante, trattare le modalità singolarmente : occorre raggruppare per classi i dati di cui si dispone . Consideriamo la tabella delle frequenze assolute e relative delle stature di un campione di 200 individui ESEMPIO NUMERO LIMITI VALORI FREQUENZA FREQUENZA CLASSI CLASSI CENTRALI ASSOLUTA RELATIVA 1 150 - 154 152 2 0,010 2 154 . 158 156 7 0,035 3 158 - 162 160 22 0,110 4 162 - 166 164 13 0,065 5 166 - 170 168 44 0,220 6 170 - 174 172 36 0,180 7 174 - 178 176 32 0,160 8 178 - 182 180 13 0,065 9 182 . 186 184 21 0,105 10 186 - 190 188 10 0,050

Tracciamo l’istogramma delle frequenze relative Nell’istogramma l’area di ciascun rettangolo rappresenta la frequenza relativa della classe, la probabilità che un elemento appartenga ad una classe . Ciascun valore riportato sull’asse y dell’istogramma rappresenta il rapporto tra la frequenza relativa degli individui che appartengono alla classe e l’ampiezza della classe stessa . Tali valori rappresentano la DENSITA’ DI FREQUENZA RELATIVA .

Consideriamo una variabile casuale discreta che assuma i valori centrali delle classi con la seguente distribuzione di probabilità : X 152 156 160 164 168 172 176 180 184 188 P(X) 0,010 0,035 0,110 0,065 0,220 0,180 0,160 0,065 0,105 0,050 Tracciamo la poligonale che unisce i punti aventi come ascissa i valori centrali delle classi e come ordinata la densità di probabilità delle varie classi .

FUNZIONE DI DENSITA' DI PROBABILITA' DI UNA VARIABILE CASUALE CONTINUA

Al crescere del numero delle classi, la loro ampiezza diminuisce fino a tendere ad un punto . In questo modo la variabile casuale discreta tende ad assumere tutti i valori del dominio e può essere considerata una variabile casuale continua . La poligonale può essere approssimata da una curva che rappresenta la FUNZIONE DI DENSITA’ DI PROBABILITA’ della variabile casuale continua .

Proprietà della funzione di densità di probabilità Nel caso della variabile casuale continua la probabilità corrispondente ad un particolare valore assunto dalla variabile stessa è ovviamente uguale a zero. Questo fatto si può intuire pensando che si ha il rapporto fra un caso favorevole ed infiniti casi possibili . E’ possibile però determinare la probabilità che questo valore particolare cada in un intervallo (a,b) . Se teniamo presente che nell’istogramma delle frequenze relative la probabilità che un valore della popolazione cada in una classe è data dall’area del rettangolo costruito su di essa, per la variabile casuale continua la probabilità P ( a<X<b ) è data dall’area del trapezoide delimitato dalla curva di densità, dall’asse x e dalle rette x=a e x=b , quindi dal valore dell’integrale definito tra a e b della funzione di densità della variabile : Da quanto detto si deduce che la funzione di densità di una variabile casuale continua deve soddisfare a due condizioni : 1) è definita e non negativa per ogni valore reale della variabile indipendente . 2)

FUNZIONE DI RIPARTIZIONE DI UNA VARIABILE CASUALE CONTINUA

Data una variabile casuale continua X con funzione di densità f(x) si definisce funzione di ripartizione : Segue dalla definizione che la funzione di ripartizione esprime per ogni valore di x la probabilità che la variabile assuma un valore minore o uguale a x . La probabilità che la variabile X assume un valore appartenente all’intervallo (a,b) è uguale all’incremento della funzione di ripartizione in tale intervallo : Possiamo osservare che la funzione di densità di probabilità f(x) e la funzione di ripartizione corrispondente F(x) sono legate dalla relazione : F’(x) = f(x)

Per quanto riguarda il grafico della funzione di ripartizione di una variabile casuale continua, essa è una funzione non decrescente con : ESEMPIO per x<2 per 2 x 3 per x>3

CARATTERISTICHE NUMERICHE DI UNA VARIABILE CASUALE CONTINUA

Valore medio Si chiama valore medio della variabile casuale continua X l’espressione : Varianza Si chiama varianza di una variabile casuale X la media dei quadrati degli scarti fra i valori della variabile e il suo valore medio : oppure

Moda Si chiama moda il valore della variabile casuale continua X per il quale la sua funzione di densità di probabilità assume il valore massimo . Mediana Si chiama mediana della variabile casuale continua X il numero m che soddisfa la relazione :

DISTRIBUZIONE NORMALE O GAUSSIANA

La distribuzione casuale continua legata ai più importanti fenomeni fisici, biologici o economici è la distribuzione normale o gaussiana che ha funzione di densità : Tale funzione è definita in R e dipende dai parametri e che rappresentano la deviazione standard e la media della variabile casuale . La curva che la rappresenta è asintotica all’asse x, possiede un massimo per , due flessi per .

DISTRIBUZIONE NORMALE STANDARDIZZATA

Una distribuzione normale che ha valore medio = 0 e scarto quadratico medio = 1 prende il nome di distribuzione normale standardizzata . L’equazione della sua funzione di densità di probabilità è : avendo indicato con z la variabile normale standardizzata . Il grafico della curva normale standardizzata è il seguente :

E’ possibile ottenere l’equazione della funzione di densità della variabile normale standardizzata trasformando la funzione di densità della corrispondente variabile non standardizzata, di media e scarto quadratico , con un’affinità di equazioni : Quindi è possibile passare dalla variabile aleatoria X, che ha come media e come scarto quadratico medio , alla corrispondente variabile standardizzata Z, che ha valore medio 0 e scarto quadratico medio 1, con la formula : Per la curva normale standardizzata i valori dell’area delle regioni comprese tra la curva, l’asse x e le rette di equazione x=a e x=b , corrispondenti alla probabilità che la variabile standardizzata assuma valori compresi nell’intervallo (a,b) , sono stati calcolati e riportati in apposite tavole .

Con l’introduzione della distribuzione normale standardizzata , ogni calcolo relativo alla probabilità di variabili aleatorie continue può essere ricondotto al calcolo della probabilità della corrispondente variabile standardizzata . Infatti, tenendo conto che in una trasformazione affine il rapporto fra le aree delle superfici corrispondenti è uguale al rapporto di affinità che nel nostro caso è uguale a 1, si ha : Sappiamo che il diametro effettivo delle sfere di acciaio prodotte da una ditta può essere considerato una variabile normale di media 5,1 cm e scarto quadratico medio 0,08 . Calcola la probabilità che il diametro di una sfera scelta a caso sia compreso tra 4,98 e 5,15 cm . ESEMPIO