LA DISTRIBUZIONE NORMALE

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

- le Medie la Moda la Mediana
8) GLI INTERVALLI DI CONFIDENZA
Appunti di analisi matematica: Integrale Definito
Le distribuzioni di probabilità continue
Appunti di analisi matematica: Integrale Definito
2. Introduzione alla probabilità
Sistema di riferimento sulla retta
____________________
Distribuzione Normale o Curva di Gauss
Intervalli di confidenza
COORDINATE POLARI Sia P ha coordinate cartesiane
6. Catene di Markov a tempo continuo (CMTC)
Il campo elettrico - Lo chiamiamo campo elettrico,
Meccanica 2 1 marzo 2011 Cinematica in una dimensione
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
Lez. 3 - Gli Indici di VARIABILITA’
6. Catene di Markov a tempo continuo (CMTC)
3. Processi Stocastici Un processo stocastico è una funzione del tempo i cui valori x(t) ad ogni istante di tempo t sono v.a. Notazione: X : insieme di.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
VARIABILI ALEATORIE Sono presentate di seguito le nozioni di:
Distribuzione degli Errori di Misura
Inferenza statistica per un singolo campione
Le Variabili Casuali Corso di Teoria dell’Inferenza Statistica 1
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Esercizi x1=m-ts x2=m+ts
DALL'INTERVALLO DI PROBABILITÀ
La distribuzione normale e normale standardizzata
ISTOGRAMMI E DISTRIBUZIONI:
DIFFERENZA TRA LE MEDIE
Introduzione alla statistica per la ricerca Lezione I
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Processi Aleatori : Introduzione – Parte I
Corso di biomatematica lezione 4: La funzione di Gauss
ISTOGRAMMI E DISTRIBUZIONI : i xixi
Esercizi x1=m-ts x2=m+ts
Valutazione della stima: gli intervalli di confidenza
Misurazione Le osservazioni si esprimono in forma di misurazioni
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
METODI E CONTROLLI STATISTICI DI PROCESSO
Esercitazione 1: Rispetto al test di ansia (Media=25; σ=5), calcolare:
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Radix-Sort(A,d) // A[i] = cd...c2c1
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Statistica economica (6 CFU) Corso di Laurea in Economia e Commercio a.a Docente: Lucia Buzzigoli Lezione 5 1.
PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.
La distribuzione normale
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Simboli usati popolazione: media = μ deviazione standard = σ
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
I mercati dei beni e i mercati finanziari: il modello IS-LM
Calcolo delle probabilità a cura di Maurizio Brizzi
La variabile casuale (v.c.) è un modello matematico in grado di interpretare gli esperimenti casuali. Infatti gli eventi elementari  che compongono lo.
Intervalli di confidenza
Eventi aleatori Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati.
La distribuzione campionaria della media
Elaborazione statistica di dati
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
TRATTAMENTO STATISTICO DEI DATI ANALITICI
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
1 VARIABILI CASUALI. 2 definizione Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico). Esempi l’esito.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
Transcript della presentazione:

LA DISTRIBUZIONE NORMALE 27/03/2017 LA DISTRIBUZIONE NORMALE Andrea Pavan http://vision.psy.unipd.it/pavan.htm 08/10/2007

La Distribuzione Normale 27/03/2017 La Distribuzione Normale La Distribuzione Normale riveste un ruolo importante nella teoria della probabilità e in statistica. Per la ricerca psicologica l’importanza di questa distribuzione sta nel fatto che i dati di molte variabili psicologiche si distribuiscono secondo una funzione che per la forma viene detta a campana, gaussiana (Gauss, 1777-1855) o normale. La distribuzione normale gode di proprietà che rendono facile la sua utilizzazione; nella pratica si ricorre a queste proprietà quando una variabile casuale continua è distribuita normalmente o quasi.

Le variabili casuali continue Definizione: se la variabile casuale X assume tutti gli infiniti valori di R, o di un suo intervallo [a, b], è chiamata variabile casuale continua. Nel caso di una variabile casuale discreta la distribuzione di probabilità può sempre essere definita assegnando, ad ogni valore che la variabile può assumere, una probabilità positiva tale che la somma delle probabilità sia sempre 1. La distribuzione di probabilità di una variabile casuale continua non può essere specificata nello stesso modo. È impossibile, infatti, assegnare probabilità non nulle a tutti i punti di un intervallo e soddisfare la richiesta che la somma delle probabilità dei distinti valori possibili sia 1.

Le variabili casuali continue Esempio: consideriamo la piovosità giornaliera. Qual è la probabilità di avere una misura di piovosità esattamente di 5.57 cm ossia P(X = 5.57)? Non potremmo mai osservare l’esatto valore anche se misurassimo la piovosità per tutta la durata della vita, nonostante si potrebbero avere per molti giorni misure di piovosità fra i 5 e i 6 cm.

Le variabili casuali continue Per assegnare quindi dei valori di probabilità ad una variabile aleatoria continua è necessario definire una funzione ripartizione (o funzione di distribuzione cumulativa).

Le variabili casuali continue Definizione: la funzione di ripartizione di una variabile casuale “X” a valori reali è la funzione che associa a ciascun valore x la probabilità dell‘evento “la variabile casuale X assume valori minori o uguali ad x”. In altre parole è la funzione con dominio la retta reale e immagine l'intervallo [0,1] definita da: , per -∞ < x < +∞ … ed è caratterizzata dalle seguenti proprietà: F(x) è una funzione non decrescente di x

Le variabili casuali continue Una volta definita la funzione ripartizione, è importante definire pure la funzione di densità di probabilità di una variabile continua. Se F(x) è la funzione ripartizione di una variabile casuale continua, allora la funzione f(x) definita da costituisce la funzione di densità di probabilità di X. La funzione di densità di probabilità è caratterizzata dalle seguenti proprietà: Associa sempre un valore non negativo a ciascun valore di X L’area sottesa al grafico della funzione f(x) è uguale a 1

Le variabili casuali continue Definite la funzione di ripartizione e la funzione di densità di probabilità è possibile illustrare la procedura che consente di associare i valori di probabilità ad una variabile casuale continua. Per una variabile casuale continua X la probabilità P(c ≤ X ≤ d) è uguale all’area sottesa dalla funzione di densità f(x) nell’intervallo [c,d]. Se la variabile casuale X ha una funzione di densità f(x) e c≤d, allora la probabilità che X assuma un valore compreso nell’intervallo [c,d] è:

La Distribuzione Normale La distribuzione normale o gaussiana è la più importante distribuzione di probabilità di variabili continue, in quanto permette di ottenere delle approssimazioni di probabilità per molte altre distribuzioni, quali: Trasformazioni di variabili continue non normali che danno luogo a nuove variabili continue che sono distribuite in modo normale esatto o approssimativamente normale. Somme di variabili continue che, sotto certe condizioni, possono essere approssimate da una distribuzione normale.

La Distribuzione Normale Una v.c. X ha una distribuzione normale, con media µ e varianza σ2, se: la sua funzione di densità di probabilità è data da:

La Distribuzione Normale Rappresentazione grafica di una distribuzione normale

La Distribuzione Normale .. e se la sua funzione di ripartizione è data da:

La Distribuzione Normale dove: = deviazione standard della popolazione dei dati, = nota costante 3,14…, = base dei logaritmi naturali (2,7183…), = scarto dalla media della distribuzione elevato al quadrato;

La Distribuzione Normale La v.c. normale di tipo continuo, che assume valori compresi tra -∞ e +∞, descrive una curva di tipo simmetrico e campanulare, dotata delle seguenti caratteristiche: la curva è perfettamente simmetrica all’ordinata massima Y, cioè dove la funzione f(X) raggiunge il suo punto più alto, che è in corrispondenza di Xi = µ; questo fatto comporta che media, mediana e moda coincidano;

La Distribuzione Normale la sua funzione di distribuzione f(X) è asintotica di X verso -∞ e +∞ (la curva si avvicina all’asse delle ascisse senza mai toccarla); tuttavia per Xi che dista più di 3 σ dalla media, la distanza tra la curva e l’asse delle X è estremamente piccola; è crescente per valori della X che vanno da -∞ a µ ed è decrescente per valori che vanno da µ a +∞; è completamente caratterizzata dai due parametri µ e σ2 e dalle tre costanti 2, p, e; presenta due punti di flesso in corrispondenza di µ+σ e µ-σ; cioè i punti in cui la curva da convessa diventa concava si trovano in corrispondenza a ±1 deviazione standard dalla media;

La Distribuzione Normale Rappresentazione grafica di una distribuzione normale

La Distribuzione Normale La probabilità relativa ad intervalli di valori della funzione normale è così definita: per un valore di Xi = a, la probabilità dell’intervallo di valori: -∞ < X < a corrisponde alla integrale: P(a) = probabilità dell’intervallo di valori tra - ∞ ed a

La Distribuzione Normale La distribuzione rappresentata dalla relazione mostrata precedentemente si chiama anche “curva degli errori”; ciò è dovuto al fatto che questa curva serve a rappresentare la legge con cui si distribuiscono gli errori di natura accidentale. Il calcolo dell’integrale dipende dai valori µ e σ2; pertanto si può dire che la probabilità associata ad un intervallo di valori X è funzione dei due parametri µ e σ2.

Valori attesi della Distribuzione Normale I due parametri della variabile casuale normale, detti pure valori attesi, cioè µ e σ2, corrispondono alla media E(X) e varianza Var(X) della distribuzione. Si dimostra infatti che, per mezzo del calcolo integrale:

Valori attesi della Distribuzione Normale Dalle precedenti formule consegue che ogni distribuzione normale è univocamente definita dalla media e dalla varianza. Le distribuzioni normali possono differire, pertanto, per la media e varianza, nonostante mantengano costanti le caratteristiche.

Valori attesi della Distribuzione Normale Si può osservare come al variare della media e della varianza la curva subisca sia uno spostamento sull’asse dell’ascissa, sia un appiattimento; mentre se si fa variare solo la varianza e si tiene costante la media, la curva si appiattisce quando la varianza cresce e diventa più appuntita quando la varianza cala, mentre il centro di gravitazione rimane lo stesso.

La Distribuzione Normale standardizzata La distribuzione normale contiene due parametri, µ e σ2, che ne rendono difficile il calcolo. Il ricorso alla cosidetta “distribuzione standardizzata” o “ridotta” consente invece di individuare le probabilità relative ai diversi intervalli di valori mediante le tavole di probabilità.

La Distribuzione Normale standardizzata La distribuzione normale standardizzata si ottiene con la trasformazione lineare dei punti grezzi in punti z: e quindi

La Distribuzione Normale standardizzata La funzione di densità di probabilità della distribuzione normale standardizzata f(z) diventa:

La Distribuzione Normale standardizzata La distribuzione normale standardizzata presenta le stesse caratteristiche della distribuzione normale NON standardizzata. Ciò che distingue le due distribuzioni è che la normale standardizzata ha MEDIA=0 e DEVIAZIONE STANDARD=1, per cui è rappresentata da UNA SOLA CURVA, mentre la distribuzione normale generale è costituita da infinite curve a seconda dei valori di µ e σ.

Probabilità della curva normale standardizzata e relative tavole L’importanza della distribuzione normale standardizzata sta nel fatto che le probabilità corrispondenti alle superfici racchiuse dalla curva normale possono essere calcolate. Queste probabilità sono state tabulate e vengono riportate in apposite tabelle. Ciò evita il calcolo di integrali per trovare le probabilità che una v.c. X assuma valori compresi all’interno di intervalli della retta reale.

Probabilità della curva normale standardizzata e relative tavole È noto che il 68.26% dell’area totale è compreso tra ±1 deviazione standard attorno alla media, cioè a ±1 punto z dalla media; mentre il 95.44% è racchiuso tra ±2 deviazioni standard attorno alla media: quindi a ±2 punti z dalla media.

Probabilità della curva normale standardizzata e relative tavole Le tavole di probabilità della distribuzione normale vengono utilizzate per due scopi: Per calcolare l’area compresa tra due determinati valori della variabile oggetto di studio; Per conoscere la quantità dei punteggi compresi tra due valori di una variabile casuale.

Probabilità della curva normale standardizzata e relative tavole Ne troviamo di due tipi: Quelle relative alla probabilità dei singoli valori di Y(altezze della curva). Questo tipo di tavola ha scarse applicazioni. Quelle relative alla probabilità totale compresa tra due limiti qualunque X1e X2 di una variabile normale standardizzata. Questo tipo di tavola invece viene utilizzato maggiormente.

Probabilità della curva normale standardizzata e relative tavole Nello specifico tratteremo il secondo tipo di tavole. A causa della simmetria della distribuzione queste tavole riportano soltanto i valori delle probabilità comprese fra lo zero e l’ascissa +X, essendo quelle dell’altra metà della curva del tutto uguali.

Probabilità della curva normale standardizzata e relative tavole Osservando la tavola si troveranno i punti z nella colonna di sinistra con una cifra decimale; la seconda cifra decimale è posta nella prima riga in alto della stessa tavola.

In termini pratici… Supponiamo di voler conoscere l’area compresa tra le ordinate corrispondenti a z=0 e z=1,96.

In termini pratici… Osservando la colonna dei punti z, si deve scendere fino a trovare z=1,9 e, rimanendo nella stessa riga fino a trovarsi in quella indicata con 6. Il punteggio che troverete in quel punto indica la porzione di area compresa tra le due ordinate: 0,4750. Poiché l’area totale sotto la curva alla destra dell’ordinata corrispondente a z=0,00 è 0,5000,l’area alla destra dell’ordinata di z =1,96 sarà : 0,5000-0,4750=0,0250.

In termini pratici… Supponiamo di voler conoscere la porzione di area sotto la curva tra le ordinate corrispondenti a z=-1,00 e z=+1,00.

In termini pratici… Cercando nella tabella troverete che la porzione di area sotto la curva compresa z=0,00 e z=1,00 è 0,3413. Dalla porzione opposta della curva si troverà ovviamente lo stesso valore, quindi la proporzione di area si otterrà sommando i due valori: 0.3413+0,3413=0,6826.

In termini pratici… Supponiamo ora di voler trovare l’area sotto la curva compresa tra z=0,50 e z=2,50.

In termini pratici… Poiché le tavole danno solo le aree a partire dal punto z=0,00, il calcolo richiede il seguente passaggio: l’area tra le ordinate corrispondenti a z=0,00 e z=0,50 è 0,1915; mentre l’area tra z=0,00 e z=2,50 è 0,4938. È allora necessario togliere la porzione di area che va da z=0,00 a z=0,50. Basta allora sottrarre le due precedenti aree: 0,4938-0,1915=0,3023. Il punteggio ottenuto è la proporzione di area ricercata. se si vuole esprimere le proporzioni di area in percentuale,basta moltiplicare le aree per 100.