DISTRIBUZIONI TEORICHE DI PROBABILITA’

Slides:



Advertisements
Presentazioni simili
Distribuzione Normale o Curva di Gauss
Advertisements

DISTRIBUZIONI TEORICHE DI PROBABILITA’
TRATTAMENTO STATISTICO DEI DATI ANALITICI
La covarianza.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Indici di Posizione Giulio Vidotto Raffaele Cioffi.
Consentono di descrivere la variabilità all’interno della distribuzione di frequenza tramite un unico valore che ne sintetizza le caratteristiche.
Organizzazione dei dati AnnoQ [m 3 /s]
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Precorso di Statistica per le Lauree Magistrali
Simboli usati popolazione deviazione standard = σ varianza = σ²
Distribuzioni limite La distribuzione normale
Dip. Economia Politica e Statistica
Variabili casuali a più dimensioni
Qualità dei dati Fabio Murena.
RICHIAMI DI INFERENZA:
Funzioni crescenti e decrescenti
Definizione di logaritmo
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
L’analisi monovariata
Le primitive di una funzione
Confronto fra 2 popolazioni
Quantitative Market Research Set-up Protocol
Il concetto di derivata
I teoremi delle funzioni derivabili
Analisi delle Traiettorie: Modelli di Crescita Latente (LGM)
Insiemi di punti: altre caratteristiche
Elementi di teoria delle probabilità
APPUNTI DI STATISTICA INFERENZIALE
Intervalli di Fiducia Introduzione Intervalli di fiducia per la media – Caso varianza nota Intervalli di fiducia per la media – Caso varianza non nota.
Confronto tra diversi soggetti:
Introduzione a Statistica e Probabilità
Precorso di Statistica per le Lauree Magistrali
Relazione sulla statistica
Riepilogo La STANDARDIZZAZIONE, attraverso il calcolo dei punti z, ha un duplice obiettivo: Rende immediato il confronto tra punteggi ottenuti su scale.
La Statistica Istituto Comprensivo “ M. G. Cutuli”
Appunti di analisi matematica: Integrale Definito
L’analisi monovariata
ANALISI DELLE DISTRIBUZIONI STATISTICHE
Indici di variabilità La variabilità è la ragione dell’esistenza della psicologia. Le persone hanno dei comportamenti diversi che non possono essere predetti.
Organizzazione dei dati
Elaborazione statistica di dati
Un esempio Una casa farmaceutica dichiara che un nuovo antidolorifico che sta per immettere sul mercato fa effetto mediamente in un tempo pari a 12,75.
Statistica descrittiva
L’indagine statistica
Statistica Scienza che studia i fenomeni collettivi.
La standardizzazione dei punteggi
Simboli usati popolazione deviazione standard = σ varianza = σ²
Confronto tra diversi soggetti:
Università degli Studi di Modena e Reggio Emilia
Quantitative Market Research Set-up Protocol
Intervalli di confidenza
“Una delle più grandi scoperte che un uomo può fare, una delle sue più grandi sorprese, è scoprire che può fare ciò che aveva paura di non poter fare”.
Le primitive di una funzione
Simboli usati popolazione: media = μ deviazione standard = σ
Interpretare la grandezza di σ
Riepilogo La STANDARDIZZAZIONE, attraverso il calcolo dei punti z, ha un duplice obiettivo: Rende immediato il confronto tra punteggi ottenuti su scale.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
ANALISI DI REGRESSIONE
Esercizio La popolazione di adulti presenta una media di ansia pari a 4. Ad un campione di 35 soggetti con disturbo ossessivo compulsivo è stato somministrato.
Precorso di Statistica per le Lauree Magistrali
RICHIAMI DI INFERENZA:
Corso di Analisi Statistica per le Imprese
Corso di Analisi Statistica per le Imprese
Esercitazione 1: Rispetto al test di ansia (Media=25; σ=5), calcolare:
Flusso del campo elettrico e teorema di Gauss
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
Transcript della presentazione:

DISTRIBUZIONI TEORICHE DI PROBABILITA’

DISTRIBUZIONI TEORICHE DI PROBABILITA’ DEFINIZIONI: Qualsiasi caratteristica misurabile è denominata variabile. Se una variabile può assumere numerosi valori tali che qualsiasi risultato è determinato dal caso, essa è nota come variabile casuale Una V.C. è un numero X che assume un valore in R, determinato sulla base di un evento E che si è presentato in seguito all’esperimento al quale si riferisce. Tale numero è assunto da X con probabilità P Una distribuzione di probabilità è una funzione che sintetizza la relazione tra i valori di una variabile casuale e la probabilità che questi si presentino Una distribuzione di probabilità applica la teoria della probabilità per descrivere il comportamento di una variabile.

OSSERVAZIONI Una distribuzione è analoga ad una distribuzione di frequenze relative , ma mentre questa si ricava da un campione di osservazioni estratte da un popolazione, una distribuzione di probabilità è in relazione alla popolazione di tutti i possibili risultati Una distribuzione continua non permette la stima della probabilità di estrarre un particolare valore, ma solo quelli compresi in un dato intervallo. Per esempio, nella distribuzione delle altezze di una popolazione di studenti, non è possibile stimare la probabilità di avere un individuo alto esattamente 176,000 cm ma quella di avere un individuo tra 180 e 190 centimetri

La forma di una distribuzione di probabilità continua è usualmente definita da una curva senza sbalzi, mentre per una variabile discreta la probabilità è definita per i valori puntuali della variabile , e il grafico della distribuzione rassomiglia ad una serie di impulsi La forma di una distribuzione può essere simmetrica rispetto al valore centrale o ci può essere una coda più lunga da un lato piuttosto che da un altro. Se la coda è a sinistra (destra) la distribuzione viene detta asimmetrica a sinistra (destra)

La Distribuzione Gaussiana Le distribuzioni normali sono una famiglia di curve simmetriche a forma di campana e unimodali (moda media e mediana coincidono). Hanno tutte la stessa forma ma sono caratterizzate (e completamente individualizzate) dai due valori: media e varianza N(μ,σ2). Densità di Probabilità L’area totale sotto la curva è 1

1. Caratteristiche di una distribuzione Normale La curva Normale è Unimodale e simmetrica rispetto alla sua media (μ) Frequenza relativamente più elevata dei valori centrali e frequenze progressivamente minori verso gli estremi. La media, la mediana e la moda della distribuzione coincidono La Deviazione Standard, rappresentata da , indica la quantità di dispersione delle osservazioni intorno alla media I parametri μ e σ definiscono in modo completo la curva

2. Caratteristiche di una distribuzione Normale La funzione di densità è simmetrica rispetto alla media: cresce da zero fino alla media e poi decresce fino a +∞. Ha due flessi: il primo, ascendente, nel punto μ-σ; il secondo, discendente, nel punto μ+σ. Se μ varia e σ rimane costante, si hanno infinite curve normali con la stessa forma e la stessa dimensione, ma con l'asse di simmetria in un punto diverso. Quando due distribuzioni hanno media differente, è possibile ottenere l'una dall'altra mediante traslazione o trasformazione lineare dei dati. Se invece μ rimane costante e σ varia, tutte le infinite curve hanno lo stesso asse di simmetria; ma hanno forma più o meno appiattita, secondo il valore di σ.

Le due curve della figura 11 hanno media μ identica e deviazione standard σ differente.

Le due curve della figura 12 hanno deviazione standard σ identica e media μ differente.

In Figura 13 sono riportate 2 distribuzioni normali che differiscono sia per la media sia per la dispersione dei dati

3. Caratteristiche di una distribuzione Normale La probabilità che un valore estratto a caso da una N(μ,σ2): - sia compreso nell’intervallo (μ -σ , μ+σ) è pari a 0.6826, - che sia compreso tra (μ -2σ , μ+2σ) è pari a 0,9544 - che sia compreso tra (μ -3σ , μ+3σ) è pari a 0,9973 In una distribuzione Normale: - il 90% dei valori centrali cade nell’intervallo (μ - 1.65σ , μ+1.65σ) - il 95% dei valori centrali cade nell’intervallo (μ - 1.96σ , μ+1.96σ) - il 99% dei valori centrali cade nell’intervallo (μ – 2.58σ , μ+2.58σ)

AREE SOTTO LA CURVA NORMALE COMUNEMENTE USATE

Poiché i valori di μ e σ dipendono dal particolare problema in considerazione le probabilità di trovare dei valori in un determinato intervallo, anche diverso da quelli comunemente usati, e descritti nel grafico precedente, diventa complicato. Non ci sono tavole di probabilità per tutti i possibili valori di μ e σ, esiste una tavola unica che può essere usata per tutte le variabili Normali. Tale tavola si riferisce ad una particolare distribuzione: la distribuzione Normale Standardizzata. La distribuzione normale standardizzata o normale ridotta, si ottiene mediante il cambiamento di variabile dato da

La standardizzazione è una trasformazione che consiste nel: - rendere la media nulla (μ = 0), poiché ad ogni valore viene sottratta la media; - prendere la deviazione standard σ come unità di misura (σ = 1) della nuova variabile. La distribuzione normale ridotta viene indicata con N(0,1), che indica appunto una distribuzione normale con media 0 e varianza uguale a 1. In ogni distribuzione Normale con media μ e d.s. σ, la probabilità tra x1 e x2 è la stessa che tra z1 e z2 nella distribuzione Normale Standardizzata, dove z1=(x1- μ)/ σ z2=(x2- μ)/ σ

Caratteristiche di una Distribuzione Normale Standard In una Distribuzione Normale Standardizzata: La probabilità che un valore estratto a caso sia compreso tra -1 e 1 è pari a 0,683 e che sia compreso tra -2 e 2 è pari a 0,954 Il 95% dei valori centrali di una distribuzione Normale standard cadono nell’intervallo (-1.96 ,+1.96) ed il 99% nell’intervallo (– 2.58 , +2.58) Tutti i valori di probabilità per z sono riportati in una tavola, detta tavola di probabilità I valori nel corpo della tabella mostrano l’area sotto la curva N.S. alla destra di z. Queste sono le probabilità di trovare un valore uguale o superiore a z

Area a dx di Z

Uso della tavola di Probabilità Gaussiana Due sono gli usi della tavola di probabilità: Definito un intervallo di valori di X, serve per calcolare la probabilità che un valore x cada al suo interno Definita una probabilità, serve per calcolare l’intervallo dei valori X che corrisponde a tale probabilità.

Esercizio Si consideri una popolazione con altezza distribuita in maniera Gaussiana con media (µ) =172,5 cm e deviazione standard (σ) = 6,25 cm. Qual è la probabilità di incontrare un individuo estratto da tale popolazione e di altezza superiore a cm 190? Z = (190 – 172,5) / 6,25 = 2,8  Dalle tavole trovo p= 0,00256, quindi la probabilità di trovare un soggetto più alto di 190cm è dello 0,2%

Qual è la probabilità di incontrare un individuo estratto da tale popolazione con un’altezza compresa tra cm 165 e175? Z1= (165 – 172,5) / 6,25 = -1.2 Z2= (175 – 172,5) / 6,25 = 0.4 P(Z1)=0.115 P(Z2)=0.345 P(165≤ X ≤ 175) = P(-1.2≤ Z ≤ 0.4) = 1- [0.115+0.345]=0.54

Qual è quel valore di altezza che delimita il 5% superiore della distribuzione? p=0.05  z =1.645 z =(x-172.5)/6.25  1.645=(x-172.5)/6.25 x = 172.5+(6.25*1.645) x = 182.78 Circa il 5% della popolazione in studio ha un’altezza superiore di 182.78 cm