Valutazione della stima: gli intervalli di confidenza

Slides:



Advertisements
Presentazioni simili
8) GLI INTERVALLI DI CONFIDENZA
Advertisements

Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Le distribuzioni di probabilità discrete
Le distribuzioni di probabilità continue
2. Introduzione alla probabilità
variabili aleatorie discrete e continue
Distribuzione Normale o Curva di Gauss
Intervalli di confidenza
Proprietà degli stimatori
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
LA DISTRIBUZIONE NORMALE
Variabili casuali a più dimensioni
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
STATISTICA A – K (60 ore) Marco Riani
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Esercizi x1=m-ts x2=m+ts
DALL'INTERVALLO DI PROBABILITÀ
ISTOGRAMMI E DISTRIBUZIONI:
DIFFERENZA TRA LE MEDIE
Processi Aleatori : Introduzione – Parte I
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 4: La funzione di Gauss
Corso di biomatematica lezione 6: la funzione c2
Corso di biomatematica lezione 7-2: Test di significatività
STATISTICA a.a PARAMETRO t DI STUDENT
ISTOGRAMMI E DISTRIBUZIONI : i xixi
Esercizi x1=m-ts x2=m+ts
Stima dei parametri di una distribuzione
Il Teorema del Limite Centrale
Misure di dispersione Giovanni Filatrella
di cosa si occupa la statistica inferenziale?
VERIFICA DEI RIFLESSI …Tutto ciò che avreste voluto sapere e non avete mai osato chiedere… M. & D.
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 6 Inferenza statistica
PROBABILITÀ La probabilità è un giudizio che si assegna ad un evento e che si esprime mediante un numero compreso tra 0 e 1 1 Evento con molta probabilità.
Il test di ipotesi Cuore della statistica inferenziale!
Quale valore dobbiamo assumere come misura di una grandezza?
Le distribuzioni campionarie
TRATTAMENTO DEI DATI ANALITICI
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
STATISTICA CHEMIOMETRICA
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
Intervalli di fiducia.
Esercizi Due gruppi di studenti effettuano la misura della densità di un oggetto, trovando rispettivamente i valori 13.7 ± 0.9 g/cm3 e ± 1300 kg/m3.
Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –
La verifica d’ipotesi Docente Dott. Nappo Daniela
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
IL CAMPIONE.
“Teoria e metodi della ricerca sociale e organizzativa”
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
Intervalli di confidenza
Elementi di statistica La stima del valore vero
Elaborazione statistica di dati
Esercitazioni di Statistica con Matlab Dott
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
Statistica con Excel Corso di Fisica ed Elementi di Laboratorio ed Informatica CdL Scienze Biologiche AA 2015/2016.
Introduzione alle distribuzioni di probabilità di Gauss o normale di Bernoulli o binomiale di Poisson o dei casi rari.
Trattamento dei dati sperimentali
Transcript della presentazione:

Valutazione della stima: gli intervalli di confidenza Elaborazione Statistica dei Dati Sperimentali Facoltà di Scienze MM FF e NN, Università del Sannio Valutazione della stima: gli intervalli di confidenza Giovanni Filatrella (filatrella@unisannio.it) G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Stima degli intervalli di confidenza Dati due valori del parametro incognito l , l1 e l2, supponendo di conoscere la distribuzione di probabilità dello stimatore di l, dipendente da N esperimenti xi, trovare l1 e l2 significa trovare i loro valori in modo che : P(T l(x)|l1 l l2)=1-a Importante: Gli estremi dell’intervallo sono valori casuali e non fissati. La procedura è generale ed indipendente dai dati xi effettivamente ottenuti, ma i valori da attribuire a l1 e l2 dipendono dagli specifici dati sperimentali. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Esempio di applicazione dell’intervallo di confidenza “La percentuale x di fumatori in una scuola superiore è compresa fra il 10% ed il 30% ad un livello di significatività del 95%.” densità di probabilità di Tx 95% x1 x2 x G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Livello di significatività degli intervalli di confidenza è detto livello di significatività dell’intervallo [l1,l2]. 1-a è detto coefficiente o livello di confidenza dell’intervallo [l1,l2]. Ex: per una variabile gaussiana a media 0, trovare l’intervallo di confidenza al 68% del valore medio significa stabilire che tale intervallo è: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Scelta degli estremi degli intervalli di confidenza Pur avendo scelto un determinato livello di significatività l’intervallo [l1,l2] potrebbe essere diverso, ad esempio non simmetrico attorno a 0: La scelta più opportuna dipende dallo specifico problema. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Esempi di intervalli di confidenza non simmetrici Un fertilizzante si suppone che migliori la produttività media del frumento. Se è nota la produttività senza fertilizzante potrebbe essere interessante chiedersi a che livello di confidenza l’uso del fertilizzante migliori la produttività abbastanza da ripagarne il costo: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Esempi di intervalli di confidenza non simmetrici Un fertilizzante si suppone che migliori la produttività media del frumento. Se è nota la produttività senza fertilizzante xo potrebbe essere interessante chiedersi a che livello di confidenza l’uso del fertilizzante migliori la produttività abbastanza da ripagarne il costo: densità di probabilità di Tx 70% x2= x0 x1 x G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Interpretazione degli intervalli di confidenza Se si ripetessero le misure sullo stesso sistema con un determinato valore del parametro incognito, allora 1-a delle serie di misure indicherebbero degli intervalli che effettivamente contengono il parametro “vero”. Se si utilizzasse lo stesso metodo per la costruzione degli intervalli su sistemi diversi, allora nella frazione 1-a dei casi si indicherebbero intervalli contenenti il valore corretto. Non è corretto però dire che il valore vero del parametro è contenuto nell’intervallo di confidenza con probabilità a G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Applicazione degli intervalli di confidenza Supponiamo di misurare la lunghezza di una scrivania con un metodo soggetto ad errore casuale, quindi ripetendo le misure i valori trovati non sono sempre uguali. Ad esempio si è ottenuto, in cm: 203 201 201 202 204 Fra quali valori è compresa la lunghezza della porta al livello di significatività a=5%? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Passo 1: stima puntuale Poiché supponiamo che le misure siano distribuite gaussianamente, determinare il valore vero della lunghezza della scrivania corrisponde a stimare il valore aspettato della distribuzione delle misure: La migliore stima della lunghezza della scrivania è 202,2 cm G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Passo 2: stima dell’incertezza La stima che abbiamo effettuato è una valutazione, cioè a sua volta una variabile casuale distribuita gaussianamente la cui deviazione standard può essere stimata essere: Il valore vero del parametro incognito è distribuito gaussianamente con valore aspettato E[x]  202.2 cm deviazione standard s0.7 cm G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Rappresentazione grafica dei risultati ottenuti: E[x]=202.2cm s=0.7cm densità di probabilità 201.5 202.2 202.9 L(cm) G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Passo 3: intervallo di confidenza Poiché ora conosciamo “tutto” della distribuzione di probabilità del valore stimato, possiamo rispondere alla domanda “quali sono le lunghezze nelle quali le mie misure, al livello di significatività del 5%, possono essere generate dalla lunghezza vera della scrivania”? : Il problema viene così ricondotto a trovare gli estremi di una distribuzione gaussiana tali da racchiudere una probabilità del 95%. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

Un possibile intervallo di confidenza: Una scelta possibile è di chiedere che la probabilità sia racchiusa in un intervallo simmetrico attorno al valore di massima verosimiglianza: Stimando s e conoscendo la stima si trova m2: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Esercizi Trovare m1 nell’esercizio precedente. Se la scrivania deve essere inserita in una rientranza, quale intervallo di confidenza è più opportuno scegliere? **Ad un livello di significatività dell’1% l’intervallo di confidenza è più ampio? Perché? Ripetere l’esercizio ad un livello di significatività dell’1%. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali