Trattamento delle Osservazioni

Slides:



Advertisements
Presentazioni simili
Misure ed Errori Prof Valerio CURCIO.
Advertisements

Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Le distribuzioni di probabilità continue
LA VARIABILITA’ IV lezione di Statistica Medica.
Intervalli di confidenza
Proprietà degli stimatori
STATISTICA DESCRITTIVA
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
Misura Misura diretta Confronto diretto con l’unita’ di misura e/o multipli e sottomultipli Misura indiretta La grandezza da misurare e’ legata da una.
Valutazione delle ipotesi
STATISTICA DESCRITTIVA
Processi Aleatori : Introduzione – Parte I
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 4: La funzione di Gauss
Corso di biomatematica Lezione 2: Probabilità e distribuzioni di probabilità Davide Grandi.
Corso di biomatematica lezione 6: la funzione c2
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
ISTOGRAMMI E DISTRIBUZIONI : i xixi
Cenni di teoria degli errori
Lezione 4 Probabilità.
Lezione 5 Strumenti statistici: campioni e stimatori
Popolazione campione Y - variabile casuale y - valori argomentali Frequenza relativa: Estrazione Densità della classe i-esima: Lezione 1.
Propagazione degli errori
METODI E CONTROLLI STATISTICI DI PROCESSO
Quale valore dobbiamo assumere come misura di una grandezza?
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
Le distribuzioni campionarie
Tutte le grandezze fisiche si dividono in
Le rappresentazioni grafiche
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
STATISTICA INFERENZIALE
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
STATISTICA La statistica è la scienza che ha come fine lo studio quantitativo e qualitativo di un "collettivo". Studia i modi (descritti attraverso formule.
Statistica La statistica è
PROPAGAZIONE DEGLI ERRORI:
La statistica.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Misure ed Errori.
Strumenti statistici in Excell
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Martina Serafini Martina Prandi
IL CAMPIONE.
Def : uno stimatore è una statistica T n le cui determinazioni servono a fornire delle stime del parametro ignoto  della v.c. X in cui sono state effettuate.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Intervalli di confidenza
Potenziamento di matematica Scoperta di un nuovo mondo.
La curva di Gauss Prof. Marco Lombardi.
Eventi aleatori Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati.
Elaborazione statistica di dati
TRATTAMENTO STATISTICO DEI DATI ANALITICI
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Elementi di statistica e probabilità Misure Meccaniche e Termiche - Università di Cassino 2 Eventi aleatori e deterministici Un evento aleatorio può.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
1 VARIABILI CASUALI. 2 definizione Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico). Esempi l’esito.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
1 TEORIA DELLA PROBABILITÁ. 2 Cenni storici i primi approcci alla teoria della probabilità sono della metà del XVII secolo (Pascal, Fermat, Bernoulli)
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
Introduzione alle distribuzioni di probabilità di Gauss o normale di Bernoulli o binomiale di Poisson o dei casi rari.
Gli Indici di VARIABILITA’
Transcript della presentazione:

Trattamento delle Osservazioni Gli errori di misura Y X A B Enrico Borgogno Mondino enrico.borgogno@unito.it Tel. Uff. 011-6705523

Quali problemi si pongono 1) Misure ripetute della stessa grandezza NON coincidono (es. Se ripeto la misura di un angolo otterrò sempre misure leggermente diverse)  esiste UNA misura VERA non conoscibile ed infinite STIME della MISURA VERA. X Y Y X A B Le misure sono affette da errori: 1) Grossolani (A e B nel disegno)  operatore 2) Sistematici  strumento 3) Accidentali  natura aleatoria del processo di misura Quale misura è quella vera?? Non si può dire. Ciò che si può dire è quale sia la miglior stima della misura vera. Posso qualificare la mia misura definendone il valore e la precisione che la caratterizza?

Come faccio a recuperare la coerenza geometrica delle osservazioni?? Quali problemi si pongono 2) Le misure reali non rispettano i criteri geometrici (es. La somma degli angoli interni di un triangolo non è 180° )  misure che devono rispettare vincoli geometrici si dicono MISURE DIRETTE CONDIZIONATE A B C    a b c Come faccio a recuperare la coerenza geometrica delle osservazioni??

La STATISTICA come possibile soluzione dei problemi Gli errori GROSSOLANI sono evidenti e possono essere facilmente rimossi  sono, in genere, errori dell’operatore (di distrazione) Gli errori SISTEMATICI possono essere rimossi o minimizzati utilizzando accorgimenti procedurali in fase di misura (regola di BESSEL per es.)  sono in genere errori connessi alle modalità operative degli strumenti utilizzati (srettifiche) Gli errori ACCIDENTALI non sono rimovibili  possono essere minimizzati e gestiti. Lo strumento deputato a tale scopo è la STATISTICA. L’approccio statistico consente di : A) STIMARE il valore della MISURA B) STIMARE il valore della precisione della MISURA C) MINIMIZZARE e REDISTRIBUIRE gli errori rispettando i vincoli geometrici (compensazione)

Che tipi di misure esistono? A = a C = c B = b  a b MISURE DIRETTE  restituite dallo strumento (misuro con distanziometro a e b) MISURE INDIRETTE  se derivate mediante formule a partire da misure dirette (ricavo c) MISURE DIRETTE CONDIZIONATE  se devono soddisfare vincoli geometrici MISURE INDIRETTE CON ESUBERANZA DI OSSERVAZIONI  ho più misure di quante ne servono, che danno luogo a più equazioni per la derivazione della stessa grandezza indiretta  risolvendole separatamente senza precauzioni il valore che ottengo per la grandezza indiretta è diverso.

VARIABILE STATISTICA TERMINOLOGIA: - POPOLAZIONE: è un insieme FINITO di individui ognuno dei quali è caratterizzato da un attributo X che può assumere valori diversi DISCRETI. - INDIVIDUI: sono i soggetti dell’indagine statistica (es. persone umane) - ATTRIBUTO: è una caratteristica discreta degli individui che viene analizzata statisticamente (colore capelli, colore degli occhi …) - VALORE ARGOMENTALE: è la misura dell’attributo La variabile statistica indica come i valori argomentali si distribuiscano fra gli individui di una popolazione reale

VARIABILE STATISTICA Intervallo argomentale [ Dx = xi+1-xi ] Frequenza assoluta [ Fi ] : numero di individui con valore argomentale xi Frequenza relativa : percentuale di individui sul totale (N) aventi valore argomentale xi

VARIABILE STATISTICA Una variabile statistica può essere rappresentata graficamente da un ISTOGRAMMA DI FREQUENZA (ASSOLUTA o RELATIVA): A TORTA A BARRE L’area dei rettangoli (o dei settori) definisce il numero di individui ricadenti in ciascuna CLASSE (può includere anche più valori incrementali)

VARIABILE STATISTICA Si definisce FUNZIONE CUMULATIVA DI FREQUENZA (relativa o cumulata) O FUNZIONE DI DISTRIBUZIONE della variabile statistica C la seguente doppia successione DIAGRAMMA CUMULATIVO DI FREQUENZA (ASSOLUTA o RELATIVA)

VARIABILE STATISTICA MOMENTI MODA: è quel valore argomentale per cui è massima la frequenza; MEDIANA: è quel valore argomentale che divide l’istogramma in due aree uguali MOMENTI Si definisce momento k-esimo rispetto al polo q (tipicamente 0) di una variabile statistica a una dimensione la seguente espressione: I momenti più significativi che descrivono una variabile statistica sono i seguenti: Momento di I grado  MEDIA Momento di II grado  VALORE QUADRATICO MEDIO

VARIABILE STATISTICA vi = xi - m1,0 Ad ogni variabile statistica ne è associabile una nuova detta variabile statistica SCARTO (vi) così definita: vi = xi - m1,0 la nuova variabile scarto V avrà lo stesso istogramma della variabile C ma l’origine delle ascisse coinciderà con il valore della media m1,0 (media nulla). Il momento di secondo grado della variabile scarto è detto varianza [ 2 ]: La radice quadrata della varianza viene detta SCARTO QUADRATICO MEDIO (s.q.m.) o DEVIAZIONE STANDARD

VARIABILE STATISTICA ATTENZIONE!! La media M è quel valore argomentale che rende minima la varianza 2. La media M ha il significato effettivo di “valore centrale”, di indice di posizione dei valori argomentali. La varianza 2 è invece un indice di “dispersione” e risulta tanto maggiore quanto più elevati sono gli scarti. Pertanto tale indice rispecchia la distribuzione dei valori argomentali.

DALLA VARIABILE STATISTICA ALLA MISURA L’operazione di misura costituisce un’ESTRAZIONE CASUALE di valori argomentali da una popolazione IGNOTA. L’ESTRAZIONE CASUALE è un evento ALEATORIO (o STOCASTICO) cioè per il quale non è possibile prevedere l’esito. L’ESTRAZIONE è CASUALE solo se gli individui della popolazione sono identici (non riconoscibili) UN’ESTRAZIONE CASUALE da una popolazione costituisce un CAMPIONAMENTO e definisce una VARIABILE STATISTICA CAMPIONE (numero finito di individui) E’ possibile dal CAMPIONE dedurre informazioni circa la popolazione dalla quale è stato estratto?  è possibile da poche misure ripetute dedurre (STIMARE) la vera misura?

DALLA VARIABILE STATISTICA ALLA MISURA Legge EMPIRICA del CASO Quando si effettua un numero N (grande a piacere) di estrazioni da una popolazione e ogni volta si rimette l’individuo estratto nella popolazione, si constata che: A) tutti i valori argomentali della popolazione sono stati estratti; B) le frequenze relative della variabile statistica tendono a stabilizzarsi cioè: F’i (del campione) Fi (della popolazione “possibile”) Nel caso di fenomeni aleatori non è mai prevedibile la modalità di uscita di un singolo evento, mentre si può quasi sempre ottenere una buona previsione di come si distribuiranno i risultati di un grande numero di estrazioni. Si può affermare che un fenomeno aleatorio sarà conosciuto quando sarà nota la sua distribuzione.

DALLA VARIABILE STATISTICA ALLA MISURA Legge EMPIRICA del CASO La distribuzione “POSSIBILE” (non reale ma potenziale) che definisce un fenomeno aleatorio viene chiamata VARIABILE CASUALE. La distribuzione è POSSIBILE perché ne si immagina l’esistenza attraverso la sperimentazione di successive estrazioni di variabili statistiche campione. La VARIABILE CASUALE gode di tutte le proprietà della VARIABILE STATISTICA ma le frequenze associate ai valori argomentali definiscono la PROBABILITA’ con la quale quel VALORE INCREMENTALE può essere estratto. La probabilità, legata alla variabile casuale, è un concetto aprioristico assiomatico (PREVISIONALE), mentre la frequenza, legata alla variabile statistica, è un indice che misura a posteriori i risultati di una indagine statistica (DESCRITTIVO).

LA MISURA DIRETTA DI UNA GRANDEZZA é UN EVENTO ALEATORIO !!! La ripetizione delle osservazioni di una stessa grandezza definisce una VARIABILE STATISTICA CAMPIONE attraverso la quale si vuole avere informazioni circa la POPOLAZIONE che rappresenta. LA POPOLAZIONE cui il processo di misura fa riferimento definisce una VARIABILE CASUALE (distribuzione) CONTINUA pertanto le definizioni del caso discreto assumono forma differenziale e integrale (vedere seguito). Riassumendo A) variabile statistica: solo discreta – costruita a posteriori da una popolazione reale; B) variabile casuale: discreta o continua – costruibile a priori da una popolazione possibile.

VARIABILE CASUALE CONTINUA CASO DISCRETO CASO CONTINUO dp = f(x)dx p(x = xi) = pi - La funzione y = f(x) è nota come densità di probabilità di X o funzione di frequenza. - La funzione g = F(x) è nota come Funzione di Distribuzione (analogo della Frequenza cumulata)

VARIABILE CASUALE CONTINUA Momenti La funzione y = f(x) densità di probabilità di X o funzione di frequenza definita per il caso dell’evento aleatorio della MISURA si dimostra essere quella GAUSSIANA. L’operazione di MISURA DIRETTA ripetuta è un campionamento dalla popolazione la cui distribuzione (VARIABILE CASUALE) è quella GAUSSIANA (O NORMALE). Si tratta di un modello matematico avente la seguente formulazione

MISURA DIRETTA DI UNA GRANDEZZA Eseguire una misura diretta di una grandezza significa confrontarla con l’unità campione esprimendola come suoi multipli e sottomultipli. Misurare direttamente un grandezza vuol dire campionare (cerchi rossi) una popolazione GAUSSIANA di MEDIA E DEVIAZIONE STANDARD da determinare sulla base del campione estratto. N.B. A) E’ possibile operare campionamenti (gruppi di misure ripetute) diversi. B) Benchè si riferiscano alla stessa popolazione ciascun campionamento definirà una VARIABILE STATISTICA CAMPIONE diversa dall’altra  Media e S.q.m diversi

MISURA DIRETTA DI UNA GRANDEZZA Quali valori di M e s utilizzo per descrivere la popolazione POSSIBILE?? Devo STIMARE quei particolari valori di M e s che risultano i più idonei secondo il criterio della MASSIMA VEROSIMIGLIANZA Tale criterio stabilisce di definire M e s in modo tale che sia massimizzata la PROBABILITÀ COMPOSTA di estrarre proprio le osservazioni compiute in fase di campionamento. Tale probabilità vale: P(x) risulta massimizzata se risulta minimo l’esponente di e : Se la f(x) è una distribuzione GAUSSIANA, il principio di MASSIMA VEROSIMIGLIANZA conduce al principio dei MINIMI QUADRATI e la diretta applicazione di questo principio porta alla determinazione della stima più plausibile del parametro media

PROPRIETA’ degli STIMATORI Si definiscono stimatori degli operatori matematici in grado di restituire le migliori stime dei parametri della distribuzione GAUSSIANA incognita a partire da VARIABILI STATISTICHE CAMPIONE (di cui conosciamo e possiamo calcolare tutto). Tali STIMATORI devono produrre STIME: CONSISTENTI : se al tendere all’infinito del numero N degli elementi del campione la STIMA tende al suo valore teorico; NON AFFETTI DA ERRORI SISTEMATICI: se la media della popolazione delle stime coincide con la media della popolazione dalla quale vengono estratti i campioni; EFFICIENTI: se rispetto a tutte le possibili stime del parametro, la popolazione cui appartiene ha varianza minima.

POPOLAZIONI IN GIOCO NEL PROCESSO DI STIMA Esiste il CAMPIONE di MISURE DIRETTE con tutte le sue statistiche Esiste una popolazione incognita da cui il campione è stato estratto e di cui stiamo cercando le stime dei parametri che la definiscono Esiste una popolazione delle medie dei campioni estratti (parametro 1) Esiste una popolazione delle varianze dei campioni estratti (parametro 2) 3) E 4) esistono perché ogni n-pla di estrazioni che costituisce il campione definisce una propria coppia di parametri simili ma non identici. Sono possibili infiniti campioni dai quali è possibile derivare infiniti valori di media e varianza. Si dimostra che le migliori stime di media e varianza secondo i criteri sopra esposti sono: La misura della grandezza si esprimerà come:

Esempi

Esempi

Significato operativo dei parametri DISTRIBUZIONE GAUSSIANA

Significato operativo dei parametri All’intervallo è associato il concetto di precisione della misura (68% delle osservazioni). All’intervallo è associato il concetto di affidabilità della misura (95% delle osservazioni) All’intervallo è associato il concetto di tolleranza della misura (99.7% delle oss.)

MISURA INDIRETTA DI UNA GRANDEZZA (Stima della media) Sia y la grandezza determinata in modo indiretto attraverso la misura diretta delle grandezze X1, X2, .., Xk Stima della MEDIA della misura indiretta della grandezza Esempio Si definisca la misura indiretta di a dopo aver misurato in modo diretto b, a, b. A B C c a b    E’ la stima del valore medio della misura indiretta di a

MISURA INDIRETTA DI UNA GRANDEZZA Stima della VARIANZA: Legge di propagazione della varianza Stima della varianza di una grandezza misurata indirettamente attraverso misure dirette NON CORRELATE fra loro Stima della varianza di una grandezza misurata indirettamente attraverso misure dirette CORRELATE fra loro Tornando all’esempio precedente si tratta di calcolare le derivate parziali richieste:

MISURA INDIRETTA DI UNA GRANDEZZA CON MISURE ESUBERANTI Vogliamo determinare le coordinate planimetriche X,Y di un punto P visibile da due punti A e B di coordinate note (problema di intersezione semplice in avanti); la soluzione del problema avviene tramite la misura degli angoli azimutali in A e in B. In questo modo però, qualsiasi errore nella misura dei due angoli azimutali, provocherà un errore nella determinazione delle coordinate del punto P senza alcuna possibilità di accorgersene. Se invece si esegue anche la misura del lato AP, avremo la possibilità di individuare eventuali errori nella misure degli angoli A  P X Y O  B In tal caso però andiamo in ridondanza di osservazioni, cioè abbiamo più equazioni di quelle strettamente necessarie a risolvere il problema

MISURA INDIRETTA DI UNA GRANDEZZA CON MISURE ESUBERANTI La situazione nella quale ci troviamo è analoga a quella di un sistema (che ipotizziamo lineare) in cui il n° di equazioni > n° incognite = Termini noti Xi = incognite n > r Nel sistema tutte le grandezze, dirette e indirette, sono indicate con i rispettivi valori teorici di media (Li). In questo caso (mondo delle idee!!), del tutto teorico, una qualsiasi serie di r equazioni, scelte tra le n disponibili, è in grado di fornire una soluzione che soddisfa anche le restanti n-r equazioni. Nella realtà noi disponiamo solo delle stime delle grandezze misurate direttamente (Li) che partecipano al sistema pertanto le equazioni sono soddisfatte a meno degli scarti. Il sistema diventa allora: La soluzione che andiamo cercando (stima delle grandezze incognite Xi) tra tutte le possibili è quella che minimizza la quantità MINIMI QUADRATI e per la quale sia massima la probabilità di estrarre proprio quelle stime dalle rispettive popolazioni possibili.

MISURA INDIRETTA DI UNA GRANDEZZA CON MISURE ESUBERANTI Esempio1 : equazione della retta passante per l’origine Esempio 2: equazione retta Esempio 3: LIVELLAZIONE GEOMETRICA

NON FATTO MISURE DIRETTE DI DIVERSA PRECISIONE (misura di una grandezza fatta con strumenti di diversa precisione) 12 Y X O1 m O2 22 On n2 ............... Il concetto di peso di una misura: quanto conta nel processo di stima NON FATTO Estrarre un individuo (O1) dalla distribuzione che ha varianza 12 equivale ad estrarre p1 individui dalla distribuzione di varianza 02 e farne poi la media. Il peso assume il significato di fattore di omogeneizzazione. Mediante i pesi tutte le distribuzioni vengono riferite alla distribuzione 02 di peso unitario. Media stimata Deviazione standard con