RELAZIONE LINEARE: I MINIMI QUADRATI (cenni)

Slides:



Advertisements
Presentazioni simili
Misure ed Errori Prof Valerio CURCIO.
Advertisements

ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
- le Medie la Moda la Mediana
Corso di esperimentazione di fisica 1 Il metodo dei minimi quadrati
Le distribuzioni di probabilità continue
Come possono essere classificati?
Intervalli di confidenza
Fisica: lezioni e problemi
Lez. 3 - Gli Indici di VARIABILITA’
Elementi di statistica Elementi di statistica M. Dreucci Masterclasses LNF Elementi di statistica M. Dreucci.
Dato un insieme di misure sperimentali di una stessa grandezza,
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
Valutazione delle ipotesi
LA PROPAGAZIONE DEGLI ERRORI:
Esercizio Si misura la lunghezza d’onda  di una riga spettrale nell’intervallo delle microonde e si trovano i seguenti valori, espressi in nanometri:
Esercizi x1=m-ts x2=m+ts
Esercizi Si deve preparare una soluzione di NaCl con una concentrazione pari a c=1 g/l con errore inferiore all’1%. Viene utilizzato un matraccio da 50.
Canale A. Prof.Ciapetti AA2003/04
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 5: propagazione degli errori
Corso di biomatematica lezione 4: La funzione di Gauss
Corso di biomatematica lezione 6: la funzione c2
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
STATISTICA a.a LA STATISTICA INFERENZIALE
ISTOGRAMMI E DISTRIBUZIONI : i xixi
Esercizi x1=m-ts x2=m+ts
Valutazione della stima: gli intervalli di confidenza
Cenni di teoria degli errori
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Parte I (introduzione) Taratura degli strumenti (cfr: UNI 4546) Si parla di taratura in regime statico se lo strumento verrà utilizzato soltanto per misurare.
Metodi numerici per equazioni differenziali ordinarie Laboratorio di Metodi Numerici a.a. 2008/2009.
Propagazione degli errori
Alberto Franchi Teoria e Progetto di Costruzioni e Strutture
Quale valore dobbiamo assumere come misura di una grandezza?
Grandezze e Misure.
Tutte le grandezze fisiche si dividono in
TRATTAMENTO DEI DATI ANALITICI
Grandezze e funzioni Marco Bortoluzzi.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Cenni teorici. La corrente elettrica dal punto di vista microscopico
Grandezze e Misure.
STATISTICA CHEMIOMETRICA
Fisica: lezioni e problemi
Le misure sono osservazioni quantitative
PROPAGAZIONE DEGLI ERRORI:
Esercizi Due gruppi di studenti effettuano la misura della densità di un oggetto, trovando rispettivamente i valori 13.7 ± 0.9 g/cm3 e ± 1300 kg/m3.
Lezione B.10 Regressione e inferenza: il modello lineare
Misure ed Errori.
Il residuo nella predizione
L’ESPERIENZA DI LABORATORIO
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
Elementi di statistica Le cifre significative
Intervalli di confidenza
Elementi di statistica La stima del valore vero
TRATTAMENTO STATISTICO DEI DATI ANALITICI
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
I GRAFICI – INPUT 1.
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
Statistica con Excel Corso di Fisica ed Elementi di Laboratorio ed Informatica CdL Scienze Biologiche AA 2015/2016.
Gli Indici di VARIABILITA’
Transcript della presentazione:

RELAZIONE LINEARE: I MINIMI QUADRATI (cenni) Spesso si ha a che fare con grandezze legate tra loro da una relazione lineare. E possibile ricavare la relazione funzionale tra le grandezze tramite la misura delle stesse. Esempio: s Legge del moto rettilineo uniforme: tramite la misura della posizione si ad istanti di tempo successivi ti si ricostruisce la legge oraria e si ricava quindi la posizione iniziale s0 e la velocità v t

RELAZIONE LINEARE: I MINIMI QUADRATI (cenni) Misurando le coppie di valori: dove in genere gli xi sono supposti con errore trascurabile, mentre agli yi viene associato un errore sperimentali di si vuole ricavare l’equazione della retta che meglio interpola (fitta) i dati sperimentali. In pratica considerata la retta: Y=A+B·x si vogliono ricavare i valori (e i rispettivi errori) dei parametri A e B

RELAZIONE LINEARE: I MINIMI QUADRATI (cenni) Si dimostra che la miglior retta (e quindi i valori dei parametri della retta) si ottiene andando a minimizzare la seguente quantità: Chi-quadrato

RELAZIONE LINEARE: I MINIMI QUADRATI (cenni) Si possono quindi ricavare delle formule per calcolare i parametri A e B della retta, ed i rispettivi errori.

RELAZIONE LINEARE: I MINIMI QUADRATI (cenni) Nel caso semplificato: i valori yi abbiano anch’essi errore trascurabile, o tutti gli errori sono uguali tra loro, le formule si “riducono” a: Tali analisi vengono in genere affrontate mediante l’uso di opportuni software di statistica, che forniscono i valori dei parametri, e dei loro errori, unitamente a indici di bontà del fit

Test del chi quadrato (cenni) Il fatto di avere delle formule o degli algoritmi che permettono di ricavare i valori incogniti dei parametri non significa automaticamente che le misure sperimentali sono in accordo con la relazione funzionale ipotizzata. Un primo, banale test per verificare l’esistenza della relazione è mettere in grafico i valori delle misure e confrontarli con la curva prevista (es. retta).

Test del chi quadrato (cenni) Un metodo quantitativo è statisticamente corretto per verificare l’accordo dei dati con una determinata relazione funzionale è il test del chi quadrato Idealmente il numeratore (e quindi anche il chi quadrato) dovrebbe essere uguale a zero (se tutti i punti giacessero sulla retta). In realtà ci si aspetta che la differenza tra la misura (yi) e la previsione (A+B·xi) sia dello stesso ordine di grandezza dell’error sperimentale di pertanto ci si aspetta che ogni termine della sommatoria sia uguale a 1. Di conseguenza è ragionevole aspettarsi che il chi quadrato sia circa uguale al numero di misure effettuate (il numero cioè di addendi che sommo)

Test del chi quadrato (cenni) Per generalizzare il discorso risulta quindi utile considerate il chi quadrato ridotto, definito come rapporto tra il chi quadrato e il numero di gradi di libertà: Il numero di gradi di libertà ng lo possiamo considerare come il numero di misure, meno il numero di parametri ricavati a partire da tali misure Il numero di gradi di libertà ng lo possiamo considerare come il numero di misure, meno il numero di parametri ricavati a partire da tali misure Di conseguenza è ragionevole aspettarsi che il chi quadrato ridotto sia poco superiore a 1. Anche per il chi quadrato (ridotto) esiste una funzione di densità di probabilità (analogamente alla gaussiana) e, a partire da questa funzione è possibile calcolare quanto vale la probabilità di trovare un certo valore di chi quadrato.

Test del chi quadrato (cenni) Probabilità percentuale di trovare un valore di chi quadrato ridotto maggiore o uguale a valori prefissati, in funzione del numero di gradi di libertà. Con tale tabella si ricava quindi la probabilità che le misure fatte siano regolate dalla relazione che era stata ipotizzata (ipotesi verificata se P>5%)

Test del chi quadrato (cenni) In corrispondenza dei seguenti valori delle ascisse (tempo): 0s, 2s, 3s, 5s, sono misurati I seguenti valori della variabile y (spazio =: -1.3 cm, 4.5 cm, 6.3 cm, 11.8 cm). L’errore sulle x è trascurabile, quello sulle y è pari a 0.4 cm per tutti I punti. Si suppone l’esistenza di una relazione lineare y=A+Bx con A=-1 e B=2.5. Verificare tale ipotesi mediante il test del chi quadrato

Test del chi quadrato (cenni) In corrispondenza dei seguenti valori delle ascisse (tempo): 0s, 2s, 3s, 5s, sono misurati I seguenti valori della variabile y (spazio =: -1.3 cm, 4.5 cm, 6.3 cm, 11.8 cm). L’errore sulle x è trascurabile, quello sulle y è pari a 0.4 cm per tutti I punti. Si suppone l’esistenza di una relazione lineare y=A+Bx con A=-1 e B=2.5. Verificare tale ipotesi mediante il test del chi quadrato Calcoliamo il chi quadrato: I gradi di libertà sono 4 (ho quattro misure e nessun parametro ricavato dai dati, A e B infatti sono noti (ipotizzati): Il chi quadrato ridotto è quindi pari a:

Test del chi quadrato (cenni) In corrispondenza dei seguenti valori delle ascisse (tempo): 0s, 2s, 3s, 5s, sono misurati I seguenti valori della variabile y (spazio =: -1.3 cm, 4.5 cm, 6.3 cm, 11.8 cm). L’errore sulle x è trascurabile, quello sulle y è pari a 0.4 cm per tutti I punti. Si suppone l’esistenza di una relazione lineare y=A+Bx con A=-1 e B=2.5. Verificare tale ipotesi mediante il test del chi quadrato Dalla tabella si ricava che la probabilità di avere un valore di chi quadrato ridotto con 4 gradi di libertà pari a 0.73 è circa 59% (interpolando i valori tabulati per 0.6 e 0.8). L’ipotesi di linearità con i parametri dati può quindi dirsi ben verificata.

Test del chi quadrato (cenni) Abbiamo introdotto il test del chi quadrato nel caso specifico di una relazione lineare. E’ tuttavia possibile generalizzare il discorso e usare il test per valutare quanto i dati misurati si adattano bene ad una funzione teorica ipotizzata f(x) qualsiasi (retta, parabola, esponenziale, ecc…)

FORMULE ED ELEMENTI DA RICORDARE -1 errore (assoluto): errore relativo: errore%: media aritmetica: dev. standard della media: dev. standard: propagazione degli errori: somma e differenze: prodotti e rapporti:

FORMULE ED ELEMENTI DA RICORDARE -2 (significato dei parametri e uso della tabella delle probabilità) Gaussiana: compatibilità: media pesata: errore sulla media pesata: rappresentazione dei risultati FINALI con il corretto numero di CIFRE SIGNIFICATIVE

Esercizi Si usano due metodi differenti per misurare il carico di rottura di un filo di acciaio e si fanno 10 misure per ognuno dei metodi. I risultati, espressi in tonnellate, sono i seguenti: Metodo A: 3.3 3.5 3.7 3.2 3.6 3.5 3.6 3.4 3.6 3.9 Metodo B: 3.5 3.6 3.6 3.7 3.5 3.6 3.5 3.5 3.6 3.5 stimare la precisione di ciascun metodo calcolare la media ed il rispettivo errore per ciascun metodo. Esprimere l’errore anche in termini percentuali dire quante misure si dovrebbero fare con il metodo meno preciso in modo da ottenere un errore uguale a quello dell’altro metodo. Si consideri il parallelepipedo a base rettangolare rappresentato in figura. Si sono misurati i lati della base e l’altezza trovando i seguenti valori: a =(14 ± 3) cm; b =(10 ± 3) cm; cm; h=(36 ± 3) cm Calcolare: Il perimetro della base con il suo errore L’area di base con il suo errore Il volume del parallelepipedo con il suo errore h b a

Esercizi Tre biologi, attraverso tre differenti tecniche di misura, calcolano il tasso di riproduzione di una colonia di batteri, cioè misurano il tempo necessario affinché la popolazione della colonia di batteri raddoppia. I tempi registrati sono: biologo 1: tempo = 11.4 ± 0.6 giorni biologo 2: tempo = 11.8 ± 0.2 giorni biologo 3: tempo = 12.2 ± 0.6 giorni Trovare la miglior stima del tempo e la sua incertezza. Determinare la compatibilità tra i valori ottenuti dal biologo 1 e 3. Un’analisi condotta si 1000 uomini ha rivelato che le altezze sono distribuite normalmente attorno al valore (1.780 ±0.005) m. Dire quanti uomini ci si attende con: Altezza compresa tra 1.75 e 1.81 m Atezza maggiore di 1.85 m Altezza maggiore di 1.65 m Altezza compresa tra 1.65 e 1.75 m

Esercizi Si usano due metodi differenti per misurare il carico di rottura di un filo di acciaio e si fanno 10 misure per ognuno dei metodi. I risultati, espressi in tonnellate, sono i seguenti: Metodo A: 3.3 3.5 3.7 3.2 3.6 3.5 3.6 3.4 3.6 3.9 Metodo B: 3.5 3.6 3.6 3.7 3.5 3.6 3.5 3.5 3.6 3.5 stimare la precisione di ciascun metodo calcolare la media ed il rispettivo errore per ciascun metodo. Esprimere l’errore anche in termini percentuali dire quante misure si dovrebbero fare con il metodo meno preciso in modo da ottenere un errore uguale a quello dell’altro metodo. i) La precisione è data dalla deviazione standard che risulta pari a: Metodo A: SA=0.2; Metodo B: SB=0.07 ii) iii) Il metodo A è quello meno preciso. Per avere un errore sulla media uguale a quello del metodo B è necessario effettuare un numero N’ di misure tale da avere:

Esercizi h b a p=(48 ± 8) cm A=(140 ± 52) cm2 Si consideri il parallelepipedo a base rettangolare rappresentato in figura. Si sono misurati i lati della base e l’altezza trovando i seguenti valori: a =(14 ± 3) cm; b =(10 ± 3) cm; cm; h=(36 ± 3) cm Calcolare: Il perimetro della base con il suo errore L’area di base con il suo errore Il volume del parallelepipedo con il suo errore h 1) La base è un rettangolo il cui perimetro è pari a: b a Per il calcolo dell’errore applico la formula di propagazione per somme/differenze: p=(48 ± 8) cm 2) L’area di base è pari a: Per il calcolo dell’errore applico la formula di propagazione per prodotti/rapporti: A=(140 ± 52) cm2

Esercizi Si consideri il parallelepipedo a base rettangolare rappresentato in figura. Si sono misurati i lati della base e l’altezza trovando i seguenti valori: a =(14 ± 3) cm; b =(10 ± 3) cm; cm; h=(36 ± 3) cm Calcolare: Il perimetro della base con il suo errore L’area di base con il suo errore Il volume del parallelepipedo con il suo errore h b a 3) Il volume è pari a: Per il calcolo dell’errore applico la formula di propagazione per prodotti/rapporti: V=(5000 ± 2000) cm3

Esercizi Compatibilità: P(t=0.94)=65.28% CL=34.72% Tre biologi, attraverso tre differenti tecniche di misura, calcolano il tasso di riproduzione di una colonia di batteri, cioè misurano il tempo necessario affinché la popolazione della colonia di batteri raddoppia. I tempi registrati sono: biologo 1: tempo = 11.4 ± 0.6 giorni biologo 2: tempo = 11.8 ± 0.2 giorni biologo 3: tempo = 12.2 ± 0.6 giorni Trovare la miglior stima del tempo e la sua incertezza. Determinare la compatibilità tra i valori ottenuti dal biologo 1 e 3. Si tratta semplicemente di applicare le formule della media pesata. xi di 11.4 0.6 2.778 31.67 11.8 0.2 25 295 12.2 33.89 30.556 360.56 Tenendo conto delle cifre significative: Compatibilità: P(t=0.94)=65.28% CL=34.72%

Esercizi Un’analisi condotta si 1000 uomini ha rivelato che le altezze sono distribuite normalmente attorno al valore (1.780 ±0.005) m. Dire quanti uomini ci si attende con: Altezza compresa tra 1.75 e 1.81 m Atezza maggiore di 1.85 m Altezza maggiore di 1.65 m Altezza compresa tra 1.65 e 1.75 m La distribuzione delle altezze è centrata sul valore medio 1.78 m con deviazione standard pari a: i) l’intervallo [1.75-1.81] è simmetrico rispetto al valore medio Per il calcolo della probabilità associata a tale intervallo si ricava dapprima il valore di t e poi si guarda la tabella della gaussiana: Vi è quindi una probabilità di circa il 15% che gli uomini abbiano un’altezza tra 1.75 e 1.78 m. Essendo il campione composto da 1000 individui, ci si aspetta un numero pari a:

Esercizi ii) Atezza maggiore di 1.85 m ii) Il numero di uomini con altezza maggiore di 1.85 m si trova andando a determinare dapprima il valore di t corrispondente a 1.85: Dalla tabella della gaussiana, si trova che P(t=0.44) = 34% e corrisponde all’a probabilità di avere un altezza tra 1.71 e 1.85 m (area blu). Noi siamo interessati però all’area rosa che è pari a: Essendo il campione composto da 1000 individui, ci si aspetta un numero pari a:

Esercizi iii) Atezza maggiore di 1.65 m iii) Il numero di uomini con altezza maggiore di 1.65 m si trova andando a determinare dapprima il valore di t corrispondente a 1.65: Dalla tabella della gaussiana, si trova che P(t=0.82) = 59% circa e corrisponde all’a probabilità di avere un altezza tra 1.65 e 1.91 m (area blu). Noi siamo interessati però alla somma dell’area blu e rosa che è pari a: Essendo il campione composto da 1000 individui, ci si aspetta un numero pari a:

Esercizi iv) Atezza compresa tra 1.65 m e 1.75 m iv) Si ha a che fare con un intervallo non simmetrico (entrambi gli estremi sono a sinistra del valore centrale della distribuzione. Si ricavano i corrispondenti valori di t e le probabilità associate, disegnando le gaussiane.

L’ESPERIENZA DI LABORATORIO Misura della costante di Faraday mediante esperimenti di elettrolisi. Passaggio di corrente attraverso la soluzione: moto degli ioni disciolti in soluzione Deposizione di massa al catodo proporzionale alla carica che è circolata nel circuito costante di Faraday Cella elettrolitica: soluzione elettrolitica+2 elettrodi

L’ESPERIENZA DI LABORATORIO Misurare la carica che circola Misurare la massa depositata Metodo diretto: misura il peso della spira prima e dopo l’elettrolisi Metodo indiretto: misura della variazione concentrazione della soluzione Misura della carica: Mantenendo costante la corrente nel circuito si ha semplicemente:

L’ESPERIENZA DI LABORATORIO Misura della massa depositata: metodo diretto P2: peso della spira dopo l’elettrolisi P1: peso della spira prima dell’elettrolisi d: precisione della bilancia Misura della massa depositata: metodo indiretto C2: concentrazione della soluzione dopo l’elettrolisi C1: concentrazione della soluzione prima dell’elettrolisi La variazione di concentrazione si ottiene dalla variazione di assorbanza, sapendo che:

L’ESPERIENZA DI LABORATORIO Misura della massa depositata: metodo indiretto CALIBRAZIONE DELLO SPETTROFOTOMETRO Metodo dei minimo quadrati

Massa dep. (metodo indiretto) L’ESPERIENZA DI LABORATORIO Alla fine… Elettrolisi carica Massa dep. (metodo diretto) Massa dep. (metodo indiretto) F (metodo indiretto) 1° Q1 ±dQ1 m1 ±dm1 F1 ±dF1 2° Q2 ±dQ2 m2 ±dm2 F2 ±dF2 3* Q3 ±dQ3 m3 ±dm3 F3 ±dF3 4° Q4 ±dQ4 m4 ±dm4 F4 ±dF4 Analisi statistiche:dei vari risultati (medie, medie pesate, test di compatibilità,…)