Disegno del modello di analisi dei dati sperimentali Lezione 2 interpolare un modello ai dati e valutare i relativi parametri.

Slides:



Advertisements
Presentazioni simili
Training On Line - CONP. 2 Richiesta Da Menu: Conferimenti ad inizio anno termico > Agosto > Pluriennali > Nuova Richiesta Si accede alla pagina di Richiesta.
Advertisements

Numeri a 100 Electronic flashcard. 1 uno ritorno.
I numeri, l’ora, I giorni della settimana
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta non guidata di un corpo rettangolare in un serbatoio Velocità e rotazione.
Presente e futuro della religiosità nel nord est DIFFERENZE TRA GENERAZIONI figli e padri italo de sandre 1ids.
Valutazione d’Istituto A.S. 2008/2009
MONITORAGGIO MATEMATICA V A Alunni 26 Presenti 23 Quesiti 44 Risposte totali 650 Risultato medio 28,3 media 64,2%
1 MeDeC - Centro Demoscopico Metropolitano Provincia di Bologna - per Valutazione su alcuni servizi erogati nel.
TAV.1 Foto n.1 Foto n.2 SCALINATA DI ACCESSO ALL’EREMO DI SANTA CATERINA DEL SASSO DALLA CORTE DELLE CASCINE DEL QUIQUIO Foto n.3 Foto n.4.
Lezioni di Astronomia 3- Le stelle Bologna 8 aprile 2010
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
Frontespizio Economia Monetaria Anno Accademico
Uso dell’errore standard di misurazione
1 Innovazione dal punto di vista strategico Francesco Berri Medical Director ASTELLAS PHARMA SpA Bologna 10 Giugno 2011.
Associazione Nazionale Medici Cardiologi Ospedalieri
XXIV Congresso ACOI 2005 Montecatini Terme Maggio 2005
I MATEMATICI E IL MONDO DEL LAVORO
Varianza campionaria Errore standard della varianza campionaria
Campionamento casuale semplice
Programmazione 1 9CFU – TANTE ore
ELEZIONI REGIONALI 2010 PRIMI RISULTATI E SCENARI 14 aprile 2010.
Canale A. Prof.Ciapetti AA2003/04
TIPOLOGIA DELLE VARIABILI SPERIMENTALI: Variabili nominali Variabili quantali Variabili semi-quantitative Variabili quantitative.
Indagine trimestrale sulla industria manifatturiera in provincia di Ravenna - Imprese con oltre 10 addetti - Consuntivo 2004 Ravenna, 7 aprile 2005 Associazione.
Indagine trimestrale sulla industria manifatturiera in provincia di Ravenna - Imprese con oltre 10 addetti - I trimestre 2004 Ravenna, 24 maggio 2004 Associazione.
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
NCI Cancer Mortality Atlas Electronic version of book Dynamic, accessible graphs Interactive maps Downloadable data Cervix uteri cancer mortality, white.
Già primario f.f. U.O. di neurochirurgia
La partita è molto combattuta perché le due squadre tentano di vincere fino all'ultimo minuto. Era l'ultima giornata del campionato e il risultato era.
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Simulazione di un esperimento di laboratorio: Caduta di un corpo quadrato in.
Dopo un anno di trattamento
MP/RU 1 Dicembre 2011 ALLEGATO TECNICO Evoluzioni organizzative: organico a tendere - ricollocazioni - Orari TSC.
COMPLETAMENTI Mil.Tslc All
Progetto di applicazioni grafiche. Disegno di forme complesse Prassi : un classe per ciascuna forma Progetta la forma individuando le componenti base.
Cos’è un problema?.
Gli italiani e il marketing di relazione: promozioni, direct marketing, digital marketing UNA RICERCA QUANTITATIVA SVOLTA DA ASTRA RICERCHE PER ASSOCOMUNICAZIONE.
STILI DI APPRENDIMENTO ED EVOLUZIONE INTERFACCE
Ropol09anci INDAGINE SU PATTO DI STABILITA 2009 IN PIEMONTE ANCI PIEMONTE Torino, 29 giugno 2009.
Monitoraggio a.s. 2008/2009Analisi dei dati RETE REGIONALE AU.MI.
CHARGE PUMP Principio di Funzionamento
Settimana: 3-7 marzo Orariolunedimartedi Mercoledi 5 Giovedi 6 Venerdi lezione intro alla fis mod DR lezione intro alla fis mod DR.
Pregare con i Salmi.
Regolarità nella griglia dei numeri
Esercitazione 1: Rispetto al test di ansia (Media=25; σ=5), calcolare:
Q UESTIONI ETICHE E BIOETICHE DELLA DIFESA DELLA VITA NELL AGIRE SANITARIO 1 Casa di Cura Villa San Giuseppe Ascoli Piceno 12 e 13 dicembre 2011.
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE.
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
ISTITUTO COMPRENSIVO “G. BATTAGLINI” MARTINA FRANCA (TA)
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
Liceo classico/scientifico “V. Imbriani”
RILEVAZIONE DEI LIVELLI DI COMPETENZA MATEMATICA ANNO SCOLASTICO 2007/2008 BY PROCIDA.
GEOGRAFIA DEI NUMERI Accademia dei Lincei - Roma 18 Ottobre2011
Un trucchetto di Moltiplicazione per il calcolo mentale
Bus, mon amour! Autobus e Investimenti
21 marzo 2002 (ri-)Avvisi: Giovedi 28 marzo la lezione e sospesa. Nuovo indirizzo di Spedire messaggi e esercizi solo.
Prima rilevazione sullo stato di attuazione della riforma degli ordinamenti nelle istituzioni scolastiche in LOMBARDIA Attuazione del D.L. 59/2003 a.s.
Settimana: 10 – 14 marzo Orariolunedimartedi Mercoledi 12 Giovedi 13 Venerdi Lezione Dal c al c Lezione Dal c al c
Esempi risolti mediante immagini (e con excel)
DATA ANALYSIS OF 179 BRCA1 OR BRCA2 MUTATED FAMILIES. THE ITALIAN CONSORTIUM FOR HEREDITARY BREAST AND OVARIAN CANCER.
-17 Aspettative economiche – Europa Settembre 2013 Indicatore > +20 Indicatore 0 a +20 Indicatore 0 a -20 Indicatore < -20 Unione Europea Totale: +6 Indicatore.
NO WASTE Progetto continuità scuola primaria scuola secondaria Salorno a.s. 2013_
Un’analisi dei dati del triennio
Mercato del lavoro e condizione giovanile: la crisi si acuisce
1 Acceleratori e Reattori Nucleari Saverio Altieri Dipartimento di Fisica Università degli Studi - Pavia
DIRETTIVI UNITARI SPI-CGI – FNP-CISL - UILP-UIL TERRITORIO LODIGIANO Lunedì 23 marzo 2015 dalle ore 9,00 alle ore 13,00 Presso la sala Conferenze Confartigianato.
1 Ministero dell’Istruzione, dell’Università e della Ricerca Dipartimento per la Programmazione e la Gestione delle risorse umane, finanziarie e strumentali.
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9.
Transcript della presentazione:

Disegno del modello di analisi dei dati sperimentali Lezione 2 interpolare un modello ai dati e valutare i relativi parametri

(-2,16) (-1,7) (0,4)(1,6) (2,10) dove x 1 = x ed x 2 = x 1 2

(-2,16) (-1,7) (0,4)(1,6) (2,10) dove x 1 = x ed x 2 = x 1 2 ε i è il residuo per la i-ma osservazione

Il modello migliore interpolante è un modello che minimizza la somma delle deviazioni quadrate fra il i valori osservati ed i valori predetti dal modello, i.e.

Come fare i calcoli dove x 1 = x ed x 2 = x 1 2 (x,y) = (-2,16) => y = β 0 (1) + β 1 (-2) + β 2 (4) + ε = 16 (x,y) = (-1,7) => y = β 0 (1) + β 1 (-1) + β 2 (1) + ε = 7 (x,y) = (0,4) => y = β 0 (1) + β 1 (0) + β 2 (0) + ε = 4 (x,y) = (1,6) => y = β 0 (1) + β 1 (1) + β 2 (1) + ε = 6 (x,y) = (2,10) => y = β 0 (1) + β 1 (2) + β 2 (4) + ε = 10 x 0 x 1 x 2 y

Matrice X Transposta

Matrice Inversa di XX

(XX) -1 è called il inverse matrix di XX. It è defined as

Matrice di Varianza - Covarianza

stima della varianza residua (s 2 ) Somma degli scarti quadratici gradi di libertà per s 2

Varianza dei parametri stimati Matrice di Varianza - Covarianza:

Covarianza dei parametri stimati Matrice di Varianza - Covarianza

limiti di confidenza per β i

Varianza della retta predetta Assumiamo che si voglia to predire y per un assegnato valore di x Il valore scelto di x è chiamato a Possiamo ora scrivere l'equazione come:

Ex. a = -4 nota! dovrebbe essere -1.3

V(x+y) = V(x) + V(y) + 2Cov(x,y) V(x-y) = V(x) + V(y) – 2Cov(x,y) V(ax) = a 2 V(x) Cov(ax,by) = abCov(x,y) Una via alternativa del calcolo

La varianza di una nuova osservazione di y a = -4 V(y) = ( )0.829 = SE(y) = 3.73 Varianza della retta Varianza di nuova oss

limiti di confidenza 95% limiti di confidenza limiti di confidenza per la retta: a = -4 95% limiti di confidenza per singole osservazioni:

limiti di confidenza al 95%

come fare questo in SAS?

DATA eks21; INPUT x y; CARDS; ; PROC GLM; MODEL y = x x*x/solution ; OUTPUT out= new p= yhat L95M= low_mean U95M = up_mean L95 = low U95 = upper; RUN; PROC PRINT; RUN;

Number di observations in data set = 5 General Linear Models Procedure Dependent Variable: Y Source DF Sum di Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square C.V. Root MSE Y Mean Source DF Type I SS Mean Square F Value Pr > F X X*X Source DF Type III SS Mean Square F Value Pr > F X X*X T per H0: Pr > |T| Std Error of Parameter Estimate Parameter=0 Estimate INTERCEPT X X*X OBS X Y YHAT LOW_MEAN UP_MEAN LOW UPPER s2s2 s

DATA eks21; INPUT x y; CARDS; ; PROC GLM; MODEL y = x x*x/solution ; OUTPUT out= new p= yhat L95M= low_mean U95M = up_mean L95 = low U95 = upper; RUN; PROC PRINT; RUN;

OBS X Y YHAT LOW_MEAN UP_MEAN LOW UPPER

Un problema più complesso Interpola con un modello questi dati

DATA polynom; INPUT x y; CARDS; ; DATA add; SET polynom; x2 = x**2; x3 = x**3; x4 = x**4; PROC REG; MODEL y = x x2 x3 x4; RUN;

il SAS System 08:22 Tuesday, October 29, il REG Procedure Model: MODEL1 Dependent Variable: y Analysis di Varianza Sum di Mean Source DF Squares Square F Value Pr > F Model <.0001 Error Corrected Total Root MSE R-Square Dependent Mean Adj R-Sq Coeff Var Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept x x x x polinomio di quarto ordine

il SAS System 08:22 Tuesday, October 29, Procedure REG Model: MODEL1 Dependent Variable: y Analysis di Varianza Sum di Mean Source DF Squares Square F Value Pr > F Model <.0001 Error Corrected Total Root MSE R-Square Dependent Mean Adj R-Sq Coeff Var Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept x x x polinomio di terzo ordine

The SAS System 08:22 Tuesday, October 29, il REG Procedure Model: MODEL1 Dependent Variable: y Analysis di Varianza Sum di Mean Source DF Squares Square F Value Pr > F Model <.0001 Error Corrected Total Root MSE R-Square Dependent Mean Adj R-Sq Coeff Var Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept x x polinomio di secondo ordine

The SAS System 08:22 Tuesday, October 29, il REG Procedure Model: MODEL1 Dependent Variable: y Analysis di Varianza Sum di Mean Source DF Squares Square F Value Pr > F Model Error Corrected Total Root MSE R-Square Dependent Mean Adj R-Sq Coeff Var Parameter Estimates Parameter Standard Variable DF Estimate Error t Value Pr > |t| Intercept x polinomio di primo ordine (una retta)

True relationship: y = x – 0.02x x 3 + ε ε è normally distributed with 0 mean ed σ = 10 Estimated relationship: y = – 1.415x x 2 s = Estimated relationship: y = x s = This è a better fit than this

Notazioni Matriciali Of particular interest to us è il fact that not even in regression analysis was much use made di matrix algebra. In fact one di us, as a statistics graduate student at Cambridge University in il early 1950s, had lectures on multiple regression that were couched in scalar notation! This absence di matrices ed vectors è surely surprising when one thinks di A.C. Aitken. His two books, Matrices ed Determinants ed Statistical Mathematics were both first published in 1939, had fourth ed fifth editions, respectively, in 1947 ed 1948, ed are still in print. Yet, very surprisingly, il latter makes no use di matrices ed vectors which are so thoroughly dealt with in il former. There were exceptions, di course, as have already been noted, such as Kempthorne (1952) ed his co-workers, e.g. Wilk ed Kempthorne (1955, 1956) – ed others, too. Even with matrix expressions available, arithmetic was a real problem. A regression analysis in il New Zealand Department di Agriculture in il mid-1950s involved 40 regressors. Using electromechanical calculators, two calculators (people) using row echelon methods needed six weeks to invert il 40 x 40 matrix. One person could do a row, then il other checked it (to a maximum capacity di 8 to 10 digits, hoping per 4- or 5-digit accuracy in il final result). That person did il next row ed passed it to il first person per checking; ed so on. This was il impasse: matrix algebra was appropriate ed not really difficult. But il arithmetic stemming therefrom could be a nightmare. (From Linear Models by Shayle R. Searle ed Charles E. McCulloch in Advances in Biometry (eds. Peter Armitage ed Herbert A. David), John Wiley & Sons, 1996)